CyberCultura

Microsoft Excel compromette la ricerca genetica scambiando fischi per fiaschi

19 luglio 2004
Programmazione.It

Nell'ambito della ricerca genetica e biomolecolare Excel viene largamente utilizzato, soprattutto per processare i dati gestiti mediante la tecnologia
DNA Microarray, la quale consente di monitorare un intero genoma su un singolo chip.

Putroppo, secondo un documento stilato da numerosi ricercatori americani e pubblicato sul sito del Centro di Ricerche Biomediche di Londra
(BioMed Central), sembra che alcune funzioni di conversione automatiche di Excel abbiano alterato irrimediabilmente i nomi di parecchi geni.

Il problema è molto esteso ed ha colpito diversi database pubblici, inclusi i dati di alcuni geni contenuti nel db del National Centre for Biotechnology
Information (NCBI) sito in USA.

Gli errori sui dati vengono introdotti perché alcuni identificatori genetici assomigliano molto a delle date, così può accadere che Excel converta l'identificatore "SEPT2" nel formato data "2-Sep".
Secondo i ricercatori almeno 30 nomi di geni sarebbero stati alterati a causa di questa conversione, alcuni dei quali molto importanti dal punto di vista medico, come ad esempio il tumor soppressor DEC1 (Deleted in Esophageal Cancer 1) che è stato convertito in "1-Dec".

Almeno altri 2000 nomi invece sono stati alterati a causa di conversioni in formato floating-point: gli identificatori RIKEN (dall'omonimo Centro di Ricerche di Yokohama, il RIKEN Genomic Science Centre), sono infatti composti da una sequenza alfanumerica piuttosto lunga (che ha naturalmente un preciso significato), la quale viene convertita da Excel in un numero floating-point. Ad esempio l'identificatore RIKEN "2310009E13" è stato convertito irrimediabilmente in "2.31E+13".

I nomi originali dei geni non potranno più essere recuperati, sostengono i ricercatori. Con un piccolo numero di geni sarebbe infatti possibile correggere manualmente gli errori, ma sui microarray (che contengono un'enorme quantità di dati) l'azione manuale è assolutamente impraticabile.

Articoli correlati

PeaceLink C.P. 2009 - 74100 Taranto (Italy) - CCP 13403746 - Sito realizzato con PhPeace 2.6.20 - Informativa sulla Privacy - Informativa sui cookies - Diritto di replica - Posta elettronica certificata (PEC)