[isf-ge] News [1] - Excel compromette la ricerca genetica

Microsoft Excel compromette la ricerca genetica scambiando fischi per fiaschi

Fonte: Programmazione.It - http://www.programmazione.it/index.php?entity=enews&idNews=9751&idArea=1 - 19 luglio 2004

Nell'ambito della ricerca genetica e biomolecolare Excel viene largamente utilizzato, soprattutto per processare i dati gestiti mediante la tecnologia
DNA Microarray, la quale consente di monitorare un intero genoma su un singolo chip.
Putroppo, secondo un documento stilato da numerosi ricercatori americani e pubblicato sul sito del Centro di Ricerche Biomediche di Londra
(BioMed Central), sembra che alcune funzioni di conversione automatiche di Excel abbiano alterato irrimediabilmente i nomi di parecchi geni.
Il problema è molto esteso ed ha colpito diversi database pubblici, inclusi i dati di alcuni geni contenuti nel db del National Centre for Biotechnology Information (NCBI) sito in USA.
Gli errori sui dati vengono introdotti perché alcuni identificatori genetici assomigliano molto a delle date, così può accadere che Excel converta l'identificatore "SEPT2" nel formato data "2-Sep".
Secondo i ricercatori almeno 30 nomi di geni sarebbero stati alterati a causa di questa conversione, alcuni dei quali molto importanti dal punto di vista medico, come ad esempio il tumor soppressor DEC1 (Deleted in Esophageal Cancer 1) che è stato convertito in "1-Dec".


Almeno altri 2000 nomi invece sono stati alterati a causa di conversioni in formato floating-point: gli identificatori RIKEN (dall'omonimo Centro di Ricerche di Yokohama, il RIKEN Genomic Science Centre), sono infatti composti da una sequenza alfanumerica piuttosto lunga (che ha naturalmente un preciso significato), la quale viene convertita da Excel in un numero floating-point. Ad esempio l'identificatore RIKEN "2310009E13" è stato convertito irrimediabilmente in "2.31E+13".

I nomi originali dei geni non potranno più essere recuperati, sostengono i ricercatori. Con un piccolo numero di geni sarebbe infatti possibile correggere manualmente gli errori, ma sui microarray (che contengono un'enorme quantità di dati) l'azione manuale è assolutamente impraticabile.

________________________________________
Ingegneria Senza Frontiere - Genova

c/o Dottorandi/DIAm
Via Montallegro 1   16145 Genova
tel:  010-3532479
http://www.diam.unige.it/isf
isf@xxxxxxxxxxxxx
________________________________________

Unsubscribe:
mailto:ISF-ge-request@xxxxxxxxxxxxx?subject=unsubscribe

Other related posts: