[isf-ge] News [1] - Excel compromette la ricerca genetica
- From: Tommaso Gamaleri <tommygam@xxxxxxxxxxxx>
- To: Ingegneria Senza Frontiere Ge <isf-ge@xxxxxxxxxxxxx>
- Date: Wed, 21 Jul 2004 12:23:41 +0200
Microsoft Excel compromette la ricerca genetica scambiando fischi per
fiaschi
Fonte: Programmazione.It -
http://www.programmazione.it/index.php?entity=enews&idNews=9751&idArea=1
- 19 luglio 2004
Nell'ambito della ricerca genetica e biomolecolare Excel viene
largamente utilizzato, soprattutto per processare i dati gestiti
mediante la tecnologia
DNA Microarray, la quale consente di monitorare un intero genoma su un
singolo chip.
Putroppo, secondo un documento stilato da numerosi ricercatori americani
e pubblicato sul sito del Centro di Ricerche Biomediche di Londra
(BioMed Central), sembra che alcune funzioni di conversione automatiche
di Excel abbiano alterato irrimediabilmente i nomi di parecchi geni.
Il problema è molto esteso ed ha colpito diversi database pubblici,
inclusi i dati di alcuni geni contenuti nel db del National Centre for
Biotechnology Information (NCBI) sito in USA.
Gli errori sui dati vengono introdotti perché alcuni identificatori
genetici assomigliano molto a delle date, così può accadere che Excel
converta l'identificatore "SEPT2" nel formato data "2-Sep".
Secondo i ricercatori almeno 30 nomi di geni sarebbero stati alterati a
causa di questa conversione, alcuni dei quali molto importanti dal punto
di vista medico, come ad esempio il tumor soppressor DEC1 (Deleted in
Esophageal Cancer 1) che è stato convertito in "1-Dec".
Almeno altri 2000 nomi invece sono stati alterati a causa di conversioni
in formato floating-point: gli identificatori RIKEN (dall'omonimo Centro
di Ricerche di Yokohama, il RIKEN Genomic Science Centre), sono infatti
composti da una sequenza alfanumerica piuttosto lunga (che ha
naturalmente un preciso significato), la quale viene convertita da Excel
in un numero floating-point. Ad esempio l'identificatore RIKEN
"2310009E13" è stato convertito irrimediabilmente in "2.31E+13".
I nomi originali dei geni non potranno più essere recuperati, sostengono
i ricercatori. Con un piccolo numero di geni sarebbe infatti possibile
correggere manualmente gli errori, ma sui microarray (che contengono
un'enorme quantità di dati) l'azione manuale è assolutamente impraticabile.
________________________________________
Ingegneria Senza Frontiere - Genova
c/o Dottorandi/DIAm
Via Montallegro 1 16145 Genova
tel: 010-3532479
http://www.diam.unige.it/isf
isf@xxxxxxxxxxxxx
________________________________________
Unsubscribe:
mailto:ISF-ge-request@xxxxxxxxxxxxx?subject=unsubscribe
Other related posts:
- » [isf-ge] News [1] - Excel compromette la ricerca genetica