[Linuxtrent] microsoft e bioinformatica :-))

  • From: franz <francesco@xxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Mon, 14 Feb 2005 12:00:57 +0100

Articolo preso da 
http://italy.peacelink.org/cybercultura/articles/art_6137.html
E' una notizia un po' vecchia, ma non so se era passata sulla lista, ora poi 
assume nuovi significati grotteschi alla luce dell'accordo di Microsoft con 
la provincia.
------------------------------------------------------------------------------------------------------------------------
Microsoft Excel compromette la ricerca genetica scambiando fischi per fiaschi

Nell'ambito della ricerca genetica e biomolecolare Excel viene largamente 
utilizzato, soprattutto per processare i dati gestiti mediante la tecnologia
DNA Microarray, la quale consente di monitorare un intero genoma su un singolo 
chip.

Putroppo, secondo un documento stilato da numerosi ricercatori americani e 
pubblicato sul sito del Centro di Ricerche Biomediche di Londra
(BioMed Central), sembra che alcune funzioni di conversione automatiche di 
Excel abbiano alterato irrimediabilmente i nomi di parecchi geni.

Il problema è molto esteso ed ha colpito diversi database pubblici, inclusi i 
dati di alcuni geni contenuti nel db del National Centre for Biotechnology
Information (NCBI) sito in USA.

Gli errori sui dati vengono introdotti perché alcuni identificatori genetici 
assomigliano molto a delle date, così può accadere che Excel converta 
l'identificatore "SEPT2" nel formato data "2-Sep".
Secondo i ricercatori almeno 30 nomi di geni sarebbero stati alterati a causa 
di questa conversione, alcuni dei quali molto importanti dal punto di vista 
medico, come ad esempio il tumor soppressor DEC1 (Deleted in Esophageal 
Cancer 1) che è stato convertito in "1-Dec".

Almeno altri 2000 nomi invece sono stati alterati a causa di conversioni in 
formato floating-point: gli identificatori RIKEN (dall'omonimo Centro di 
Ricerche di Yokohama, il RIKEN Genomic Science Centre), sono infatti composti 
da una sequenza alfanumerica piuttosto lunga (che ha naturalmente un preciso 
significato), la quale viene convertita da Excel in un numero floating-point. 
Ad esempio l'identificatore RIKEN "2310009E13" è stato convertito 
irrimediabilmente in "2.31E+13".

I nomi originali dei geni non potranno più essere recuperati, sostengono i 
ricercatori. Con un piccolo numero di geni sarebbe infatti possibile 
correggere manualmente gli errori, ma sui microarray (che contengono 
un'enorme quantità di dati) l'azione manuale è assolutamente impraticabile.
----------------------------------------------------------------------------------------------------------------------------

A questo punto mi sorgono alcune considerazioni.
1) Come mai dei ricercatori si mettono in mente di usare su così larga scala 
un software di questo tipo (non specialistico e noto per fare le cose di 
testa sua) senza testarlo accuratamente
2) Quando Microsoft imaprearà a fare software che fanno quello che vuole 
l'utente e non quello che Biil Gates suppone che l'utente potrebbe magari 
volere?
3) Nel famoso centro di bioinformatica sputtaneranno tutti i risultati perché 
salverano tutto in formati word, excel ecc. ecc.?
4) 5) 6) ecc. ecc. le altre considerazioni fatele voi
Ciao
Francesco Lunelli
--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: