[Linuxtrent] scoperta l'acqua calda: wikisource.

  • From: Marco Ciampa <ciampix@xxxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Wed, 22 Feb 2012 10:08:53 +0100

Volevo esternare qui la mia meraviglia per un progetto che secondo me
merita più attenzione di quanta ne abbia avuta fino ad ora: wikisource.
Forse (sicuramente) qualcuno di voi la conosce già ma è lavorandoci
che si scopre quanto sia favoloso il progetto.

Lo si puo vedere come la versione web 2.0 dei vari progetti Gutemberg
(per la parte inglese) e Manunzio (per quella italiana) e, senza
togliere nulla a questi ultimi, molto di più di questi due messi
assieme.

Ricordate che Google, con molte polemiche (e molte lodi da parte mia per
il coraggio di Google) fece partire e mantiene il progetto google libri?
In pratica Google si è presa l'onere e l'onore di digitalizzare tutti i
libri di cui sono scaduti i diritti d'autore in maniera da renderli
(dato che sono fuori commercio e non ristampati da molto tempo, nessuno
può lamentarsi di un mancato guadagno) disponibili in una sorta di
biblioteca universale su Internet.

Ecco, quelli di wikimedia hanno pensato bene di sfruttare questa enorme
"base" per renderla più "a la' wiki": hanno modificato il software
mediawiki per consentire un inserimento comparato dei testi, in modo che
le persone potessero fare da "OCR umano intelligente".

Se si va su wikisorce si trova che ci sono dei libri in vario stato di
avanzamento. In pratica il software gestisce una sorta di workflow del lavoro:

http://it.wikisource.org/wiki/Aiuto:Stato_di_Avanzamento_del_Lavoro

Se si prova a collaborare si scopre che l'interfaccia è incredibilmente
efficace e semplice: appare una finestra doppia: a sinistra il wiki
modificabile, a destra la scansione del documento in formato djvu. Gran
parte dei documenti su cui si lavora provengono (e non mi stuferò mai
di ringraziare la lungimiranza di Google per questo...) da Google.

Una cosa veramente interessante è che chi inserisce il testo in prima
battuta, che può inizialmente provenire dal sistema di OCR distribuito
di Google (grazie ancora a quest'ultima!) viene bloccato nella penultima
fase (la più importante), la rilettura. Ergo chi inserisce il testo
_non_ può approvarlo ma si necessita della supervisone di un altro paio
di occhi prima di "validare" un documento. 

Questo semplice accorgimento garantisce una qualità del risultato
veramente molto alta senza ridurre la disponibilità delle persone ed il
loro aiuto potenziale.

Ed in ultimo la "chicca" finale: in basso a sinista per ogni testo c'è
la possibilità del sistema di esportare in vari formati:

Stampa/esporta

    Crea un libro
    Scarica come PDF
    Scarica come ePub
    Versione stampabile

tra cui spicca l'epub! Si può generare al volo un libro elettronico dal
testo con un semplice clic...semplicemente fantastico!
Con il mio Kindle (+Calibre) ci vado a nozze!

I risultati di questo magnifico strumento parlano da soli, dalla prima pagina:

58417 testi pubblicati
^^^^^^

Si ci vedete bene: 58417 testi pubblicati, in particolare nella pagina
delle statistiche della wikisource italiana (estratto):

Statistiche relative alle pagine
Pagine di contenuti58 428
Pagine (Tutte le pagine del sito, comprese le pagine di discussione, i 
redirect, ecc.) 234 308
File caricati1 480
Statistiche relative alle modifiche
Modifiche a partire dall'installazione di Wikisource 2061692
Media delle modifiche per pagina 8,80
Statistiche relative agli utenti
Utenti registrati11 729
Utenti attivi (Elenco dei membri)
(Utenti che hanno effettuato un'azione negli ultimi 30 giorni) 100

Impressionante!

PS: Io ho appena riletto, nel tempo libero nell'arco di un mesetto, questo:

http://it.wikisource.org/wiki/Trento,_sue_vicinanze,_industria,_commercio_e_costumi_de%27_Trentini

Buona lettura!

-- 


Marco Ciampa

+--------------------+
| Linux User  #78271 |
| FSFE fellow   #364 |
+--------------------+
-- 
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: