[vbd-project] Caratteri e trascrizione

  • From: Roberto Rosselli Del Turco <rosselli@xxxxxxxxxxxxx>
  • To: VBD Project <vbd-project@xxxxxxxxxxxxx>
  • Date: Wed, 16 Mar 2005 14:46:11 +0100

Ciao a tutti,
in particolare ai codificatori :) Ho cominciato a riflettere in maniera
pià dettagliata su quello che finora era solo un piano di massima, ecco
le mie riflessioni su livelli di trascrizione e codifica dei caratteri.
Comments welcome, verrrry welcome (non so se mi spiego :)

NB: ho anche cominciato a proporre soluzioni per le prime lettere,
ditemi se questo schema à chiaro.

-----------------------------------------------------------------

#### Livelli di trascrizione ####

La trascrizione di un manoscritto medievale puà essere effettuata a vari
livelli, come illustrato dagli autori del Digital Scriptorium [...], in
base alla quantità di informazioni che si intendono inserire nella
codifica. Una trascrizione, pertanto, Ã detta filologica se conserva le
informazioni relative agli errori, aggiunte, correzioni scribali, etc.

Un criterio parallelo e supplementare à quello che riguarda la
"fedeltÃ" (ma il concetto qui in parte à anche correlato a quello di
"resa grafica") della trascrizione rispetto all'originale: rientriamo,
evidentemente, nell'ambito della distinzione fra edizione diplomatica ed
edizione semi-diplomatica (o interpretativa), ma à possibile aggiungere
un ulteriore livello, quello del facsimile testuale, per usi speciali.

* facsimile: una trascrizione che cerca di essere una replica fedele
dell'originale, riproducendo le lettere del ms per mezzo di un set di
caratteri dedicati (ad esempio il font oe.ttf di Peter Baker), come pure
eventuali spazi anomali, variazioni nelle dimensioni dei caratteri,
divisioni delle parole, errori, etc. Allo stesso tempo viene omessa ogni
correzione editoriale, apparato critico o nota, l'unico obiettivo Ã
fornire un equivalente testuale dell'immagine del manoscritto.

Questo tipo di trascrizione puà essere utile come testo "fluttuante",
ricorrendo al mouse hovering, al di sopra delle immagini del
manoscritto. In questo modo, chi à interessato a un esame diretto delle
immagini digitali del ms potrà avvalersi di una trascrizione molto
vicina all'originale, richiamabile a piacere, senza essere obbligato a
sprecare spazio su schermo per visualizzare l'edizione diplomatica.

Ambito d'uso: IMAGE

* edizione diplomatica: riproduce il testo mantenendo le caratteristiche
grafiche del manoscritto (divisione in fogli recto/verso, delle righe e
delle parole, spaziatura, segni di interpunzione originali, etc.) e
quelle testuali (abbreviazioni, errori, duplicazioni di parole e frasi,
correzioni, marginalia, etc.). Le correzioni ed emendamenti editoriali
sono eventualmente proponibili in nota o nell'apparato critico.

Questa trascrizione à particolarmente utile nel confronto con le
immagini digitali del manoscritto, permettendo una facile comprensione
del testo con maggior agio rispetto al testo fluttuante del facsimile
testuale.

Ambito d'uso: IMAGE+TEXT

* edizione diplomatica interpretativa (o semi-diplomatica): riproduce il
testo mantenendo in parte le caratteristiche grafiche del manoscritto
(divisione in fogli recto/verso, delle righe) ma introduce importanti
modifiche sul piano testuale: il curatore corregge gli errori dello
scriba, scioglie le abbreviazioni, divide correttamente le parole,
regolarizza i nomi propri, introduce una punteggiatura pià moderna, etc.
L'apparato critico riporta le lezioni originali, compito che puà (in
parte) essere svolto anche da note fluttuanti.

Questo tipo di edizione, nel caso di un testo unico, si avvicina molto a
un'edizione critica vera e propria, soprattutto nel caso vengano
riportati nell'apparato gli emendamenti eventualmente proposti da altri
curatori. Oltre a un esteso apparato critico e a note interpretative, Ã
opportuno inserire collegamenti a testi paralleli (sources, analogues),
a edizioni critiche inclusen nel progetto, alla bibliografia ed
eventualmente ad altri testi accessori.

Ambito d'uso: IMAGE+TEXT, TEXT, TEXT+TEXT


#### Codifica caratteri ####

1. Letter forms

Per prima cosa à necessario distingure fra diverse tipologie nell'uso
dei caratteri da parte dello scriba che ha redatto il Vercelli Book:

* lettere con un'unica forma: permettono la codifica con l'uso di un
unico carattere, nessuna differenza fra i diversi livelli di edizione.

        VB o            =>              FS o    ED o    ES o

[VB = Vercelli Book, FS = facsimile testuale, ED = edizione diplomatica,
ES = edizione semi-diplomatica]

* lettere con un'unica forma ma due codifiche possibili: si tratta di
lettere che non corrispondono precisamente, o affatto (nel caso delle
rune), all'alfabeto latino in uso oggi, e pertanto possono essere rese
con due caratteri diversi a seconda del livello di edizione.

        VB Æ           =>              FS Æ           ED Æ           S

* lettere con pià forme regolari: à indispensabile prendere in
considerazione codifiche diverse, ma il loro uso potrebbe essere
limitato al livello Facsimile. Attenzione: le forme devono essere ben
definite e regolari (non necessariamente nell'uso).

        VB s            =>              FS s    ED s    ES s
        VB Å           =>              FS Å   ED s    ES s
        VB ï          =>              FS ï  ED s    ES s

* lettere con pià forme alcune delle quali "irregolari": l'irregolaritÃ
puà risiedere nella forma effettiva delle varianti, come pure nel fatto
che tali varianti dovrebbero presentarsi in determinati contesti ma
questo in realtà non avviene; le forme/varianti irregolari probabilmente
non devono comparire nell'edizione del VB (se non forse in quella
Facsimile), ma potrebbe essere utile codificarle in modo da poterle
rintracciare facilmente.
Prendiamo ad esempio la e "alta" usata dallo scriba del VB. Questa
lettera presenta una grande variabilità riguardo le dimensioni, e
dovrebbe essere utilizzata nel caso di legature (ad es. per il dittongo
ea), ma lo scriba non segue questo principio con costanza pertanto la
distribuzione risulta disomogenea.

        VB e            =>              FS e    ED e    ES e
        VB etall        =>              FS ?    ED e    ES e

* lettere alterate in maniera del tutto estemporanea ed irregolare: per
correggere un errore, per fini estetici, come variante "artistica", etc.
Da marcare per eventuali note, in alcuni casi à consigliabile usare
un'immagine della lettera in questione.

        VB              =>              FS      ED      ES 


2. Metodi di codifica

Il metodo pià semplice à quello che vede l'utilizzo di entity: in questo
modo la codifica puà procedere speditamente, rimandando a un secondo
momento la decisione riguardo la resa grafica.
Per tener traccia (a fini statistici, per ricerche, etc.) delle singole
occorrenze di particolari caratteri si puà utilizzare l'elemento <c>
come valore delle entity: ad es. la "s lunga" puà essere codificata come
<c>&#383;</c> o, usando direttamente il carattere Unicode, come
<c>Å</c>.
In alternativa, per evitare l'uso di entity possono essere utilizzati
degli elementi custom che non sarebbero altro che syntactic sugar per
l'uso dell'elemento <c> applicato ai singoli caratteri da codificare: ad
esempio <longs/> per <c>Å</c>.


3. Codifica delle singole lettere

---------  a  ---------

Codifica:

        VB a    -->     a
        VB oc   -->     &oc;

Visualizzazione:

        VB a            =>              FS a    ED a    ES a
        VB oc           =>              FS ?    ED a    ES a

Caratteristiche non registrate:

* variabilità lato sinistro, rotondo o talvolta dritto (regolarmente
dritto dopo "e" per legatura)
* solo per "oc": tratto superiore destro a volte elevato (3r11 wat)


---------  Ã  ---------

Codifica:

        VB Ã   -->     Ã
        VB Ç   -->     Ç

Visualizzazione:

        VB Ã           =>              FS Ã   ED Ã   ES Ã 
        VB Ç           =>              FS Ç   ED Ç   ES ?

Caratteristiche non registrate:
* variabilità lato a rotondo/dritto
* variabilità lato a "occasionally horned" (21v11 nÃfre)

Ciao

-- 
 
Roberto Rosselli Del Turco      roberto.rossellidelturco at unito.it
Dipartimento di Scienze         rosselli at ling.unipi.it
del Linguaggio                  Then spoke the thunder  DA
Universita' di Torino           Datta: what have we given?  (TSE)
 
  Hige sceal the heardra,     heorte the cenre,
  mod sceal the mare,       the ure maegen litlath.  (Maldon 312-3)



Other related posts:

  • » [vbd-project] Caratteri e trascrizione