[vbd-project] Aggiustamenti vari

  • From: Roberto Rosselli Del Turco <rosselli@xxxxxxxxxxxxx>
  • To: VBD Project <vbd-project@xxxxxxxxxxxxx>
  • Date: Tue, 24 Oct 2006 15:52:37 +0200

Ciao a tutti,
come forse alcuni di voi sapranno la versione P5 della TEI Ã
praticamente finita, quindi à il caso di cominciare a pensare a una DTD
(o schema) custom per la trascrizione e, forse, a uno per tutto il
resto. Questo comporterà una serie di aggiustamenti e di soluzioni
custom, riporto qui quelle già concordate:

- espansioni (<e> per parte espansa? vedi esempio di James):
 * usare entities invece del codice XML
 * trovare codice adatto per resa grafica (sia macron, sia corsivo)

- spazi:
 * usare <space/> per lo spazio anomalo (indicando l'extent)
 * usare <orig> e <reg> invece delle entity per spazio assente/di troppo
 * attributo per indicare che si tratta di problemi di spazio:
   type="ms" (missing space) e type="ss" (supplementary space)

- entity:
 * cambiare tutte le vocali accentate con le entity corrispondenti (es.
à diventa &iacute;, à &aacute; etc.)

Resta invece da trovare soluzione ai seguenti problemi:

### Regolarizzazione della punteggiatura ###
Qui la situazione à spinosa come sempre, e anche i pur validi consigli
dei paleografi non aiutano molto; in breve:
 1. continuare a usare <p> come abbiamo fatto finora, cioà riservandolo
agli a capo (rarissimi) e usare un'altra marcatura per distinguere le
suddivisioni interne al paragrafo, o
 2. usare <p> in maniera molto pià "liberale"?
Personalmente propendo per la 1, il problema diverrebbe soltanto di
inserire come <reg> la punteggiatura che si vuole per la versione
diplomatico interpretativa e marcare come <orig> quella del manoscritto;
volendo si possono usare elementi appositi per marcare le frasi, <s> Ã
l'ovvio candidato (contains a sentence-like division of a text).

### Regolarizzazione delle maiuscole ###
Questa potrebbe rendersi necessaria per l'interpretativa, infatti per
ora abbiamo marcato iniziali (miniate e non) e maiuscole pensando solo
al ms, ma nell'interpretativa in teoria potremmo regolarizzare tutte
queste lettere: Ã desiderabile?

### Attributi ###
I valori e gli/degli attributi sono in parte da rivedere, ad esempio:
finora abbiamo sempre usato <del type="xcvxcvx">, ma probabilmente à piÃ
corretto usare l'attributo rend.

Altro che non mi à venuto in mente? Waiting for comments.

Ciao

-- 

Roberto Rosselli Del Turco      roberto.rossellidelturco at unito.it
Dipartimento di Scienze         rosselli at ling.unipi.it
del Linguaggio                  Then spoke the thunder  DA
Universita' di Torino           Datta: what have we given?  (TSE)
 
  Hige sceal the heardra,     heorte the cenre,
  mod sceal the mare,       the ure maegen litlath.  (Maldon 312-3)


Other related posts: