[zxspectrum] Re: ZX ItaSpeak 1.2
- From: Luca Alimandi <luca.alimandi62@xxxxxxxxxxx>
- To: zxspectrum@xxxxxxxxxxxxx
- Date: Sat, 12 Nov 2016 12:59:37 +0100
Il 12/11/2016 11:58, Enrico Maria Giordano ha scritto:
Sicuramente è un piccolo miracolo, l'ho già detto.
S', in effetti l'avevi detto... Grazie!
Quello che mi dà fastidio sono quegli scoppiettii che forse sono solo
un problema di registrazione dei fonemi, e quindi facilmente
sistemabili. Non è che quando l'hai registrati usavi le cuffiette? Se
è così, allora probabilmente il microfono "scoppiettava" (con le P, T,
C, etc.) e tu non te ne sei accorto. Che microfono hai usato? Era di
buona qualità?
EMG
Non mi ricordo bene...
La prima versione (quella che feci oltre venti anni fa!) la registrai
dalla mia voce, credo, o dal parlato di uno speaker che avevo registrato
alla radio, o qualcosa del genere... Ma è roba vecchia!
La registrazione diretta secondo me da risultati di scarsissima qualità;
meglio partire come minimo da registrazioni professionali, o meglio
ancora da file con fonemi o difoni già selezionati, ed è quello che ho
fatto. Anche se ho dovuto comunque lavorarci un sacco, ma almeno la
qualità è molto più alta!
Nella versione che ho realizzato in questi ultimi anni ho ricreato ex
novo i fonemi estraendoli e riadattandoli da una sintesi vocale di
qualche anno fa.
Col senno di poi, vorrei provare a ripetere il processo perché ho notato
che i fonemi attuali presentano un volume un po' basso, dovuto al fatto
che stranamente la parte "positiva" dell'onda risulta più amplificata
della parte "negativa".
Non so se questo sia un effetto voluto (una sorta di compressione...) o
un difetto di importazione; di fatto non ho alcuna documentazione su
questi file di difoni, per cui ho individuato completamente "a mano" i
valori da usare per l'importazione, ossia la frequenza di campionamento,
il numero di bit, il formato dei dati, ecc...
Anche se credo di averli azzeccati abbastanza (penso che anche un solo
parametro sbagliato avrebbe dato risultati completamente sballati).
Comunque, spinto dalle tue osservazioni, sto provando a ripetere
l'estrazione, dopo una "normalizzazione" del file di partenza, per lo
meno spero di poter ottenere dei fonemi con un volume un po' più alto!
Eventualmente ti fornirò questo file per fare degli esperimenti in
autonomia!
--
|_ /-\
Other related posts: