[zxspectrum] Re: ZX ItaSpeak 1.2

  • From: Luca Alimandi <luca.alimandi62@xxxxxxxxxxx>
  • To: zxspectrum@xxxxxxxxxxxxx
  • Date: Sat, 12 Nov 2016 12:59:37 +0100

Il 12/11/2016 11:58, Enrico Maria Giordano ha scritto:

Sicuramente è un piccolo miracolo, l'ho già detto.

S', in effetti l'avevi detto... Grazie!

Quello che mi dà fastidio sono quegli scoppiettii che forse sono solo un problema di registrazione dei fonemi, e quindi facilmente sistemabili. Non è che quando l'hai registrati usavi le cuffiette? Se è così, allora probabilmente il microfono "scoppiettava" (con le P, T, C, etc.) e tu non te ne sei accorto. Che microfono hai usato? Era di buona qualità?

EMG


Non mi ricordo bene...
La prima versione (quella che feci oltre venti anni fa!) la registrai dalla mia voce, credo, o dal parlato di uno speaker che avevo registrato alla radio, o qualcosa del genere... Ma è roba vecchia!

La registrazione diretta secondo me da risultati di scarsissima qualità; meglio partire come minimo da registrazioni professionali, o meglio ancora da file con fonemi o difoni già selezionati, ed è quello che ho fatto. Anche se ho dovuto comunque lavorarci un sacco, ma almeno la qualità è molto più alta!
Nella versione che ho realizzato in questi ultimi anni ho ricreato ex novo i fonemi estraendoli e riadattandoli da una sintesi vocale di qualche anno fa.

Col senno di poi, vorrei provare a ripetere il processo perché ho notato che i fonemi attuali presentano un volume un po' basso, dovuto al fatto che stranamente la parte "positiva" dell'onda risulta più amplificata della parte "negativa".
Non so se questo sia un effetto voluto (una sorta di compressione...) o un difetto di importazione; di fatto non ho alcuna documentazione su questi file di difoni, per cui ho individuato completamente "a mano" i valori da usare per l'importazione, ossia la frequenza di campionamento, il numero di bit, il formato dei dati, ecc...
Anche se credo di averli azzeccati abbastanza (penso che anche un solo parametro sbagliato avrebbe dato risultati completamente sballati).

Comunque, spinto dalle tue osservazioni, sto provando a ripetere l'estrazione, dopo una "normalizzazione" del file di partenza, per lo meno spero di poter ottenere dei fonemi con un volume un po' più alto!
Eventualmente ti fornirò questo file per fare degli esperimenti in autonomia!

--

|_ /-\


Other related posts: