[hu-nvda] RE: [hu-nvda] Re: Speciális kivételek az Espak-ban

  • From: "Dr. Simon Gergely" <dr.simon.gergely@xxxxxxxxx>
  • To: <hu-nvda@xxxxxxxxxxxxx>
  • Date: Wed, 27 Oct 2010 01:27:22 +0200

Sziasztok!
Robi, igazad van abban, hogy a kivételszótár jobb megoldás lenne. Azt könnyebb szerkeszteni. Viszont a kivételszótárnál én három adatcsoportot (kvázi oszlopot) különítenék el. 1. nyelvi kód (pl. domainnevekkel vagy más hasonló utalással), 2. helyettesítendő szó, 3. helyettesítő szó.
Pl. Hu Kossuth KosútEn IBM (a harmadik mező üres),, stb.
Meg kellene viszont vizsgálni, hogy ez minden esetben működik-e. A magyar nyelvnek az a sajátossága, hogy többnyire érvényesül az "úgy írd, ahogy ejted" elve. Ugyanakkor a szóelemtükröztető helyesírásnál már be kell építeni a különféle ejtési szabályokat: látja (ejtve: láttya), kertje stb., állj, csinálja, anyja, stb. Figyelni kel kiejtési szabályokra például a hasonulásoknál: színpad (mp, a képzés helye szerinti részleges hasonulás), dobszó (psz, zöngétlenné válás, részleges hasonulás), csapda (zöngéssé válás, részleges hasonulás), öngyújtó (már-már ny-nek ejtjük azt az n-t), igaz, fordítva annyira nem illik (például nem mondjuk, hogy "önkormánzat", pedig beleférne, sokan mondják. Ezek olyan szabályszerűségek, amelyek hellyel-közzel megoldhatók, de már gondolkodni kell, hogy mikor alkalmazhatók, és egyáltalán, hogyan lehet őket programozás szempontjából meghatározni.

Úgy látom, az espeak elég jól követi ezeket a szabályszerűségeket.
Mégis: ezeket azért hoztam fel, mert a különböző nyelvekben nagyon is különböző az írott és ejtett szöveg viszonya.

A magyar talán viszonylag egyszerű, mert logikus, és általában nincs gond azzal, hogy amit olvasunk, azt hogyan kel kiolvasni és azzal sem, hogy amit leírunk, azt hogyan fordítsuk írásba a hallott szöveg alapján.

Más esetekben már nem egyérelmű. Pl. az ly j-nek hangzik, de az írással már gond van. Kiolvasni mindig ki tudjuk helyesen, leírni viszont csak akor ha ismerjük azokat a szavakat és szabályokat, amelyek alapján eldöntjük, mikor kell használnunk.

Mind erre azért tértem ki, mert rengetegféle nyelv van és így nagyon árnyaltan kel meghatározni az egyes nyelvekhez való szabályrendszert. Éppen ezért egy ilyen kivételszótárat is úgy kel megtervezni, hogy az minden nyelvre, nyelvtípusra, az összes olyan nyelvre, nyelvcsaládra alkalmazható legyen, amelyet beépítettek az espeakbe.

ez egyáltalán nem egyszerű feladat nyelvi szempontból. Van erre valami értelmes megoldás? És meddig terjed a kivételszótár és honnan indulnak a beszédszintetizátor belső szabályai?

S.geri

"Tudtuk, hogy az ember esendő, S nagyon adós a szeretettel." (Ady)
------
Ha akar kuldeni egy uzenetet erre a listara, akkor irjon a
hu-nvda@xxxxxxxxxxxxx
cimre.

ha leakar jelentkezni erröl a listarol, akkor irjon a
hu-nvda-request@xxxxxxxxxxxxx
cimre, a "unsubscribe" szóval a targyban.

Tekintse meg a lista honlapját a http://www.freelists.org/webpage/hu-nvda
webhelyen.
A NVDA magyar forditas honlapja a
www.eurpod.com/nvda.html
oldalon talalhato. Itt tobb informaciot tud kapni a szoftverrol és letudja 
tolteni a legujabb verziot.
------

Other related posts: