Tekst ja kõne
 
M.Mihkla

Eesti Keele Instituut

Keelel on kaks põhilist avaldumisvormi: suuline kõne ja kirjalik tekst, keel avaldub kas kõnes või kirjas. Meie tänapäeva ühiskond on suhteliselt tekstikeskne: kirjasõna usutakse enam kui kõneldut, kirjalikest lepingutest peetakse rohkem kinni kui suulistest kokkulepetest, eestlane eelistab lugeda subtiitreid filmide alt ja televiisoriekraanilt, dubleeritud filmidele, jne. Lähiaastad ilmselt muudavad tendentse ja harjumusi selles vallas ja seda suulise kõne kasuks. Eelduseks sellele oletusele on tormiline areng kõnetehnoloogia vallas, see on teadusvaldkond, mis püüab teisendada ilma inimese osaluseta teksti kõneks ja kõnet tekstiks, mis on vastavalt kõnesüntees ja kõnetuvastus.

“Eesti keele tekst-kõne süntees” on Eesti Keele Instituudi, Küberneetika Instituudi ja OÜ Filosofti ühisprojekt, mis käivitus kolm aastat tagasi. Projekti eesmärgiks on teisendada eesti keelne ortograafiline tekst ortoeepiliseks loomuliku kõlaga kõneks. Et tekstist saaks kõne, eeldab vähemalt nelja ülesande lahendamist:

     -  teksti lingvistiline töötlus,

     -  kõne proosoodia modelleerimine;

     -  kõneüksuste andmebaasi loomine;

     -  signaalitöötlus.

Lingvistilise töötlus sisaldab teksti foneetilist transkriptsiooni, mis tähendab teksti teisendamist hääldustekstiks. Ehkki eestikeelne kirjalik tekst tundub eestlasele kergesti hääldatav, valmistab hääldus nii mitteeestlasele kui ka süntesaatorile raskusi, kuna eesti keele ortograafia ei ole foneetiline. Kirjas ei ole 2. ja 3. välde üldjuhul eristatavad, samuti on eristamata palataliseeritud konsonandid palataliseerimata konsonantidest. Lisaks on eesti keeles pika üü diftongeerumine lühikese vokaali ees, lühike i vokaalide keskel muutub ij, gbd sõna alguses kpt-ks häälduses ja palju muud.

Kesksel kohal tekst-kõne süsteemis on kõneüksuste andmebaas. Meie kasutame oma kompilatiivsel sünteesil kõne akustiliste üksustena difoone. Difoonid on kahest järjestikusest häälikust koosnevad segmendid. Difoon algab mingi hääliku stabiilse osa keskel ja lõpeb järgmise hääliku stabiilses osas. Põhihuviks difoonide kasutamisel sünteesis on see, et nad sisaldavad loomulikke üleminekuid häälikult häälikule. Difoonid nõuavad mõõdukalt ka vähe mälu, sest nende arv on suhteliselt väike võrreldes teiste võimalike sünteesiüksustega nagu sõnad, silbid või poolsilbid. Eesti keele difoonide andmebaas sisaldab 1720 difooni. Võrdlusena saksa keele difoonide andmebaasis on 1800 difooni, prantsuse keele omas 1200 ja hispaania keele omas ainult 800 difooni.

Signaali töötluseks kasutame MBROLA süntesaatorit. Süntesaator võimaldab omavahel sujuvalt ilma moonutusteta ühendada omavahel difoonidele vastavaid kõnesignaale väljundkõneks. Samuti on võimalus teatud piirides muuta häälikute kestusi ja põhitooni.  MBROLA sünteesiprojekti, mis algatati Mons’i Ülikoolis Belgias, eesmärgiks oli aidata kaasa suurele hulgale erinevates keeltes kõnesüntesaatorite tekkele, mis oleksid vabalt kasutatavad mittekommertslikul eesmärgil.

Erinevalt noodikirjast, pole tavalises tekstis peale kirjavahemärkide ühtegi kõne tempot, häälekõrgust, intonatsiooni või rõhku tähistavat märki. Seega iga inimene võib oma kõnes mõttelist või kirjalikku teksti vabalt interpreteerida. Masin või arvuti teksti vabalt interpreteerida ei suuda, see eeldaks teksti sisulist mõistmist. See kirjaliku teksti puudus võib olla ka üheks põhjuseks, miks süntesaatorid ja sämplerid on muusikavallas väga levinud, kõnesüntesaator igaäeva elus aga mitte. Järelikult eeldab kõnesüntees kõne prosoodilise struktuuri modelleerimist. Sõna tasandil on prosoodiat küllalt palju uuritud, lause prosoodiat vähem. Meie sünteesil on suhteliselt rahuldavalt realiseeritud jutustava lause, küsisõnaga küsimuse ja loetelut sisaldava lause prosoodiamudelid. Probleeme tekib lause fraasi määramine ja küsi- ja hüüdlausete puhul lause fookuse leidmine. Kõik see eeldaks lause süntaktilist ja ka teksti semantilist analüüsi, meie süsteemis on praegu vaid morfoloogiline analüüs.

Eesti keele tekst-kõne sünteesi süsteem on väljas Eesti Keele Instituudi koduleheküljel www.eki.ee/keeletehnoloogia/projektid/syntees/ vabaks kasutamiseks kõigile huvilistele.

 

tagasi | avalehele

© 2001 Vabariigi Presidendi Kantselei
Telefon: 631 6202 | Faks: 631 6250 | sekretar@vpk.ee
Akademischer Rat Academic Council Akadeemiline nõukogu Ümarlaud Kultuurirahastu