Keeleressursid Internetis
 
Indrek Hein, Eesti Keele Instituut

Järgnev ülevaade püüab vastata küsimusele, kuivõrd on Internetis vabalt kättesaadavaid tekste ja tarkvara võimalik kasutada eesti keele õppimiseks, konkreetsetele küsimustele vastuse leidmiseks, keeleuuringutes ja puhtpraktilistes rakendustes.

Eesti keelt puudutavate linkide kogu on tegemisel, selle aadress hakkab olema

Sõnastikud
on suhteliselt hästi esindatud. Olemas on nii üldkeelealased — ÕS, sünonüümisõnastik, antonüümisõnastik, murdesõnaraamat, slängisõnaraamat; kakskeelsed — inglise-eesti, vene-eesti (lubadus on olemas välja panna norra-eesti ja aseri-eesti sõnaraamatud) kui ka erialasõnastikud, tavaliselt inglise-eesti + terminite lahtiseletused.

Kõik üldkeele sõnaraamatud on pärit Eesti keele instituudist, mis on ka loomulik, arvestades nende tohutut töömahukust ja suhteliselt väikest tarbijaskonda.
Olemasolevat materjali üritavad integreerida KeeleWeb ja TÜ-s koostatav tesaurus.
Mitmekeelsete sõnaraamatute osas torkab silma teiste kirjastuste soovimatus oma materjale vabalt kättesaadavaks teha. Osalt on see tingitud litsentsilepingutest, kuid põhiliselt kardetakse, et vabalt tarvitatav sõnaraamat mõjub halvasti pabervariandi läbimüügile ja selle näppavad ära konkurendid.
Oskussõnastikke on mitmesuguseid. Suuremad on valminud TA asutustes ja vormistavad varem valminud materjali uuel kujul, väiksemad on entusiastide kätetöö. Erialadest on paremini esindatud zooloogia ja bioloogia ning arvutite ja tarkvaraga seonduv. Kättesaadavad on Eesti isiku- ja kohanimeloendid.

Tekstikorpused

Kitsamas mõistes tekstikorpused on kasutusel Eesti keele instituudis ja TÜ-s, laiemalt võiks tekstikorpusena käsitleda kogu eestikeelset Internetis indekseeritud materjali, ja seda polegi nii vähe. Kitsaskohad:

1.   Internetiportaalid ei soovi kasutada keeletehnoloogilisi vahendeid.
2.   Paljusid andmebaasipõhiseid tekste ei indekseerita (sh suuremaid ajalehti ja teadeteagentuuride tekste). Kogu tekstide hulgast otsida ei saa, selleks tuleb teha 4-5 päringut.
3.   Kirjastused ei soovi annetada ilmunud raamatute tekste.

Üldiselt on võimalik sõna või sõnaühendi kasutuse kohta teavet leida, kuid paljutki oleks võimalik teha mugavamalt.

Tarkvara

on ühest küljest vägagi palju, teisest küljest jälle liiga vähe. Olulisematest komponentidest on puudu süntaktilis-semantiline töötlus ja masintõlge, kui need valmivad, on eesti keel keeletehnoloogiliste vahendite osas samal tasemel suurkeeltega. Vägagi või pigem liigagi palju on keeletehnoloogilisi vahendeid olemas, kui vaadata nende kasutust. Peale Filosofti spelleri Microsoft Office'i koosseisus võib nimetada vaid üksikuid rakendusi, üldhoiak on tõrjuv.

Keeleõppematerjalid

Puudub ühtne keskkond, olemasolevaid tekste leiab laialipillutatult. Koolidele mõeldud harjutusi leiab Miksikese õppekeskkonna materjalide hulgast, 6-10 eesti keelt õpetavat firmat oma materjale ei avalda. Heaks abivahendiks on kindlasti ka EKI "Eesti keele käsiraamat", kuid hämmastaval kombel puuduvad eesti keele õppematerjalid alg- ja keskastmele vene ja inglise keele baasil.

Varia

  •    Keelenõu korduma kippuvad küsimused

  •    Infotehnoloogia standard EVS 8:2000 "Infotehnoloogia rakendused eesti keele ja kultuuri keskkonnas"

  •    Keelealane uudisegrupp ee.keel

    Mida võiks teha olukorra parandamiseks?

    Olukord pole sugugi hull. Vabalt kasutatavate materjalide hulk jääb küll alla paarikümnele maailma suurkeelele (sh ka soome keelele), kuid on muudest siiski mäekõrguselt üle. Sellegipoolest saaks paljutki paremini teha.
  •    Toetada alusuuringuid. Keeletehnoloogiliste rakenduste valmimine nõuab suurt tööd, ilma koheste käegakatsutavate tulemusteta, finantseeritakse aga pigem puhtpraktilisi uurimisteemasid. Umbes viie aasta pikkusest projektist, mis keeleuuringutel on pigem reegel kui erand, ei taha kuulda ükski fond. Ja keeleuuringute osas pole meil kelleltki valmislahendusi võtta, need tuleb teha Eestis. Ideid: kindlustada finantseerimine "Eesti keele seletava sõnaraamatu" (mis, tõsi on veel täielikult ilmumata) ja ÕSi Internetti viimiseks, tesauruse "lõplikuks" valmimiseks jms.
  •    Julgustada valminud keeletehnoloogiliste vahendite kasutuselevõttu. Ideid: korraldada konkurss koolidele kõige vahvama rakenduse tegemiseks.
  •    Julgustada kirjastusi ja keeleõppefirmasid oma materjale laiemalt levitama. See on teostatav, kuid igal üksikjuhul tuleb sellise sammu plusse ja miinuseid algusest peale selgitada ja alusetuid kahtlusi hajutada. Ideid: veenmisega võiks tegeleda Kirjastajate Liit (nt diferentseerides liikmemaksu); julgustada kirjastusi hoidma varukoopiat, millega kaasneks õigus nende tekste kasutada tekstikorpuses; asutada (nt Rahvus­raamatu­kogu juurde) kultuurivaramu, mis koguks sundeksemplarina ilmunud trükiste tekste elektroonilisel kujul.
  •    Toetada integreerivaid lahendusi Internetis, nt KeeleWebi päring sõnavormi kohta võiks lisaks praegusele väljastada lemma (algvormi sõnastikus), selle tarvitussageduse koos tüüpnäidetega, võimaliku liitsõnamoodustuse, soovituse mõne muu sõna tarvitamiseks tekstis otsitu asemel jms, kõik eesmärgiga seda õppetöös kasutada.

     

    tagasi | avalehele

    Akademischer Rat Academic Council Akadeemiline nõukogu Ümarlaud Kultuurirahastu