Hoiatus: see lehekülg ja siit viidatud asjad on üsna vanad ja mitmesuguste teadaolevate
puudustega. Uuematest selleteemalistest tegemistest on olemas nt PLAMK ning plaan
selle, Eesti Keele Instituudis valmivate asjade ja Voikko baasil midagi uut ja
paremat teha. Huvilised võivad julgesti allpool oleval aadressil ühendust võtta.
(16.04.2013)
Mis see on?
Sellelt lehelt leiab minu bakalaureusetööna valminud nägemuse
sõnastikupõhisest eesti keele õigekirjakontrollijast.
Peamiselt
on siin ispell'ile
ja myspell'ile mõeldud
sõnastikud ning tarkvara nende tekitamiseks kasutades
Eesti Keele Instituudist pärit infot sõnade ja nende
muutumise kohta.
Lisaks on siin eesti keele poolitamist kirjeldav fail
OpenOffice.org'ile. (paigaldamise juhis tuleks siia ka tekitada.)
See fail on saadud vastava TeX'i faili (vt
Tõnu Tamme TeX'ilehelt) minimaalse teisendamise teel.
Originaali autor on Enn Saar. (Hetkel on siin fail 9. aprillist 2004)
Viimase versiooni failist saab CTAN arhiivist http://www.ctan.org/tex-archive/language/hyphenation/eehyph.tex.
Sõnastikud
/kunagi saab siia ka jutt selle kohta, mida ette võtta, et asjad kasutatavaks muutuks ja ka
selle kohta, kuidas ise sõnastikku täiendada/
Sõnastikus on umbes 15 miljonit sõna.
NB! Äärmiselt oluline on sisse lülitada ispelli liitsõnade tugi. See põhjustab küll mõnede
väärvormide õigeteks pidamist, kuid kuna liitsõnade iseseisvalt sõnastikus esinemine teeks
sõnastiku ebapraktiliselt suureks, siis ei ole eriti muud võimalust.
NB! Tegemist on suhteliselt värske asjaga. Kindlasti leidub sõnu/sõnavorme, mida
sõnastikus ei leidu. Olulisemad on ilmselt kõikvõimalikud pärisnimed -- levinumad ees- ja
perenimed, kohanimed jms.
NB! Tehnilistel ja sõnastikust mitte sõltuvatel asjaoludel ei oska ispell (ja ilmselt ka
myspell) pakkuda korrektseid variante tundmatute liitsõnade asemele.
NB! Allpool viidatud sõnastikufailidest on olemas ka ISO-8859-15
kodeeringus variandid. Need on tarvilikud peamiselt sellepärast, et OO.o ei osanud arvestada
sellega, et kasutatud Latin-1 tabel on veidi modifitseeritud..
ispell
Olulised on failid estonian.dict ja
estonian.aff, milledest käsuga
buildhash estonian.dict estonian.aff estonian.hash
saab tekitada ispelli paisktabeli. (Lühendites esineva punkti peale pahandamine on
teadaolev viga, kas või mida sellega ette võtta, pole veel otsustatud)
Saadud paisktabeli võib ispellile otse -d
võtmega
kasutada anda või siis võib selle kopeerida süsteemsesse ispelli sõnastikekataloogi
(tõenäoliselt /usr/lib/ispell). Traditsiooni kohaselt kopeeritakse sinna ka afiksite fail
(see, mille laiend .aff on).
myspell
myspell on OpenOffice.org'i sisseehitatud spellerimootor,
sisuliselt on tegemist ispellist välja võetud sõnastikumooduliga. Sõnastik asub failides
et_EE.dic ja et_EE.aff. Paigaldamiseks piisab,
kui need failid kopeerida OO.o sõnastike kataloogi (selle kataloogi, kuhu OO.o paigaldatud on,
alamkataloog share/dict/ooo, tõeäoliselt). Lisaks tuleb samas kataloogis olevasse faili
dictionary.lst
lisada rida
DICT et EE et_EE
ning OO.o taaskäivitada. Peale taaskäivitamist peaks keelemoodulite häälestusest (Tools, Options,
Writing Aids, esimene edit nupp) olema võimalik valida, et eesti keele õigekirja kontrolliga
tegeleb myspell. (analoogiliselt toimub poolituse lisamine).
Litsents
Praktiliselt kogu sõnastikes leiduv materjal on genereeritud kasutades Eesti Keele Instituudis
loodud tüvebaasi. Tüvebaasile kehtib EKI tarkvara
litsentsileping. Lisaks on kasutatud Ülle Viks'i "Väikest Vormisõnastikku".
Käseoleval lehel leiduvad sõnastikufailid ise on levitatavad
GNU vähem üldise avaliku litsentsi
(originaal) alusel.
Täiendamisest
Kuna tegemist on väga värske asjaga, siis vajab see ilmselt kiiret täiendamist. Praegu
on ilmselt parim idee saata ettepanekud e-postiga aadressil jjpp @ meso . ee. Lähemal ajal
peaks sellele lehele ilmuma ka vahendid, mille abil ülaltoodud sõnastikud genereeriti ning
mille põhjal on võimalik kohe sobival kujul lisandusi tekitada.
Valmispakendatud versioonid
Loodetavasti tekib siia kohe varsti ka erinevate süsteemide jaoks valmispakendatud kuju sõnastikest.
Töös on pakid Debianile, muude pakendamissüsteemide osas on igasugune abi teretulnud.
OpenOffice.org Mac OS X versioon
Vastukajana Arvo Mägi artiklile Delfis
tekitas Filipp Lepalaan paigaldusvahendid
sõnastike lisamiseks OO.o MacOS X versioonile. (vt ka esialgset foorumipostitust)
MacOS X 10.6+ süsteemne speller
Hasso Tepper kirjeldab kuidas MacOS X eesti keele tuge täiendada, sh kuidas
siin kirjeldatud failide abil süsteemne spellimine käima saada.
Debianile pakendamise aluseks olev pakk
Et koguaeg poleks vaja suuri sõnastikke üles laadida, on nüüdsest siin olemas
tar-fail, mis on aluseks
Debiani pakkidele.
© Jaak Pruulmann, 2003.
Viimane muudatus: 16. aprill 2013 -- märkus lehe alguses ja MacOS X süsteemse spelleri viide
Enne seda: 30. mai 2007 -- debiani originaal tgz.
Enne seda: 15. jaanuar 2005.