Eesti kultuur globaalpläusti ajastul

Olukorras, kus tehisaru on – kas otsesemalt või kaudsemalt, aga igal juhul juba paratamatult – meie kõigi igapäevaellu tunginud, mõjub kainestavalt keelemudelite eesti keelt ja kultuuri puudutavate teadmiste mõõtmine. Miks, kuidas ja kes peaks aga meie oludes pädevat tehisaru arendama?

Kuulsin kord lugu härrast, kes oli tulnud raamatukokku üht teost otsima. Kuna raamatukoguhoidja raamatut kohe ei teadnud, siis vaadati esmalt Estrist, aga seal seda miskipärast ei leidunud. Otsiti riiulitelt sarnase nimega autorit, seejärel pöörduti juba välismaiste andmebaaside poole. Kui pika otsimise peale teosest endiselt ühtegi jälge ei leitud, uuris raamatukoguhoidja, kust härra selle kohta kuulis. Vastus kõlas: „ChatGPTlt.”

See lõbusavõitu seik peidab endas nii mõndagi mõtlemapanevat. Tehisaru on muutunud paljude inimeste jaoks peamiseks infootsingu tööriistaks. Võrreldes teiste info otsimise viisidega, näiteks otsinguga andmebaasidest, raamatukogukülastuse või isegi guugeldamisega, on tehisaru kõige läbipaistmatum ning kallutatum. Juturobot käitub küll abivalmilt, aga me ei tea selle eelistusi ega saa kunagi lõpuni veendunud olla, et pakutud info ka tõele vastab.

Võrdlustest

Mainitud juhtumist inspireerituna otsustasin järele uurida, kui tõenäoline on, et keelemudel sellises olukorras hallutsineerib. Disainisin selleks spetsiaalse võrdlustesti ehk benchmark’i. Võrdlustestid on n-ö keelemudelite eksamid, kus mudelite vastuseid hinnatakse automaatselt etteantud kriteeriumite alusel. Katse ülesehitus oli lihtne: keelemudelil paluti soovitada eestikeelseid raamatuid. Valikusse sai võetud kaheksa žanri: ilu- ja lastekirjandus, fantaasia-, krimi-, eluloo- ning ajalookirjandus, populaarteadus ja luule. Küsimus võis olla otsene (à la „soovita eestikeelseid lasteraamatuid”) või kasutada ühte neljast täpsustavast kriteeriumist – paluda kas uuemaid, vähem tuntud, klassikalisi või tõlgitud raamatuid. Selliselt sai kokku 40 küsimust, millest igaühes paluti nelja raamatusoovitust. Seega pidi iga mudel soovitama testi käigus 160 nimetust.

Järgmiseks võrreldi antud soovitusi automaatselt Eesti rahvusbibliograafia raamatute loendiga. Tegu on detailse andmestikuga kõigist eestikeelsetest ja Eestis ilmunud raamatutest läbi sajandite.¹ Soovitused, mille pealkiri ja autor ei vastanud piisava kindlusega ühelegi reaalsele nimetusele, loeti vigaseks. Iga mudeli lõpphinne esitati skaalal 0–100, mis väljendas tõeste soovituste osakaalu kõigist soovitatud raamatutest.

Mudelid ei saa kasutada testi käigus veebiotsingut või muid tööriistu, nagu seda teevad juturobotirakendused. Selline test mõõdab seega keelemudeli sisemisi teadmisi, mitte infootsinguvõimet. Ühtlasi seab see lati parajasse kohta. Ilmselt oskab suur osa koolis käinud eestlastest nimetada peast neli klassikalist eesti ilukirjandusteost, aga nelja värske luuleraamatu nimetamine (testis viimase kümne aasta jooksul ilmunud) võib vajada omajagu mõtlemist. Tegu on enam kui realistlike ootustega, arvestades, milline on mudelite teadmiste ulatus angloameerika kultuurist ning mida TI suurfirmad meile seoses tulevikuga lubavad.

Nüüdseks on sellest eksperimendist saanud osa Eesti Keele Instituudi suuremast uurimisprojektist, mille eesmärk on mõõta keelemudelite eestikeelset võimekust. Raamatusoovituste test on üks viis hinnata, kui usaldusväärselt suudavad mudelid tulla toime eesti keele- ja kultuuriruumiga seotud teadmistega. Selle ja teiste võrdlustestide tulemusi tutvustab EKI keelemudelite mõõdupuu², mis pakub interaktiivset ülevaadet tehisaru kvaliteedist eesti keeles.

Tulemused

Enam kui 50 testitud keelemudeli hulgast suutsid vaid OpenAI ja Google’i uusimad lipulaevad enam-vähem adekvaatselt reaalselt eksisteerivaid raamatuid nimetada: GPT-5.5 (80% reaalseid soovitusi) ja Gemini 3.1 Pro (75%). Kõik ülejäänud mõtlesid rohkem kui pooled soovitused välja või pakkusid teoseid, mida sellise pealkirjaga eesti keeles ei eksisteeri. Mõned, nt Google’i Gemma-seeria mudelid, said tulemuseks alla 10%. Avatud ehk vabavaralised mudelid olid kommertsmudelitest keskmiselt tunduvalt nõrgemad.

Valesid soovitusi oli eri laadi, alates päris autorite väljamõeldud loomingust (Hando Runneli „Kuidas õpetada oma koera luuletama”, Piret Raua „Piretiraudne” ja Jaan Krossi „Kättemaksukontor”) kuni sõnavääratuste („Tõde ja õiglus”, „Sada aastat üksindust”) ning väliskirjanduse toortõlgeteni (Bill Brysoni teos pole eesti keeles teadupärast mitte „Lühike ajalugu peaaegu kõigest”, vaid nõtkem „Kõiksuse lühiajalugu”).

Ootuspäraselt oskasid mudelid nimetada paremini klassikalisi ja tuntud teoseid, päringud uuemate ja vähem tuntud teoste kohta suurendasid luulude osakaalu kõigil mudelitel märgatavalt. Žanritest osati kõige rohkem nimetada ilu- ja lastekirjandust, kõige vähem aga luulet ja populaarteadust. Kõige sagedamini soovitasid mudelid „Tõde ja õigust”, „Kevadet”, „Väikest printsi”, „Naksitralle” ning – miskipärast – Steve Jobsi elulooraamatut.

Tehisaru keeleoskus

Tehisaru ei õpi eesti keelt mitte Sirbist ja ERRist, vaid Facebookist ja Temust.

Mudelite tulemus sellises testis sõltub peamiselt kolmest tegurist: mudeli suurusest ehk parameetrite arvust, eestikeelsete treeningandmete osakaalust ja nende andmete kvaliteedist. Parameetrite arv mõjutab seda, kui palju infot mudel suudab üldse talletada. Keelemudel ei jäta treeningandmeid lihtsalt tervikuna meelde ega tsiteeri neid sõna-sõnalt. Pigem kinnistub info, mis esineb andmetes korduvalt ja mitmesugustes kontekstides. Mida sagedamini mingist teemast treeningandmetes räägitakse ja mida suurem on mudel, seda tõenäolisemalt suudab see anda mitte ainult sorava, vaid ka tõese vastuse.

Eestikeelse materjali täpne osakaal mudelite treeningandmestikes ei ole teada ja eeldatavasti kõigub see olenevalt tootjast ja seeriast. Aga ligikaudse hinnangu järgi võiks see jääda umbes 0,1% juurde kogumahust.³ See on tegelikult kõnelejate arvu kohta üks maailma parimaid tulemusi, aga paraku loevad siin ainult absoluutsed mahud ja ergutusauhindu ei anta. Samuti oleks väär arvata, et see 0,1% koosneb peamiselt uudistest ja ilukirjandusest, nagu vahel väita üritatakse. Aina suurem osa veebis leiduvast eestikeelsest tekstist – võimalik, et juba ammu enamik – on kas masintõlgitud või genereeritud. Ning selle hulgas on palju suuremal määral igasugust jama, kui me arvata oskaksime. Tehisaru ei õpi eesti keelt mitte Sirbist ja ERRist, vaid Facebookist ja Temust.

Luulude ulatus

Enne kui rääkida võimalikest lahendustest, tuleks põgusalt mõelda, miks mudelite arusaam eesti kultuurist üldse tähelepanu väärib. Mainitud eksperiment käsitles raamatuid, aga usaldusväärse soovitusmootori saaks ehitada ka muul viisil. Raamatud on lihtsalt kategooria, mille kohta on olemas piisavalt täielik võrdlusandmestik. Küll aga annab raamatusoovituste test meile üldise aimduse, kuidas on eesti kultuuri puudutav teave mudelites talletunud.

Mudel, mis näiteks 50% kordadest eesti kultuuri puudutava infoga eksib, kõlbab ehk geneerilise AI slop’i tootmiseks eesti keeles, aga ei ole rakendatav üheski sügavamaid taustteadmisi nõudvas ülesandes. Olen kohanud haritud inimesi, kes muidu tehisarust oma töös arvestatavat kasu võiksid lõigata, aga on seepärast tehisarus hoopis pettunud ja hoiavad sellest eemale. Teised seevastu usuvad pimesi haipi, panemata tähele, et see ei vasta tehisaru reaalsele võimekusele meie tingimustes. Ja nii sünnivadki tehisaru abiga aina uued vigased tekstid ja piinlikud apsud.⁴

Mudel, mis näiteks 50% kordadest eesti kultuuri puudutava infoga eksib, kõlbab ehk geneerilise AI slop’i tootmiseks eesti keeles, aga ei ole rakendatav üheski sügavamaid taustteadmisi nõudvas ülesandes.

Aga kui uusimad tippmudelid hallutsineerivad „ainult” 20–25% kordadest, siis ehk kaob see probleem ajapikku lihtsalt ära? See oleks tühi lootus. Esiteks pole kvaliteedi paranemine ajas sugugi garanteeritud: mõni mudeliseeria tammub paigal (Llama), mõni kõigub tugevalt üles-alla (GPT), mõni on hoopis languses (Grok). Teiseks ei ole pidevalt luulutav mudel kaugeltki nii ohtlik kui „mõõdukalt” hallutsineeriv mudel, mis tekitab kasutajas piisavalt usaldust, et valvsus hajuks. Ja kolmandaks, praegu liigume me kiiresti olukorra poole, kus kogu eesti kultuuriruumis vähegi adekvaatselt toimetav tehisaru on koondunud ühe või kahe erafirma kätte.

USAs, kust kogu haip alguse saab, selliseid probleeme muide peaaegu ei ole. Sealses kultuuriruumis oluline info on mudelitele nii kõvasti pähe taotud, et piinlikud hallutsinatsioonid on tippmudelite puhul väga haruldased. Samuti on paljud avatud mudelid inglise keeles enam kui pädevad ning pakuvad teadlikku alternatiivi erakätes kommertsmudelitele. Kahjuks jäävad need asjaolud Eestis enamasti täiesti märkamata.

Kiired vastused ja sügavad diskussioonid

Kultuuriliselt tömp tehisaru toob endaga kaasa rohkem probleeme kui raamatukogus virvateoste otsimisele kulutatud aeg – ehkki ma olen kindel, et artikli alguses kirjeldatud lugu pole kaugeltki üksikjuhtum. Aina suurem osa informatsioonist on ühel või teisel viisil tehisaru vahendatud. Inimesed loovad tehisaruga tekste, lasevad neist seejärel olulise välja tuua, küsivad kimbatuses nõu, otsivad kiireid vastuseid ja peavad sügavaid diskussioone. Kõigi nende interaktsioonide käigus avame end ühel või teisel viisil keelemudelite subjektiivsele mõjule ning mõjutame ise seeläbi end ümbritsevat info- ja kultuuriruumi.⁵

Eesti kultuurikontekstis ebakindlad keelemudelid teevad sellest mõjust aga erosiooni, mis paljundab valeinfot ja uhub ajapikku minema selle vähese, mis võiks eristada meie maanurka ja selle vaimuilma tasapaksust globaalpläustist. Selle ärahoidmiseks tuleb heita kõrvale valearusaam, et tehisaru on siinsetesse oludesse asetatuna igatpidi sama võimekas kui Ameerikas. Oleme viibinud liiga kaua letargilises lootuses, et Eesti ühiskonnale sobiv tulevikutehnoloogia arendatakse välja teises maailma otsas, ilma et meie peaks lillegi liigutama.

Oleme viibinud liiga kaua letargilises lootuses, et Eesti ühiskonnale sobiv tulevikutehnoloogia arendatakse välja teises maailma otsas, ilma et meie peaks lillegi liigutama.

Eestil on kõik eeldused olemas, et tehisaru enda näo järgi kujundada. Selleks pole vaja massiliselt arvutusjõudu, vaid piisab kvaliteetsetest andmetest ning headest koostööpartneritest. Digiriigi ja sellega kaasneva rahvusvahelise kuvandi tõttu on meil olemas mõlemad. Puudu on hoopis poliitiline tahe ja ühiskondlik kokkulepe, mis võimaldaksid eestikeelsete andmete kasutamist tehisaru treenimiseks. Praegu toppab see juba pikemat aega õiguslike vaidluste ja avaliku huvi puudumise taga. Samal ajal murendavad aga nürid keelemudelid iga päev meie kultuuriruumi, tootes pläusti, mis jõuab omakorda järgmiste mudelite treeningandmetesse. Tegutsema peab kiiresti – eestlane ei vääri vähem kvaliteetset tehisaru kui ameeriklane.

Artikkel põhineb osaliselt 13. märtsil Eesti raamatuaasta lõppkonverentsil peetud ettekandel.

Krister Kruusmaa on ajaloolane, kes pidi käised üles käärima, et eesti kultuuril digitaalses maailmas tulevikku oleks.

Praeguseks sisaldab ERB üle 317 000 nimetuse 16. sajandist tänapäevani. Loe lähemalt: Kruusmaa, K. 2025. Andmetesse valatud raamatukultuur. – Sirp, 14.02. ↩︎
mõõdupuu.eki.ee ↩︎
Näiteks CommonCrawli veebikorpuses, mida teadaolevalt treenimiseks kasutatakse, kõigub eesti keele osakaal 0,14% ringis. Sellele lisanduvad muud korpused, kus eesti keelt ei pruugi nii palju olla. ↩︎
Vt nt Ajaots, O. 2026. AI-pläust või uus normaalsus? Eesti reklaamid kubisevad tehisaru vigadest. – Geenius, 20.05. ↩︎
Seda illustreerib hästi Delfi arvamustoimetuse analüüs tehisaruga kirjutatud „arvamusartiklitest”, vt: Nordmann, A.; Moora, E. 2026. Eesti arvamusliidrid on valinud ajumäda. Enamik arvamuslugudest on kirjutatud masina abil. – Delfi, 24.04. ↩︎

MIS SIND HUVITAB?

MIS SIND HUVITAB?

HEA LUGEJA,

Tutvu värske lehega

juuni 2026