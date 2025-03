Pobudniki raziskave so logopedi z Nevrološke klinike Univerzitetnega kliničnega centra v Ljubljani. "Oni namreč te podatke potrebujejo za klinično obravnavo oseb z jezikovnimi težavami, na primer po možganski kapi, poškodbi glave po kakšni nesreči ... Naši rezultati jim bodo pomagali pri pripravi testov za prepoznavanje prvih znakov kognitivnega upada oziroma demence. To namreč lahko ugotovijo z jezikovnimi testi," nam je pojasnil vodja projekta, Andrej Perdih z ISJFR.

Slovenci in Katalonci imamo veliko skupnega. Med drugim sta bila oba naroda dlje časa pod nadvlado različnih imperijev, skupna pa nam je tudi ljubezen do branja in materinščine. Po katalonskem vzoru so raziskovalci Inštituta za slovenski jezik Frana Ramovša (ISJFR) ZRC Sazu oblikovali besedno igro Besedomat , s katero želijo raziskovalci ugotoviti, kakšen je povprečni besedni zaklad pri Slovenkah in Slovencih. Ta podatek pa bo v pomoč strokovnjakom s področja logopedije, možganskih poškodb, demence in podobno.

V projektu poleg logopedov z ljubljanskega kliničnega centra in Inštituta za slovenski jezik sodelujejo še Pedagoška fakulteta Univerze v Ljubljani in Fakulteta za humanistiko Univerze v Novi Gorici. Projekt financira Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije (Aris).

Z raziskavo pa bomo dobili tudi zanimive podatke o tem, koliko besed v povprečju poznamo, ali pa denimo, kakšno je običajno število besed, ki jih poznamo pri različnih starostih. "Ker z leti besedni zaklad narašča, bomo lahko ugotovili, pri kateri starosti pa se to neha. Zaenkrat imamo le podatke tujih raziskav, za ameriško angleščino. Pri Američanih so ugotovili, da pri starosti 20 let povprečen govorec ameriške angleščine pozna približno 42.000 besed, potem pa se jih do 60. leta nauči še dodatnih 6000 – se pravi, približno eno besedo na dva dni. Verjetno je tudi pri nas kaj podobnega, ni pa nujno, ker so si jeziki precej različni. Pri nas je besedotvorje zelo močno – poveste glagol, pa že vemo iz njega tvoriti samostalnik, pridevnik in tako naprej," pravi Perdih.

Projekt poteka od oktobra 2023, spletno stran z besedno igro Besedomat pa so zagnali novembra lani. Do sredine februarja so ljudje besedomat rešili že več kot 25.000-krat. A za konkretne in uporabne znanstvene rezultate bo potrebnih še več podatkov. V Kataloniji, ki ima okoli devet milijonov prebivalcev, so se reševanja igre lotili kar 200.000-krat. "Če se primerjamo s Katalonci, po katerih se zelo zgledujemo, bi mi morali v enem letu zbrati približno 40.000 odgovorov," pravi naš sogovornik.

Znate ločiti prave od izmišljenih besed?

Spletna igra Besedomat je zelo preprosta. Po uvodni anketi, kjer podate nekaj osnovnih podatkov o spolu, starosti, izobrazbi ipd., vam aplikacija ponudi nabor besed – nekatere med njimi so prave slovenske besede (tudi pogovorne, narečne ali prevzete), druge pa so izmišljene (t. i. psevdobesede). Vaša naloga je, da se za vsako posebej odločite, ali je prava beseda ali ne. Preizkus traja približno pet minut, vsak uporabnik pa ga lahko opravi večkrat – vsakič pa bo nabor besed, med katerimi izbira, drugačen.

Perdih pravi, da so v Besedomatu zajeli 79.413 pravih besed in 20.644 lažnih oziroma izmišljenih besed. "Prave besede smo izbrali iz treh slovarjev: Slovarja slovenskega knjižnega jezika, nastajajočega novega slovarja slovenskega knjižnega jezika in Sprotnega slovarja slovenskega jezika, to pa je slovar, ki ima predvsem novo besedje in besede, ki niso nove, a jih v drugih slovarjih še ni. Iz tega smo potem dobili nekaj več kot 100.000 besed, ampak smo na podlagi določenih kriterijev to število potem malo zmanjšali. Denimo, v igro nismo vključili besed, ki so daljše od 17 črk, saj ne pridejo na zaslon telefona. Izločili smo tudi lastna imena, kratice, okrajšave in simbole ipd.," pravi vodja projekta.