Znanost in tehnologija

Slovenci s tehnologijo, ki razume človeški glas, prehiteli Google

Ljubljana, 03. 08. 2025 07.16 |

PREDVIDEN ČAS BRANJA: 5 min

Prepoznavanje 60 jezikov in govorcev ter simultano prevajanje in zapisovanje v izbran jezik – to so zmogljivosti novega modela umetne inteligence, ki ga je razvilo slovensko podjetje Soniox. Ustanovitelja Ambrož Bizjak in Klemen Simonič, ki sta pred tem delala tudi za Google in Facebook ter razvijala najsodobnejšo metodo za zdravljenje raka, sta s svojo vizijo in znanjem pritegnila pozornost Samsunga, ki je kot vlagatelj vstopil v podjetje ter podprl njihov nadaljnji razvoj.

Soniox - tehnologija, ki razume človeški govor
Soniox - tehnologija, ki razume človeški govor FOTO: Luka Kotnik

Ljudje po svetu govorijo številne jezike z različnimi naglasi in v različnih okoljih – v avtomobilih, na sestankih, na tržnici v domačem kraju in na potovanjih na drugem koncu sveta. 

Pri Sonioxu so z govorno umetno inteligenco dosegli, da aplikacija natančno prepoznava govor v realnem času v več kot 60 jezikih, vključno s slovenščino. Prepozna tudi različne govorce in govor simultano prevaja in zapisuje. "To je prva tehnologija, ki zares razume človeški govor večine jezikov po svetu. Do zdaj so bili računalniki in telefoni zelo dobri za besedilo, ChatGPT za tekst, pa dotik zaslona. Ampak ni bilo še tehnologije, ki bi natančno razumela govor, to, kar mi sproduciramo z glasilkami," pojasnjuje eden od ustanoviteljev Sonioxa Klemen Simonič

Kot smo lahko preizkusili tudi sami, aplikacija takoj prepozna jezik govorca in ga sproti zapisuje in prevaja v izbran jezik. Prav hitrost in velika natančnost, saj je zapisani govor tudi slovnično urejen, jih ločita od drugih, poudarjajo v podjetju. 

Razvili so inovativne algoritme in se zakopali v jedro umetne inteligence.
Razvili so inovativne algoritme in se zakopali v jedro umetne inteligence. FOTO: Luka Kotnik

Možnost prevajanja v živo sta letos predstavila tudi Apple in Google, ki pa mu je aplikacija med predstavitvijo prenehala delovati. Apple pa trenutno ponuja prevajanje le nekaj jezikov izključno znotraj njihovih aplikacij. "Mislim, da imamo vsaj eno leto prednosti v razvoju umetne inteligence, kar je neverjetno. In to oni vedo," je v slovenski produkt prepričan Simonič.

Od gluhih študentov do večjezičnih družin

Aplikacijo Soniox že uporabljajo gluhi študentje na univerzah, kjer se jim na zaslonih sproti zapisuje govor predavatelja, naglušne osebe pri dnevni komunikaciji, uporabljajo jo popotniki za sporazumevanje na potovanjih, v večjezičnih družinah lahko med seboj komunicirajo brez posebnega znanja različnih jezikov, v Ameriki zdravniki posnamejo posvet s pacientom, transkript in povzetek pa spiše aplikacija. 

"Če lahko govoriš v svojem naravnem jeziku, je to veliko bolj intimno. Veliko ljudi zna govoriti angleško, ampak ob tem niso sproščeni. Ljudje se počutijo domače, ko uporabljajo svoj glas in jih računalnik razume," izkušnje in odzive uporabnikov opisuje Simonič. 

Zagotavljajo do 95-odstotno natančnost zaznavanja in zapisovanja govora. Kako jim je to uspelo doseči? "Operiramo na ogromni količini podatkov, ki so na internetu. Razvili smo zelo inovativne in čisto nove algoritme, kako izkoristiti te podatke za to, da se lahko naučijo slovenščine in drugih jezikov in kako povezati avdio in tekst. Ker to sta dve modalnosti, ki sta čisto nepovezani," pojasnjuje Simonič. ChatGPT naprimer operira zgolj z besedilom, kar je občutno lažje. "Mi smo povezali avdio s tekstom. Tukaj se moraš res zakopati v najbolj inovativne stvari, v jedro umetne inteligence, kako sploh učiti take modele, kako in koliko podatkov pripraviti."

En delal na Facebooku in Googlu, drug razvijal eno najsodobnejših metod zdravljenja raka

Intenziven razvoj aplikacije je potekal pet let. Ustanovitelja podjetja Simonič in Bizjak, ki sta se spoznala med študijem matematike in računalništva na ljubljanski univerzi, sta pred Sonioxom izkušnje in znanje pridobivala v različnih panogah, tudi v tujini. Simonič se je leta 2013 preselil v ZDA, kjer je delal na Stanfordu in pri Googlu. Kot praktikant je bil del ekipe Google Brain in sodeloval z lanskim Nobelovim nagrajencem za fiziko Geoffreyjem Hintonom in Ilyo Sutskeverjem, soustanoviteljem organizacije OpenAI, ki je lansirala ChatGPT. 

Simonič je v ZDA delal tudi za Google in Facebook.
Simonič je v ZDA delal tudi za Google in Facebook. FOTO: Luka Kotnik

Pred desetimi leti se je pridružil Facebooku, ko sploh še niso imeli ekipe, ki bi se posebej ukvarjala z umetno inteligenco. Razvijal je sisteme za prepoznavanje in razumevanje zvoka v videih in prenosih v živo, kar uporabnikom omogoča, da lahko med ogledom vključijo podnapise. Sisteme uporabljajo tudi za zaznavanje neprimernih vsebin na ostalih družbenih omrežjih, ki danes spadajo pod okrilje Mete.

Bizjak pa je v podjetju Cosylab s programerskim znanjem razvijal opremo za nadzor pospeševalnikov delcev, ki se uporabljajo pri zdravljenju raka. Bil je eden osrednjih inženirjev pri razvoju protonske terapije, ene najsodobnejših metod zdravljenja. Leta 2020 sta skupaj ustanovila Soniox s sedežem v Kaliforniji, evropska razvojna ekipa ima sedež v Ljubljani. "Lepo se je izkazalo, da tudi v Evropi, če znaš ljudi organizirati in najti fokus, lahko razviješ najboljše produkte," o razvoju ljubljanske pisarne pravi Simonič, ki sicer priznava, da je eden največjih izzivov trenutno prav iskanje dobrega kadra. V Slovenijo vabijo tudi tuje strokovnjake. "Cilj je, da tukaj sestavimo enega najboljših inženirskih projektov na svetu."

Klemen Simonič in Ambrož Bizjak, ustanovitelja Sonioxa
Klemen Simonič in Ambrož Bizjak, ustanovitelja Sonioxa FOTO: Soniox

Sodelovanje s Samsungom

Potrditev, da so na dobri poti, so prejeli pred dvema letoma, ko jih je kontaktiral južnokorejski tehnološki velikan Samsung, ki razvija tudi aplikacije za medicinske prepise. "Oni so v bistvu integrator naše tehnologije, prav tako gredo vsi sestanki na Samsungu skozi Soniox," pojasnjuje Simonič. Med jeziki, ki jih ponujajo, je tudi korejščina. 

Soniox je preko API-vmesnika namreč na voljo tudi razvijalcem, ki želijo govorno tehnologijo vključiti v lastne aplikacije, platforme ali storitve. Ena od možnosti za v prihodnje je tudi, da bi imeli Soniox vkomponirani telekomunikacijsi ponudniki. Poenostavljeno povedano, gledalci bi na televiziji lahko gledali francosko televizijo, sproti pa bi se jim izpisovali slovenski podnapisi. 

Med jeziki Sonioxa je tudi korejščina, ki je že navdušila vodilne pri Samsungu.
Med jeziki Sonioxa je tudi korejščina, ki je že navdušila vodilne pri Samsungu. FOTO: Shutterstock

In kje sam vidi prihodnost umetne inteligence? "Mislim, da bo umetna inteligenca čisto vsepovsod, a najtežji del je, da jo nekako lepo integriramo v naše vsakdanje življenje," ocenjuje Simonič. V naslednjem koraku bo umetna inteligenca lahko sama raziskovala in izumljala ter pohitrila postopke, še napoveduje. Največji doprinos bi lahko imela v biologiji. "Gre za ogromen in kompleksen sistem s pomešano statistiko, kjer rabiš orodje, da ti ga uredi, mi imamo premalo nevronov, da bi lahko vse te podatke uredili."

Aplikacija je trenutno brezplačna, da tako ostane v določeni obliki, si bodo še naprej prizadevali. Tudi v prihodnje si ob monetizaciji želijo, da bi cena predstavljala zanemarljiv znesek in da bi bila lahko dostopna vsem. 

"60 jezikov je super, ampak vsak ta jezik je zelo individualna zadeva za enega človeka. Če sem jaz Slovenec in govorim slovensko, potem je slovenščina zame zelo pomembna. V bistvu je vsak jezik svoj produkt, to je 60 produktov, zloženih v enega," poudarja Simonič, ki mu izziv predstavljajo tudi posamezni dialekti v državah. "Prav s to tehnologijo bi dialekte lahko ohranili, saj jih bomo zapisali za vedno."

KOMENTARJI (77)

Opozorilo: 297. členu Kazenskega zakonika je posameznik kazensko odgovoren za javno spodbujanje sovraštva, nasilja ali nestrpnosti.

Jebeni
04. 09. 2025 11.35
Niti kapljice testosterona na vseh slikah. 😅
Tomaž Hacin
04. 08. 2025 19.29
Bravo, končno je nekdo dokazal z svojim znanjem, da je Googl samo nesposobna organizacija ki nima kaj dosti pameti, ima pa pamet kako dobro računat in pobirati podatke nevedoč za uporabnika in jih tržit. Ja tudi to je Amerika gre se jim samo za fenar, za ostalo se jim jeb....
Port__CN
03. 08. 2025 21.25
+1
ČESTITKE --SLOVENSKA mojstra, izbrala sta pravega -SAMSUNGA--
Žiga Habjan 1
03. 08. 2025 15.14
+4
"Prehiteli google" :')
Verus
03. 08. 2025 15.01
-4
Kaj TOČNO so "prehiteli"? Ne se hvalit s tujim delom nonstop
prašek
03. 08. 2025 17.19
+1
Prehiteli so GOOGLE!!!!! Tisto, kar Google še ne zmore , oni zmorejo !!!! Verus , je tako težko razumeti ?????
Verus
03. 08. 2025 19.16
-1
Poskusiva drugače: tek na sto metrov, met kopja, plavanje... dva tekmujeta. PRVI pretekel, NAJDLJE vrgel, NAJHITREJE preplaval itd. Kaj točno je disciplina v kateri so prehiteli GOOGLE?!
Port__CN
03. 08. 2025 21.27
+1
Z težavo gre to njemu, primerjava z lopato ,bi bila na mestu
proofreader
03. 08. 2025 14.27
+2
Neka ministrica je nekemu podjetju dodelila 1,2 milijona evrov, da to razvijejo.
txoxnxy
03. 08. 2025 13.36
+9
Kaj ti pomaga umetna inteligenca, če te pa takoj izbrišejo če kaj poveš po pravici v svojem materinem jeziku.
dolenji
03. 08. 2025 13.16
+3
Nekako deluje, po nekaj stavkih pa zahteva 20€/mesec. V prispevku pa piše, da je brezplačna oz. bo za minimalno plačilo 🤑
JOKS klub
03. 08. 2025 12.07
-1
Stroj nima inteligence. On ve samo to kar mu je človek napisal da ve in nič drugega. Ostalo je ZF.
Žiga Habjan 1
03. 08. 2025 15.17
+0
Točno to - trenutna "UI" je navadno strojno učenje in ima dosti več skupnega z statističnimi izračuni kot pa kakršnokoli inteligenco.
StayALive
03. 08. 2025 11.34
+3
Če imaš plenilski režim, kot ga imamo državna institucija sama od sebe ne bo ugriznila roke, ki jo hrani. Modus operandi Aktiva - Darko - Telebajsa. Isto je pri ptiču in stari kučo gardi. Ker imamo Slovenci ugrabljeno državo, tonemo.
Želko Kacin
03. 08. 2025 11.14
+1
StayALive
03. 08. 2025 11.07
+5
No to le je ista zgodba kot včeraj o Dončiču. Vemo kso je št 1 na Elektro faksu za govor in sintezo govora. Vemo kje sta se naučila in dobila navdih. Nato pa lepo v ZDA in tam ustvariti večino dohodka. To je žalostno. Korporacije z tovrnstn dodane vrednostjo rabi Slovneijas ne ZDA. Biznbis model države je zgrešen in zarjavel. To je treba spremeniti. Ni taka reč to samo lustracijo, puklavega iz politike, te pervertite ki so nastali iz nasilja kolesariata vreči na cesto, počistiti Policijo in Sodstvo ter vreči na cesto 90 procent neumnih birokratov. Ter postavit nove okvire napredne sodobne države ki bo nadmudrila razne Trumpe.
proofreader
03. 08. 2025 14.25
+1
Golob je davke dvignil v nebo in podjetja raje delajo v tujini.
Delavec_Slo
03. 08. 2025 11.07
+13
Mogoče pa umetna inteligenca reši arbitražo, ker jo politiki brez inteligence ne morejo!
Nidani
03. 08. 2025 11.25
-1
lakala28
03. 08. 2025 11.04
+6
A niso dežurni pljuvalci, ki sami sebe imenujejo novinarji, še par dni nazaj pisarili, da smo deset let za čangšlangi, ki praviloma kradejo znanje? Ko se kletni piarovci razpišejo, beremo tukaj bolj zblojene novice, kot na noritv. A ta portal nima glavnega urednika, da bi razmejil šund pisarijo od korektnega? Skratka: kapo dol slovenskemu znanju.
NeXadileC
03. 08. 2025 10.42
+3
To že obstaja, in deluje ok.
NeXadileC
03. 08. 2025 10.41
-1
Zakaj ni več na,FB in Googlu???
Professor
03. 08. 2025 10.33
+11
Bravo! Upam, da bo aplikacija zaživela.
medo357
03. 08. 2025 10.29
+19
Sem poskusil uporabiti to aplikacijo in katastrofa glede na zapisano zgoraj. Prevaja zelo počasi, netočno in le nekaj besed, nato zahteva plačilo 20€ mesečno. Očitno gre le za plačan članek in reklamo. Upam, da to nadgradijo v neko delujočo aplikacijo.
oježeš
03. 08. 2025 10.28
+13
Pred dvema letoma, ko sem bil na Poljskem, sem se s pomočjo Googlovega prevajalnika z zdravnikom, ko je zdravil enega od naših udeležencev tekmovanja. Pa sva že takrat govorila v telefon, on poljsko jaz slovensko in sva se vse z lahkoto dogovorila. Tako, da malo dvomim, čeprav pozdravljam uspešnost naših ljudi, da je to ravno prvi izdelek, ki razume besedilno sporočilo za prevajanje. Je pa lepo, da se uspehom naših ljudi, da tudi mesto v naših medijih.
Primula1
03. 08. 2025 10.13
+7
Bosta razvila tudi algoritme, ki bo zagotovil preživetje prevajalcem, ki so žrtvovali čas za študij jezika?