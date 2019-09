Joe Dumoulin je strokovnjak za strojno učenje jezikov, umetno inteligenco in računalniške aplikacije za podjetja. Začel je kot programer in delal v razvoju in strojništvu. Kako se je njegovo delo razlikovalo od večine programerjev, najbolje predstavi kar sam:

Najlažje vam pojasnim moje delo tako: matematične formule, ki so napisane na papirju, spremenim v programski jezik, ki deluje. Zelo pomembno je razumeti matematiko, ki stoji za programom, če želite uporabiti strojno in globoko učenje kot metodo izgradnje programskega jezika. Ker sem sam začel v matematiki in fiziki, je bilo lažje razumeti določene procese, ki so se razvijali v programskem okolju.

Globoko učenje je najbolj učinkovit pristop za reševanje določenih problemov, kot so razumevanje jezika, govora ali recimo prepoznavanje slik. Če primerjamo starejše načine strojnega učenja in globokega učenja, lahko vidimo prednosti novih metod. Starejše metode so imele težave s tem, da so se programi lahko "učili" do določene mere in prišlo je do "kapice", točke, na kateri dodajanje novih spremenljivk in informacij ni pripomoglo k učenju programa, ta je prišel do "vrha razumevanja."

V 90. letih sta se programiranje in družba precej spremenila z rastjo prodaje in uporabe osebnih računalnikov. Programsko okolje, v katerem sem najprej delal, je bilo v Fortranu, kasneje se je bolj začelo usmerjati v C oziroma C++ in potem še Pascal. Nekatere od teh programov še vedno uporabljamo, druge pa smo opustili. Dejstvo je, da sem kariero zgradil tako, da sem znanstvenikom in inženirjem pomagal njihove ideje programsko ustvariti in to vse v C++. Ne pozabite, da programiram že skoraj 35 let (smeh), to je dolgo obdobje, v katerem so se zgodile marsikatere spremembe.

Sistem se nasiči. Spomnite se samo, kako se vi učite. Začnete brati in se učite eno uro in nove informacije zelo dobro absorbirate, po treh urah že veliko manj, po štirih urah potrebujete kavo, po petih urah pa bi radi dremali. No, večina programov s strojnim učenjem deluje precej podobno, le da ima nasičenost s podatki in tudi če bi jim radi dodali več podatkov, jih bodo sprejeli, ampak se ne bodo ničesar "naučili." Predstavljajte si drevo, veje predstavljajo dodatne spremenljivke, ki jih program mora prepoznati. Dodajate nove veje, ki se slepo končajo, in program vseh teh slepih vej enostavno več ne zmore "razumeti", saj ima vsaka nova informacija manj vpliva na iskanje rešitve, tako kot ima ena veja zanemarljiv vpliv na celotno drevo.

Pri globokem učenju pa je drugače, saj več kot boste v sistem vnesli podatkov, bolje se bo učil in razumel. Najboljši primer za to so prevodi in prevajanje. Če imate ogromno parov prevodov, recimo med angleščino in slovenščino, bo program to bolje znal prevesti. V starem načinu ste lahko dodajali na tisoče novih parov prevodov, a se program po določeni točki ni naučil nič novega, prevodi so bili nenavadni. V globokem učenju pa računalnik išče povezave, ponavljanja, "sence", verjetnosti med posameznimi besedami in prevodi, zato je pomembno, da mu damo čim več prevodov, kajti z vsakim parom bo bolje razumel sintakso jezika, kar pa prej ni bilo mogoče.

Zato so prevodi na Google prevajalniku vse boljši?

Točno tako. Lahko je prevesti besedo A, težje pa je prevesti stavek B iz angleščine v slovenščino, saj sta stavek in poved veliko več kot sestavljene besede. Vsaj jezik ima posebnosti, tone in tudi različna razumevanja, tudi dele, ki se sploh ne prevajajo (predvsem tehnični jezik). Stare metode strojnega učenja tega niso znale dobro razumeti, zato niso bile uspešne, globoko učenje pa se zna prilagoditi na vse te posebnosti.

Pomembno je tudi, da programer razume, kako se ti programi "učijo" in da je pravzaprav zelo podobno človeškemu učenju. Študent se lahko uči tako, da prebere odstavek ali stran in potem po spominu napiše povzetek tega. To je zelo učinkovito in si zelo dobro zapomnimo vsebino, tekst pa seveda ni popolnoma enak – je dober povzetek. V globokem učenju obstaja trik, ki ga rad učim ljudi, in sicer ravno na tem primeru, kjer študentom pomagam narediti nevronske mreže tako, da program sam naredi takšen povzetek. Njihovo razumevanje, kako so sami prišli do lastnega povzetka, jim pomaga pri pisanju programa, da bi čim bolj podobno naredil računalnik sam in to je pomembno da razumete vsi – program je tako dober, kot je programer, ki je razumel, kaj bi radi z njim naredili.

Da nadaljujem. Ko boste imeli samo en odstavek, ta programski povzetek nima veliko smisla. Dodate nove odstavke, strani, knjige in ta povzetek bo vse boljši. Jaz bi mu recimo dal nalogo, da prebere vsa dela Friedricha Nietzscheja in potem sestavi stavke. Zanimivo je gledati, kako se program uči, in sicer tako, da gleda položaj črke v razmerju z drugimi črkami. Ne uči se stavkov, saj ne razume, kaj stavki pomenijo, ampak abecedo in vrstni red črk v besedi in program naredi neke vrste svoj jezik, ki je pravzaprav neverjeten.

Katere aplikacije, ki jih že uporabljamo/imamo, bi globoko učenje lahko uporabljale tudi v Sloveniji?

Prevodi jezikov so ena od njih, globoko učenje je trenutno zelo pomembno pri prevajanju. Poleg tega so tudi aplikacije v modernih, sodobnih avtomobilih, npr. pri varnosti, čeprav ne vem, če te uporabljate v Sloveniji, zagotovo pa drži za ZDA, kjer bo večji del vožnje po avtocestah upravljal sam avtomobil, ki bo vedel, kaj storiti. Tehnologija je izjemno nova – ne govorim o neke vrste avtonomnih avtomobilih, a če pomislite, da se npr. vozite po avtocesti, je vožnja zelo običajna. Občasno se morate ustaviti ali upočasniti, a na splošno je vožnja zelo mirna, nima toliko spremenljivk.