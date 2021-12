Dr. Marko Milosavljević , ki je eden od členov v ustvarjanju teh programov, je rekel, da so obiskali več novinarskih redakcij in opravili več intervjujev tako z novinarji kot uredniki. "Obiskali in debatirali smo tudi s posamezniki v New York Timesu, Reutersu, BBC, Guardianu …", je dejal Milosavljevič. Sodelovali so z Univerzo v Edinburghu in Helsinkih, s Queen Mary iz Londona, z La Rochelle in Inštitutom Jožefa Stefana. Celoten razvoj je financiran s strani Evropske unije, tako da so orodja brezplačna in na voljo vsem.

Večina programov, ki že danes obstajajo, ne ustvarjajo vsebine iz nič, ampak s pomočjo umetne inteligence ustvarjajo vsebine, ki so bodisi ustvarjene v drugih jezikih ali fragmentirane bodisi je množica podatkov tako velika, da bi bili potrebni številni resursi, da bi iz njih potegnili bistvo. Ustvarjalci so še pred začetkom ustvarjanja programov preverili, kaj novinarske redakcije potrebujejo za svoje delovanje. Umetna inteligenca namreč ni inteligenca v pravem pomenu, saj program ne more sam ustvariti nekaj, kar ni bil naučen. Človeško znanje, delo in razumevanje problema je tako ključno za programiranje in spoznavanje tistih težav, ki bi lahko program naredile neuporabnega.

Senja Pollak iz Instituta Jožef Stefan, ena ključnih oseb pri razvoju tega projekta, je dejala, da so se osredotočili predvsem na slovenščino, estonščino, hrvaščino, finščino in latviščino. Projekt se je začel leta 2019 in bo potekal vse do leta 2022, na predstavitvi pa so predstavili prve (beta) variante programov, ki bodo prosto dostopni. Tako razvijajo programe za analizo komentarjev, torej iskanje sovražnega govora in delivcev lažnih novic. Drugi tovrsten program se bo osredotočal predvsem na analizo novic in njihov pomen, pa tudi ustvarjanje novic.

Pollak je povedala, da so se v zadnjih letih precej razvile tehnologije na osnovi globokih nevronskih mrež in tudi vektorsko embedanje, kjer s pomočjo določenih kontekstualnih smislov lahko ima beseda drugačen pomen. Gre tudi za to, da lahko program razume določene povezave med vsebinskimi sopomenkami – delnimi. Tako ima lahko v kontekstu postavljanja jezika dvojica stric in teta podoben pomen kot kralj in kraljica.

Prav tako določeni programi določajo ključne besede oziroma ključno postavko neke vsebine, ki se pojavlja v članku. Nekateri mediji so tudi želeli, da bi lahko preverili ujemanje računalniškega določanja ključnih besed s tistimi, ki so ga določili ljudje. Gre tudi za način učenja in usklajevanja ključnih besed, ki jih uporabljajo podobne vsebine in se lahko poveže članke s podobnimi vsebinami. Računalniško voden proces bi vsaj v teoriji to naredil veliko hitreje in bolj natančno ter s tem poskrbel za boljšo povezanost člankov.

Podrobnejša pojasnila o orodjih si lahko pogledate na posnetku (v angleščini).