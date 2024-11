V nasprotju s splošnim prepričanjem je artificial intelligence (AI) oziroma umetna inteligenca izjemno široko področje znanosti. Ste vedeli, da njene korenine segajo v petdeseta leta prejšnjega stoletja? Zakaj je trajalo skoraj 70 let, da smo dobili ChatGPT? In zakaj ga poskušamo regulirati šele zdaj?

To dolgo potovanje je mogoče pojasniti s kombinacijo tehnoloških omejitev, teoretičnih izzivov, (ne)razpoložljivosti podatkov in premikov v fokusu raziskav. Razvoj ChatGPT je trajal približno 70 let, ker so bile zgodnje raziskave umetne inteligence v petdesetih in šestdesetih letih omejene z osnovno strojno opremo in pomanjkanjem velikih podatkovnih nizov. Razvoj prepreden s pomanjkanjem Področje se je soočilo z več "zimami" zaradi neizpolnjenih pričakovanj, vendar je pomemben napredek prišel z vzponom strojnega učenja v osemdesetih letih, ki so mu sledili preboji globokega učenja. Prevladujoča uporaba interneta je zagotovila ogromno besedilnih podatkov, medtem ko je specializirana strojna oprema omogočila računalniško izvedljivo usposabljanje velikih modelov. Razvoj transformatorske arhitekture leta 2017 je končno omogočil sofisticirano razumevanje jezika, kar je vodilo do zmogljivih modelov, kot sta GPT-3 in GPT-4. Ti temeljijo na globokem učenju ter so zasnovani za generiranje naravnih besedil in razumevanje človeškega jezika na način, ki je presenetljivo podoben človeškemu.

Umetna inteligenca FOTO: Shutterstock icon-expand

S čim imamo opravka danes? Danes je AI krovni izraz za različna podpodročja. Strojno učenje je glavni motor večine sodobnih sistemov umetne inteligence, ki se osredotoča na razvoj specializiranih algoritmov. Ti se učijo iz vhodnih podatkov. Globoko učenje je podmnožica strojnega učenja, ki se osredotoča na nevronske mreže z več plastmi (globoke arhitekture). To podpolje je povzročilo nastanek konvolucijskih nevronskih mrež, ki se pogosto uporabljajo v računalniškem vidu, ponavljajočih se nevronskih mrež in kasneje transformatorjev ter generativnih kontradiktornih mrež (GAN) za generativne naloge. Obdelava naravnega jezika se osredotoča na razumevanje in ustvarjanje človeškega jezika. Računalniški vid se ukvarja z omogočanjem strojne interpretacije vizualnih podatkov. Raznolikost znotraj AI izhaja tudi iz neštetih metodologij, ki se uporabljajo za reševanje različnih problemov, od katerih je vsaka prilagojena specifičnim aplikacijam. Probabilistični modeli uporabljajo statistična načela za sklepanje o distribucijah osnovnih podatkov in kvantificiranje negotovosti. Evolucijski algoritmi se zgledujejo po biološki evoluciji z uporabo mehanizmov, kot so mutacija, križanje in selekcija za reševanje problemov optimizacije. Simbolna umetna inteligenca, ki jo pogosto zasenči globoko učenje, se opira na eksplicitno predstavitev znanja in sklepanje ter ostaja pomembna v aplikacijah, ki zahtevajo interpretabilnost. Dandanes smo priča naraščajočemu trendu hibridnih modelov, ki združujejo simbolično razmišljanje z globokim učenjem. Kompleksnost razvoja umetne inteligence ni le v ustvarjanju in usposabljanju modelov, temveč tudi v upravljanju celotnega življenjskega cikla – vključno z zbiranjem podatkov, uvajanjem modela in njegovim vzdrževanjem. Poleg tega je umetna inteligenca interdisciplinarne narave, saj črpa vpoglede iz nevroznanosti, fizike, ekonomije in podobno.

