Kolumna

Nаvigator

Srećna nova 202GPT3 2

“NOVINAR" I NOVINAR: Serverska soba...

Srećna nova 202GPT3

Krenimo od zaključka. Imamo dobru i lošu vest. Dobra je da čet botovi već danas mogu da nešto napišu i opevaju 99 odsto jednako dobro kao čovek, ali da je “aroma” u tom jednom procentu koji je za kompjuter i dalje nedostižan i verovatno će zauvek ostati tako. Loša vest je da ljudi sve manje mare za tu aromu, samo neka košta manje. Prvo su došli po daktilografe, onda su na red došli korektori i lektori, sada su na udaru novinari, a pesnici i programeri neka požure u šumu.

Kada je firma OpenAI prvog dana decembra svetu ponudila da testira njihovog četbota, nastala je prava pomama. Mediji su se utrkivali tekstovima o mogućnostima “dubokog učenja” i “veštačke inteligencije”, uglavnom impresionirani odgovorima koje im je bot davao. Onda je krenulo preispitivanje da li bi botovi uskoro mogli da zamene novinare i pisce uopšte budući da su pisali tekstove, čak i pesme, bolje od većine ljudi, uz to gramatički prilično ispravne. Nije prošao ni ceo mesec od tog javnog testiranja, a već su se pojavile olovne slike budućnosti u kojima su medijske redakcije desetkovane, a vesti nam pišu i na ekranu čitaju savršeni avatari koji ne traže slobodne dane, ne mogu da se razbole, ne treba im čak ni studio, sve se završi u kompjuterskim čipovima. I sve to se ne dešava u budućnosti, već danas i ovde.

Vratimo se ipak nekoliko koraka nazad da bismo razumeli šta se dešava. Iako je u prošlom broju “Vremena” u ovoj rubrici četbot sam objasnio ko je, šta je i čemu služi, možda je još uvek bolje da to uradi živ čovek.

Srećna nova 202GPT3 3
…i Jug Grizelj

Ideja da se napravi računar koji bi razmišljao kao čovek postoji od nastanka prvih ozbiljnih kompjutera, polovinom prošlog veka. Do pre nekoliko godina, to se uglavnom svodilo na ubacivanje velikog broja mogućih odgovora na pitanja i sposobnost softvera da ih prepozna i pronađe onaj koji je najprimereniji. Zbog toga su prvi superkompjuteri bili odlični u šahu. Mogli su se nafilovati velikim brojem kombinacija, tako da su za tren predviđali dalji tok partije i birali najbolji potez, bez greške. Superiorno u odnosu na svetskog prvaka Garija Kasparova, koji je pristao da igra sa takvim kompjuterom i na kraju izgubio.

Ali šah je igra kombinacija, a razmišljanje i zaključivanje je nešto drugo, pa je sa nastankom dubokog učenja došlo vreme da se sa kompjuterom zaigra “nastavi niz”. To je, otprilike, metod koji koriste Generativni obučeni transformeri (Generative Pretrained Transformers – GPT). U osnovi su algoritmi koji posle jedne napisane reči predviđaju koja bi mogla da bude sledeća. Onda reči nižu po gramatičkim pravilima oblikujući smislene rečenice.

Ovi softveri po istom principu sebi prevode pitanja koja smo im postavili, i onda iz baze koju smo im omogućili sastavljaju najbolji mogući odgovor. Ono što je važno je da mi taj odgovor redigujemo, ispravimo greške ako ih ima, i to botu damo na uvid. Bot ispravke uzima u obzir za naredne upite. Dovoljno je “pokazati” mu jednom, a ako se sa njim malo više radi, biće sposoban da piše vrlo nalik onome ko ga obučava. To je ovaj pretrained (obučeni) deo u njegovom imenu.

Prvi GPT pojavio se 2018. godine i imao je 117 miliona parametara. Treća generacija, samo četiri godine kasnije, ima 174 milijarde parametara, gotovo 1.500 puta više. Rast je logaritamski, a ovo je tek početak u odnosu na potencijal.

Pre nego što se okrenemo budućnosti, da vidimo šta nam GPT3 nudi trenutno. Na adresi https://openai.com/blog/chatgpt/ moguće je besplatno testirati čet bota tako što možete da mu postavite pitanje (i na srpskom jeziku, ćirilicom) ili neki zahtev na koji može da odgovori u pisanom obliku. Ako pitanje nije previše komplikovano, bot počinje da niže reči čim kliknete Enter. Ako mu je teže, može proći i minut pre nego što odgovor krene. Odgovara na jeziku na kojem je pitan.

Odgovor je uvek smislen, ali nije obavezno dobar. Recimo, kada sam ga pitao o Briselskom sporazumu, dobio sam odgovor o Dejtonskom sporazumu. Ali kada sam dodao “Beograda i Prištine”, odgovor je bio vrlo prihvatljiv. Znatno slabiji je bio kod biografije Siniše Mihajlovića, kojeg je “našao” da je igrao u Engleskoj i Španiji i da je i dalje selektor reprezentacije Srbije. Ali je neke druge odgovore davao vrlo tačno i precizno, dakle, daleko je od savršenog, ali može takav da bude na trenutke. Razlog za ovu nepreciznost je što ova verzija bota ne pretražuje internet već sopstvenu bazu, što ima i dobru i lošu stranu. O tome pri kraju teksta.

Čet bot će vam posle svakog odgovora napomenuti da je raspoložen da uči i zamoliti vas da mu ukažete na greške kako ih ne bi ponovio. Nisam bio u prilici da ga dovoljno testiram da bih mogao da svedočim o njegovom napredovanju pod mojom upravom. Ne sumnjam da bi me napredak ostavio bez daha, jer se ni sa ovim što nam je dato na pregled nisam mnogo nadisao.

Prvi utisak, meni novinaru, jeste da će profesija biti desetkovana. Čak i ovakav kakav je, čet bot bi mogao da zameni veliki broj onih koji pišu u frazama, čak i da bude zanimljiviji ukoliko mu se ponudi dobra teza koju samo treba da razradi. Sportski izveštaji, na kakve smo navikli, biće prvi na udaru. Četbot će moći da prati tok utakmice ili takmičenja iz minuta u minut, teoretski bi informacije mogao da dobija od senzora postavljenih po terenu, lopti i na telima sportista i da na osnovu njihovog kretanja zaključi šta se dešava. Čak i da komentariše suđenje ukoliko zaključi da je u suprotnosti sa podacima koje je prikupio.

Pošto se takmičenje završi, a na osnovu prikupljenih podataka i naučenih modela, bot bi u sekundi napisao izveštaj i poslao ga na objavu. Sportski događaji su možda i najbolji za ovu vrstu kompjuterske asistencije jer su već pokriveni obimnom statistikom. Samo je potrebno “uglazbiti” je, odnosno pretvoriti u pismen i zanimljiv tekst. Što bot i u sadašnjoj verziji može da uradi. I više od toga – ako mu zatražite, napisaće vam ceo izveštaj u stihovima ne tražeći za to više vremena ili posebnu novčanu nadoknadu. Pa vi vidite.

Slično bi moglo da se radi i kod izveštaja o saobraćajnim i drugim nesrećama, i sličnim događajima gde je samo potrebno nafilovati ga osnovnim informacijama, ko, šta, gde, kada i zašto. Ko u tome bude bio vešt ili ko se dobro poveže sa zvaničnim izvorima, imaće obilje medijskih priloga koji se neće razlikovati od onih pisanih ljudskom rukom, sem u odsustvu slovnih i gramatičkih grešaka.

Ono u čemu bot ne bi mogao da nadmaši čoveka jesu kreativne i duhovite misli, mada bi mogao da nauči da to oponaša. S tim što je suština kreativnosti u tome da stvarate nešto novo, ono što niko, pa ni bot još nije video, pa nije mogao ni da se obuči. Ko želi da ostane u novinarstvu moraće da se osloni na svoj talenat. Ako ga nema, neće imati posla, baš kao što su iz redakcija iščezli daktilografi onoga trenutka kada su se kompjuteri omasovili. Selekcija će biti nemilosrdna. Ako kompjuterski generisani tekstovi budu značajniji i čitaniji od mojih, moraću da tražim drugi ili drugačiji posao. Analitiku već imamo spremnu.

Na internetu su se odmah pojavili komentari da je ova situacija, za novinarstvo, slična sredini devedesetih prošlog veka kada smo “otkrili” web. Većina medija, posebno štampanih, tada je s visine gledala na pojavu interneta, mnogi su tvrdili da se nikada neće odreći čitanja s papira u korist kompjuterskog monitora jer je samo to pravi doživljaj. Danas svi čitamo sa mobilnog telefona. Ti komentatori kažu da je GPT3 đavo sada došao po novinarske poslove, ako se novinari sami ne presaberu i ne ponude ono što kompjuter ne može. Prostor nije mali, ali je za mnoge koji su danas u novinarstvu visoko. Nije nedostižno, ali mora mnogo da se vežba. Slikovito, svako od nas moraće da bude bolji nego Kasparov u šahu. Možda je ovo preterano, ali je barem pokušaj da budem duhovitiji od kompjutera.

Ako se neko pomalo plaši takve budućnosti, možda mu je tračak svetlosti to da bi kompjuteri mogli biti istrenirani da ne prave lažne vesti i da ne nasedaju na glasine, već da objavljuju samo proverene informacije. I tu postoji amandman, jer bi neko mogao da zakupi server i onda krene da ga dresira potpuno suprotno, da ga uči da je zemlja ravna ploča, a da je vakcina zlo i takav transformer bi mu uzvratio savršenim tekstovima koji pravdaju pomenute teze. Dakle, do nas je čemu ćemo ga učiti, kao i da li ćemo ga pustiti da se sam informiše na internetu ili ćemo mu ograničiti prostor na bazu koju smo sami odredili. Ovo drugo je bolje, ali skuplje.

Tu dolazimo i do komercijalnog momenta. OpenAI je profitna organizacija. Jedan od pokretača je bio Ilon Mask, ali se pre pandemije povukao zbog konflikta interesa sa sličnim projektom u Tesli. Važan investitor je Majkrosoft i može se očekivati da četbotovi postanu deo MS paketa, recimo da budu ugrađeni u Word i da pomažu u pisanju tekstova. Ali to bi značilo da redakcija mora da plati licencu, pa će se novinarska budućnost svesti na trenutak kada ta licenca bude jeftinija od redakcijskih plata.

Da ne bude da su samo novinarski poslovi na udaru, smatra se da će i programeri masovno koristiti ovakve botove za pisanje programskog koda koji je predvidljiv, jednostavan, ali neophodan, dakle, smanjiće se broj onih koji ne rade kreativno, a poskupeće rad ovih drugih.

Četbotovi će, vrlo verovatno, naći odličnu primenu kod pisanja udžbenika i predavanja. Osim što će biti razumljiviji, precizniji i brži, u nekim slučajevima će autorska prava svesti na trošak licence da se bot zakupi.

Najviše će se obradovati pisci saopštenja i drugi kojima je na leđa natovaren administrativni posao, poput lekara ili sudija. Oni će davati dijagnoze ili deliti pravdu, a izveštaje i presude pisaće kompjuter sam. Biće sposoban da upozori na eventualnu nelogičnost ili koliziju sa višim zakonima ili praksom.

Da ne bude sve tako negativno po novinare, četbotovi će moći odlično da se primene za pisanje pratećih informacija, odnosno stavljanja u kontekst, za ne preterano kreativne stvari i za to se koristi već danas. S tim da bi sindikati morali da se izbore za to da se tekstovi ili novinarski radovi koje je potpuno ili delimično napravio bot obeleže kao što se obeležava GMO hrana. Korisnik informacije, baš kao i kod hrane, mora da zna poreklo onoga što unosi u sebe. Nema razloga da se sintetizovana informacija plaća jednako skupo, ne daj Bože skuplje nego ona kreirana ljudskim radom.

Sve ovo, naravno, važi na nivou treće generacije četbotova i uz očekivanja da će naredne generacije biti usavršene verzije. Ali i dalje bez emocija i empatije, bez dubokog osećaja za politiku i uživanja u umetnosti ili sportu. To je onih jedan ili manje od jedan odsto arome, recimo soli, bez koje nam je hleb bljutav koliko god da lepo izgleda. Nećemo mnogo čekati na proveru, GPT-4 izlazi već ove godine i biće hiljadu puta bolji od GPT-3 koji nas već dovoljno plaši.

Iz istog broja

TV manijak

Pregled 2022: Hibridni mir

Dragan Ilić

Arhiva nedeljnika Vreme>

Pogledajte arhivu