Svet

Intervju – Goran S. Milovanović, psiholog i data naučnik

Analitika digitalnih života 2

foto: vladimir milovanović

Analitika digitalnih života

"Kembridž analitika kaže: ‘Mi pročitamo profil, mi razumemo ličnost i mi veoma uske segmente populacije gađamo ciljanim reklamama, napravljenim samo za njih, da baš njih gađaju u žicu.’ Ako vam ja kažem da ću to uraditi na osnovu naučnog rada koji mi je pokazao da na osnovu tih informacija ja mogu da znam, grubo da se izrazim, 18 od 100 posto, koliko biste vi mene platili da ja uđem u vašu kampanju, potrošim vam budžet i radim tako nešto?"

O skandalu koji je izbio u vezi sa pričom da je 50 miliona Fejsbuk profila britanska konsultantska firma Kembridž analitka navodno koristila u predsedničkoj kampanji Donalda Trampa 2016, "Vreme" razgovara sa dr Goranom S. Milovanovićem, psihologom i data naučnikom. Milovanović je pre više od petnaest godina uz podršku Beogradske otvorene škole osnovao Centar za proučavanje informacionih tehnologija i tamo zajedno sa kolegama od 2002. do 2005. sproveo prve studije o upotrebi interneta na prostorima jugoistočne Evrope. Danas radi kao data naučnik na sistemu Vikidata za Vikimedija Dojčland i kao mentor u istoj oblasti za polaznike američke kompanije Springbord.

"VREME": Šta se zaista desilo u slučaju Kembridž analitike?

GORAN S. MILOVANOVIĆ: Istraživač Aleksandar Kogan je svojevremeno postavio Fejsbuk aplikaciju preko koje je pokušao da primeni naučnu metodu, poznatu, zapravo, još pre njegovog rada, pomoću koje bi na osnovu toga šta ljudi rade na Fejsbuku, šta lajkuju, kako se to kolokvijalno kaže, pokušao da donese zaključke o profilima ličnosti ljudi koji su koristili tu aplikaciju. Postavivši tu aplikaciju u rad i zahvaljujući podešavanjima privatnosti koja su tada postojala na Fejsbuku, a to se dešava pre 2015. kad je Fejsbuk uveo promene u podešavanja, došlo je do toga da, ako vi uzmete tu njegovu aplikaciju koja se zvala My digital life i pristanete da je koristite, vi Koganu, sasvim legalno u tom trenutku, dajete pravo pristupa vašem Fejsbuk profilu. Da razjasnimo šta to tačno znači – to ne znači da on može da čita vaše privatne poruke, ali znači ako ste vi sebe na profilu opisali kao, recimo, čoveka čiji su politički pogledi liberalni, koji je muškog roda, koji je u vezi ili nije ili je razveden, ima izvestan broj prijatelja, onda je sigurno mogao da ima uvid u te podatke. Ta vrsta dila između korisnika i neke Fejsbuk aplikacije odnosno njenog vlasnika je sasvim uobičajena. Vi znate da će vas većina aplikacija na Fejsbuku pitati: "Da li si svestan da ćeš ovoj aplikaciji dati pristup svojim fotografijama, listi svojih prijatelja i slično?" Vi najčešće kažete: "Ok, da, može" i pristupite tome.

Koje je podatke iz profila korisnika tražila aplikacija My digital life?

Ne znam precizno. U svakom slučaju, imala je pristup profilu korisnika koji joj je pristupio. Ali, zapravo, nije od suštinske važnosti šta je ta aplikacija u tom trenutku tražila. U trenutku kada je Aleksandar Kogan postavio svoju aplikaciju, podešavanja privatnosti naloga na Fejsbuku omogućavala su da ako korisnik preuzme neku aplikaciju, tada vlasnik te aplikacije dobija pristup svim profilima prijatelja tog korisnika. Ta podešavanja Fejsbuk je promenio 2015. Rekli su: "Od sada će vlasnici aplikacija imati pristup profilima samo onih korisnika koji su je preuzeli i prihvatili uslove korišćenja, odnosno koji su dali dozvolu za pristup profilu." Aleksandar Kogan je legalno dobio podatke za 270 000 do 300 000 (to su brojevi koji se pominju) profila onih koji su njegovu aplikaciju preuzeli. E, sad, uzmite i pomnožite taj broj sa koliko je, u proseku, svaki od tih profila mogao da ima prijatelja. Kao rezultat sve češće se pominje broj od 50 miliona. Kako izbija ceo skandal? Još 2015. Fejsbuk saznaje preko novinara "Gardijana" da je Aleksandar Kogan podatke koje je prikupio o korisnicima dao firmi Kembridž analitika (KA). A njima ti podaci trebaju, kao što sam na početku rekao, da bi primenom izvesne naučne metodologije pokušali da na osnovu tih profila definišu psihološke profile ličnosti.

Da li je Kogan te podatke prodao ili ustupio?

Ne znam tačno kakav je dil bio između Kogana i KA. Sve u svemu, Fejsbuk to sve saznaje 2015. i kažu Aleksandru Koganu da nema pravo da podatke koje je od Fejsbuka dobio (legalno u trenutku kad ih je pribavio) da trećoj strani za komercijalnu upotrebu. Fejsbuk traži formalnu potvrdu i od jedne i od druge strane da su podaci obrisani i dobija je. Međutim, u martu ove godine saznajemo od bivšeg direktora istraživanja Kembridž analitike Kristofera Vajlija da ti podaci, zapravo, nisu obrisani i da se oni za oko 50 miliona korisnika Fejsbuka i dalje nalaze u rukama KA. Takođe, tvrdi se da je ta firma koristila ove podatke da bi napravila psihografsku analizu korisnika Fejsbuka. Ja znam šta je KA mogla da pokuša da uradi sa tim podacima jer je to potpuno jasno iz njihove reklame. Oni tvrde da psihografski metod nisu koristili za kampanju Donalda Trampa 2016.

Pa, oni su već jednom Fejsbuku rekli da su obrisali podatke, pa se ispostavilo da nisu.

Kriza je živa. Više tela u SAD, Velikoj Britaniji, a sigurno će reagovati i EU ako već nije, traže saslušanja u Fejsbuku, KA, a sigurno će doći i do samog Aleksandra Kogana koji radi na Univerzitetu Kembridž. Moraćemo da sačekamo da bismo znali šta se tačno dogodilo.

Ukoliko KA jeste primenila psihografske metode na podatke koje je dobila od Kogana za kampanju Donalda Trampa, šta su mogli da postignu?

Činjenica je da je Majkl Kosinski, istraživač koji je takođe radio na Univerzitetu Kembridž, a kojeg je Kogan pokušao da angažuje da sarađuje sa KA, do čega, iz nekog razloga, nije došlo, dokazao sa svojim saradnicima u naučnom radu iz 2011. da može za neke stvari sa fascinantnom tačnošću da pogodi podatke o osobama samo na osnovu toga koje Fejsbuk fan stranice te osobe prate. Svi su bili fascinirani podacima do kojih je Kosinski došao. On je pokazao da na osnovu vrlo malog broja nečijih lajkova, a do toga ste mogli vrlo lako da dođete, sa priličnom tačnošću, za neke osobine i sa više od 80 procenata, može da kaže da ste vi osoba određenog pola, koliko godina imate, vaš etnicitet je ovaj, vaša seksualna orijentacija je ona…

Takođe, ono što je Kembridž analitici bilo najinteresantnije jeste da su prilično uspešno mogli da kažu da li je osoba politički liberalna ili konzervativna (čak 85 odsto). To je gruba dihotomija, ali kada imate stabilan dvopartijski sistem kao u SAD, onda vam mnogo znači da imate tu informaciju, jer znate sa velikom verovatnoćom da će neko ko je psihološki proliberalan tip pre glasati za Demokratsku stranku, a neko ko je konzervativniji će vrlo verovatno glasati za republikance. A, to su odsudne stvari na američkim izborima.

Za neke osnovne varijable Kosinski je pokazao da iz osnovnih opisa ljudi prilično tačno može da pogodi kojoj grupi ti ljudi pripadaju sa relativno malo informacija koje ta osoba ostavi na Fejsbuku. Svi su se time oduševili. Kosinski je, takođe, pokazao da on na osnovu minimalnih podataka o ponašanju na internetu može da postigne izvesnu korelaciju, osrednju mogućnost predviđanja nečijih rezultata na poznatim i standardizovanim testovima ličnosti. Najpoznatiji model ličnosti je baziran na psihološkom testu na kojem se radilo decenijama i koji je, psihometrijski posmatrano, najstabilniji test ličnosti. Skoro isključivo se i danas koristi. To je takozvani OCEAN model zasnovan na pet faktora, koji kaže da svaku ličnost možete da opišete u nekih pet dimenzija: neuroticizam, ekstroverzija, otvorenost, saradljivost i savesnost.

Kosinski je u svom, sada već poznatom, naučnom radu pokazao da može da postigne korelaciju od 0,43 vaših podataka na Fejsbuku sa vašim rezultatom na testu što se tiče otvorenosti. Korelacija se kreće u vrednostima od minus jedan, preko nula do jedan. Ako ima vrednost jedan, to znači da ja nekim faktorom, nekom informacijom mogu potpuno savršeno da predviđam neku drugu informaciju. Zamislite kad bih mogao na osnovu vaše visine da pogodim koliko godina obrazovanja vi imate. Sumanut primer, koji sigurno ne radi. Ali, ako bi korelacija između vaše visine i vašeg obrazovanja bila perfektna i kad bih ja mogao da kažem da čovek visine 160 centimetara ima šest razreda osnovne škole, a čovek od 210 sigurno ima doktorat, ta bi korelacija iznosila jedan.

E, sad, vidite, on je na skali od nula do jedan stigao do 0,43 predviđajući osobinu otvorenosti i to je njegov najbolji rezultat. Jedna stvar je akademski rad, da biste razumeli koliku to praktičnu vrednost ima, vi morate tih 0,43 da dignete na kvadrat gde ćete dobiti 0,18 i mi, tehnički, možemo da kažemo da je to 18 odsto objašnjene varijanse. Zamislite da vam ja kažem: "Vidi, ova osoba ima te i te osobine i ja predviđam da će ona sutra da glasa za partiju A i ako hoćeš da je okreneš ka partiji B, za nju moraš da imaš vrlo specifičnu reklamu", a upravo je to takozvani mikrotargeting u marketingu za koji KA kaže da radi.

Oni kažu: "Mi pročitamo profil, mi razumemo ličnost i mi vrlo uske segmente populacije gađamo ciljanim reklamama, napravljenim samo za njih, da baš njih gađaju u žicu." Ako vam ja kažem da ću to uraditi na osnovu naučnog rada koji mi je pokazao da na osnovu tih informacija ja mogu da znam, grubo da se izrazim, 18 od 100 posto, koliko biste vi mene platili da ja uđem u vašu kampanju, potrošim vam budžet i radim tako nešto? Ako je Kembridž analitika, ili bilo koja druga firma u tom poslu, išla naokolo i prodavala svoju reklamu govoreći da će na osnovu nečijeg ponašanja na Fejsbuku pročitati njegov profil ličnosti i na osnovu toga napravi reklamu baš za tu osobu ili tu mikrogrupu, onda je taj neko, hajde da se ne izrazim grublje, bio, u najmanju ruku, profesionalno strašno neoprezan. Ja otvoreno moram da kažem, kao neko ko je proveo godine upravo se baveći primenom matematike u psihologiji i društvenim naukama, da su oni time, iako su primenili taj metod, mogli da postignu minimalne efekte, teško merljive, verovatno na ivici neke statističke greške. Mnogobrojne naučne studije svedoče da je to zaista tako.

Ako od 50 miliona profila za polovinu imate korelaciju od 18 procenata i vi targetirate tih 25 miliona, čisto statistički ste dobili mogućnost da utičete na 18 posto njih što je oko 4,5 miliona potencijalnih glasača. U SAD u poslednje vreme izbore odlučuje razlika u nekoliko stotina hiljada glasova. Zar je 4,5 miliona malo?

Kada bi problem mogao da se postavi na takav način. Tih 0,43 korelacije Kosinskog dignuto na kvadrat uopšte ne govori da ćete vi pogoditi 18 posto populacije. Zamislite samo jednog pojedinca. Njegova otvorenost kao osobina ličnosti govori na neki način kakve odluke donosi. Ovo je užasno pojednostavljen model, samo da vam pokažem da ti brojevi ne znače ništa. Pretpostavimo da vi treba da proučavate nečije ponašanje samo na osnovu njegove otvorenosti, a to nije moguće, ali, hajde samo da pretpostavimo. To znači da na osnovu toga šta on radi na Fejsbuku vi možete da 18 posto variranja njegove otvorenosti predvidite. Dakle, samo za jednog čoveka nama ostaje 82 posto fenomena njegove otvorenosti potpuno neobjašnjeno.

Ali pored otvorenosti, nama OCEAN model kaže da imamo i neuroticizam, ekstroverziju, savesnost i saradljivost. A to je, opet, samo opis dimenzija ličnosti. Gde vam je podatak o tome da li je taj čovek na datum izbora, kojeg ste vi prethodno targetirali da glasa za partiju A, B ili C ili da kupi neki proizvod, svejedno, ustao ujutru, saznao da mu se razbolela dobra prijateljica iz gimnazije koja je bila vatreni liberal, i iz čisto emotivnih razloga odlučio da promeni odluku iz prokonzervativne u proliberalnu? Šta sa čovekom koji ima psihološki profil demokratskog glasača, i koga sedam dana pred izbore prosto iznervira ponašanje nekog elektora u njegovoj sredini? Vi prosto ne možete, niko ne može, imati sve pod kontrolom i imati uvid u sve. Pa i tada preostaju teški problemi adekvatnog matematičkog opisa svih tih informacija.

Naučne studije nam takođe pokazuju tako nešto, da je predviđati realno, svakodnevno ljudsko ponašanje na osnovu rezultata laboratorijskih studija ili psiholoških testova skoro potpuno neefikasno. I to da, iz razloga tehničke složenosti, ne ulazimo u još teže probleme odnosa klasične i reprezentacione teorije merenja u psihologiji, od kojih se prva još uvek najčešće koriste u psihologiji ličnosti, a druga, složenija, u na primer donošenju odluka, koji bi nam tek pružili ilustraciju težine problema predviđanja ljudskog ponašanja u realnom okruženju.

Dakle, šta je tu problem, sa svim tim igrama? Problem je, a svi mi koji smo se bavili matematičkim opisom ljudskog ponašanja to smo dobro naučili, što je broj faktora, broj uzročnika, širina konteksta koja utiče na nečije ponašanje tolika da nema jednog testa, jedne metode, jednog merenja koje vama može da napravi bilo koju vrstu psihološke fotografije ili psihografije, kako tvrdi Kembridž analitika, jedne osobe koja će da važi sledećih godinu dana i kaže da 100 posto znamo: "Ovaj je liberalan, on glasa za leve partije, ovaj je konzervativan, on glasa desno." To uraditi, to je na ivici nemogućeg.

Iz istog broja

Afera – Kembridž analitika

Šta ti sve Fejsbuk može

Zoran Stanojević

Francuska – Istraga protiv Nikole Sarkozija

Libijska veza

Momir Turudić

Arhiva nedeljnika Vreme>

Pogledajte arhivu