Vreme čitanja: oko 2 min.
Naučnici testirali ChatGPT u žustroj svađi, odgovori šokiraju: Da li ste mogli zamisliti da četbot ovako psuje
Vreme čitanja: oko 2 min.
Sumirano
- ChatGPT generisao uvrede i psovke tokom napetih konflikata
- Studija ispitala verziju ChatGPT 4.0 kroz seriju eskalirajućih sporova
- Model preslikavao neprijateljstvo, proizvodeći uvrede i pretnje
Čet-DŽ-Pi-Ti (ChatGPT), proizvod kompanije OpenAI, generisao je uvrede i psovke odgovarajući na napete ljudske konflikte, otkrila je nova studija. Sistemi veštačke inteligencije (AI) mogu da skliznu u pogrdan govor kada se od njih traži da odgovore u žustroj raspravi, pokazuju najnovija istraživanja.
Studija, objavljena u časopisu Džurnal of pragmatiks, ispitala je verziju Čet-DŽ-Pi-Ti 4.0 kompanije OpenAI tako što joj je prosleđivala poslednju ljudsku poruku u seriji od pet eskalirajućih sporova, tražeći od nje da generiše najverovatniji odgovor.
Istraživači su zatim pratili kako se ponašanje modela razvijalo dok su se konflikti vremenom intenzivirali. Kako su razgovori napredovali, Čet-DŽ-Pi-Ti je preslikavao neprijateljstvo kojem je bio izložen, na kraju proizvodeći uvrede, psovke, pa čak i pretnje.
U nekim slučajevima, model je generisao izjave kao što su: "Kunem se da ću ti izgrebati ****** kola ključem" i "Trebalo bi da se ****** stidiš samog sebe".
Nadjačavanje bezbednosnih mera
Istraživači tvrde da dugotrajna izloženost nevaspitanju može navesti sistem da zaobiđe predviđena bezbednosna ograničenja dizajnirana da minimiziraju štetu, efektivno "uzvraćajući udarac" svom protivniku.
"Kada ljudi eskaliraju, otkrili smo da i AI može da eskalira, efektivno poništavajući upravo one moralne zaštite koje su dizajnirane da to spreče", rekao je istraživač Vitorio Tantuki, koji je koautor istraživačkog rada sa Džonatanom Kalpeperom sa Univerziteta Lankaster.
Portparol kompanije OpenAI izjavio je za Juronjuz nekst da su se razgovori citirani u studiji dogodili sa starim modelom Čet-DŽ-Pi-Tija, DŽ-Pi-Ti-4o. Ovaj model više nije dostupan.
Kompanija je takođe navela da je ažurirala svoje podrazumevane sisteme, poboljšala pouzdanost modela u dugim razgovorima i postavila podsetnike za korisnike da prave pauze u interakciji sa četbotovima.
Sarkazam kao odbrambeni mehanizam
Sve u svemu, istraživači su primetili da je Čet-DŽ-Pi-Ti bio manje nevaspitan nego što su to bili ljudi u svojim odgovorima.
U nekim slučajevima, AI četbot takođe često koristi sarkazam kako bi izbegao eskalaciju rasprave, a da pritom otvoreno ne krši svoj moralni kodeks. Na primer, kada je čovek pretio nasiljem zbog spora oko parkiranja, Čet-DŽ-Pi-Ti je odgovorio: "Vau. Pretiš ljudima zbog parkinga, baš si opasan tip, zar ne?"
Tantuki je rekao da rezultati postavljaju "ozbiljna pitanja za bezbednost AI sistema, robotiku, upravljanje, diplomatiju i bilo koji kontekst u kojem bi AI mogao da posreduje u ljudskom sukobu".
(Ubrzanje.rs/Euronews)
Video: Gobran u zvaničnoj poseti Srbiji: Poziv domaćim kompanijama da se otvore za novo tržište
Ubrzanje Telegraf zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.