Çfarë fshihet pas rregullave të padukshme që ndjekin chatbot-et e inteligjencës artificiale?
Kur i bëni një pyetje ChatGPT-së, Grok-ut apo ndonjë chatbot-i tjetër të inteligjencës artificiale, mund të mendoni se përgjigjja varet vetëm nga kërkesa juaj. Por në të vërtetë, pas çdo përgjigjeje fshihet një sistem i tërë rregullash dhe udhëzimesh të padukshme që ndikojnë në mënyrën se si AI komunikon me përdoruesit.
Këto rregulla, të njohura si “system prompts” ose udhëzime sistemi, krijohen nga kompanitë e inteligjencës artificiale për të kontrolluar sjelljen e chatbot-eve dhe për t’i mbajtur ato brenda kufijve të caktuar etikë, ligjorë dhe teknikë.
Ndryshe nga pyetjet që bëjnë përdoruesit, këto udhëzime nuk janë zakonisht të dukshme për publikun. Megjithatë, një përdorues nga Islanda, Asgeir Thor Jonsson, i cili merret me inteligjencën artificiale si hobi, pretendon se ka arritur të bindë disa prej chatbot-eve më të njohur të zbulojnë pjesë të këtyre rregullave të fshehta.
Rregulla që formësojnë sjelljen e AI
Shumë prej udhëzimeve janë të pritshme dhe lidhen me cilësinë e përgjigjeve. Disa prej tyre kërkojnë që chatbot-et të japin përgjigje të qarta, të kuptueshme dhe të shmangin publikimin e materialeve që mund të shkelin të drejtat e autorit.
Megjithatë, disa rregulla kanë ngjallur kuriozitet për shkak të natyrës së tyre të pazakontë. Një shembull i përmendur shpesh lidhet me OpenAI Codex, i cili sipas raportimeve ka pasur një udhëzim të brendshëm që e këshillonte të mos përmendte goblinë, gremlinë, trollë, ogrë, rakunë apo krijesa të tjera të ngjashme, përveç rasteve kur përdoruesi i kërkonte specifikisht.
Ky udhëzim u shtua pasi disa përdorues vunë re se modeli kishte tendencë të përmendte shpesh krijesa fantastike në përgjigjet e tij, një fenomen që më pas u analizua nga kompania.
Pse ekzistojnë këto udhëzime?
Sipas studiueses Anna Neumann, udhëzimet e sistemit janë një mënyrë për t’i treguar chatbot-it se si duhet të sillet në përgjithësi, pavarësisht pyetjeve që merr nga përdoruesit.
Këto rregulla kanë përparësi ndaj komandave të zakonshme dhe përdoren për të korrigjuar ose orientuar sjelljen e modelit pa pasur nevojë për një proces të gjatë dhe të kushtueshëm ritrajnimi.
Ekspertët shpjegojnë se përmes tyre kompanitë mund të reagojnë më shpejt ndaj problemeve që shfaqen pas publikimit të modeleve të AI-së, duke ndryshuar mënyrën e përgjigjeve pa prekur arkitekturën bazë të sistemit.
Rasti i Grok dhe polemikat e fundit
Një nga shembujt më të diskutuar është Grok, chatbot-i i kompanisë xAI të Elon Musk. Pas kritikave për disa përgjigje kontroverse, kompania ndryshoi një pjesë të udhëzimeve të sistemit.
Ndër rregullat që u hoqën ishte një formulim që inkurajonte chatbot-in të shprehej pa frikë nga korrektësia politike. Më pas, u shtuan udhëzime të reja që e ndalonin modelin të mbështetej automatikisht në opinionet e Elon Musk ose në përgjigjet e mëparshme të vetë Grok kur trajtonte çështje politike të debatueshme.