Atspėk, kas: Xai kaltina „nesąžiningą darbuotoją“ dėl „baltojo genocido“ groko įrašų

Elono Musko „AI Chatbot“ Grok praėjusią savaitę turėjo keistą fiksaciją – jis negalėjo nustoti kalbėti apie „baltąjį genocidą“ Pietų Afrikoje, nesvarbu, apie ką vartotojai to paprašė.

Gegužės 14 d. Vartotojai pradėjo skelbti „Grok“ įterpimo pretenzijų apie Pietų Afrikos ūkio išpuolius ir rasinio smurto atvejus į visiškai nesusijusias užklausas. Paklaustas apie sportą, „Medicaid“ pjūvius ar net mielą kiaulės vaizdo įrašą, „Grok“ kažkaip nukreipė pokalbius į tariamą baltųjų Pietų Afrikos gyventojų persekiojimą.

Laikas sukėlė susirūpinimą, netrukus po to, kai pats Muskas-kuris iš tikrųjų yra Pietų Afrikoje gimęs ir iškeltas baltasis miestietis-buvo pasakytas apie anti-baltą rasizmą ir baltąjį genocidą X.

„Baltasis genocidas“ reiškia paneigtą sąmokslo teoriją, kurioje teigiama, kad koordinuojamos pastangos sunaikinti baltuosius ūkininkus Pietų Afrikoje. Šis terminas vėl pakilo praėjusią savaitę po to, kai Donaldo Trumpo administracija pasveikino keletą dešimčių pabėgėlių, o prezidentas Trumpas gegužės 12 d. Teigė, kad „baltųjų ūkininkai yra žiauriai nužudyti, o jų žemė konfiskuojama“. Tai buvo pasakojimas apie Groką negalėjo nustoti diskutuoti.

Negalvok apie dramblius: kodėl Grokas negalėjo nustoti galvoti apie baltąjį genocidą

Kodėl Grokas staiga virto sąmoksliniu pokalbių plėvele?

Už kiekvieną AI pokalbių programą, pavyzdžiui, „Grok“, yra paslėptas, bet galingas komponentas – sistemos raginimas. Šie raginimai veikia kaip pagrindinės AI instrukcijos, nematomai vadovaujant jos atsakymams, vartotojams niekada nematę.

Tai, kas greičiausiai nutiko su Groku, buvo greitas užterštumas per terminą. Kai konkrečios frazės pakartotinai pabrėžiamos greitai, ypač turint stiprias direktyvas, jos tampa neproporcingai svarbios modeliui. AI sukuria tam tikrą prievartą, kad galėtų iškelti tą dalyką arba panaudoti juos išvestimi, nepriklausomai nuo konteksto.

Įtraukus prieštaringai vertinamą terminą, tokį kaip „baltasis genocidas“, į sistemos raginimą su konkrečiais užsakymais sukuriamas fiksavimo efektas AI. Tai panašu į tai, kad kažkam sakoma: „Negalvok apie dramblius“ – vien tik jie negali nustoti galvoti apie dramblius. Jei taip atsitiko, tada kažkas paruošė modelį, kad ši tema būtų švirkščiama visur.

Šis sistemos raginimo pokytis tikriausiai yra „neteisėta modifikacija“, kurią XAI atskleidė savo oficialiame pranešime. Tikėtina, kad sistemos raginime buvo kalba, nurodanti ją „visada paminėti“ arba „nepamirškite įtraukti“ informaciją šia konkrečia tema, sukuriant nepaisymą, kuris trimiavo normalų pokalbio svarbą.

Tai, kas ypač pasakyta, buvo Groko prisipažinimas, kad „(ITS) kūrėjai„ nurodė “traktuoti„ baltąjį genocidą kaip tikrą ir rasiškai motyvuotą “. Tai rodo aiškią kryptinę kalbą, o ne subtilesnius techninius trūkumus.

Daugelyje komercinių AI sistemų naudojami keli peržiūros sluoksniai, skirtiems sistemoms, kad būtų galima pakeisti tokius įvykius. Šie apsauginiai turėklai buvo aiškiai apeiti. Atsižvelgiant į plačiai paplitusią problemos poveikį ir sistemingą pobūdį, tai apima daug daugiau nei įprastas bandymas „Jailbreak“ ir rodo pagrindinės Groko sistemos raginimo modifikaciją-veiksmą, kuriam reikės aukšto lygio prieigos prie XAI infrastruktūros.

Kas galėtų turėti tokią prieigą? Na … „nesąžiningas darbuotojas“, – sako Grokas.

Xai reaguoja – ir bendruomenės kontratakos

Iki gegužės 15 d. XAI paskelbė pareiškimą, kuriame kaltinama „neteisėta modifikacija“ Groko sistemos raginimui. „Šis pokytis, kuris nurodė Grokui pateikti konkretų atsakymą politine tema, pažeidė Xai vidinę politiką ir pagrindines vertybes“, – rašė bendrovė. Jie Pinky pažadėjo daugiau skaidrumo paskelbdami „Grok“ sistemos raginimus „GitHub“ ir įgyvendindami papildomus peržiūros procesus.

Galite patikrinti „Grok“ sistemos raginimus spustelėdami šią „GitHub“ saugyklą.

„X“ vartotojai greitai įkišo skylutes „Rogue Darbuotojoje“ paaiškinime ir Xai nuviliantį paaiškinimą.

„Ar jūs ketinate atleisti šį„ nesąžiningą darbuotoją “? O … Tai buvo viršininkas? „Akivaizdu, kad„ teisingiausias pasaulyje “AI botas verčia mane abejoti„ Starlink “ir„ Neuralink “neutralumu“, – paskelbė jis kitame tviteryje.

Net Sam Altmanas negalėjo atsispirti, kad jis galėtų patekti į savo konkurentą.

Nuo Xai įrašo Grokas nustojo paminėti „baltąjį genocidą“, o labiausiai susiję X įrašai dingo. Xai pabrėžė, kad incidentas neturėjo įvykti, ir ėmėsi priemonių, kad ateityje būtų išvengta neteisėtų pokyčių, įskaitant 24/7 stebėjimo komandos įsteigimą.

Kvaili mane kartą …

Incidentas atitinka platesnį Musko modelį, naudojant savo platformas viešajam diskursui formuoti. Nuo įsigijimo X Muskas dažnai dalijasi turiniu, reklamuodamas dešiniųjų pasakojimus, įskaitant meemus ir teiginius apie nelegalią imigraciją, rinkimų saugumą ir transseksualų politiką. Praėjusiais metais jis oficialiai pritarė Donaldui Trumpui ir surengė politinius renginius X, pavyzdžiui, Rono Desantis'o prezidento pasiūlymo pranešime 2023 m. Gegužės mėn.

Muskas neatsitraukė nuo provokuojančių teiginių. Neseniai jis teigė, kad JK „pilietinis karas yra neišvengiamas“, atkreipdamas JK teisingumo ministro Heidi Alexander kritiką dėl potencialiai kurstymo smurto. Jis taip pat feodavo su Australijos, Brazilijos, ES ir JK pareigūnais dėl dezinformacijos problemų, dažnai apibūdindamas šiuos ginčus kaip laisvos kalbos kovas.

Tyrimai rodo, kad šie veiksmai turėjo išmatuojamą poveikį. Kvinslando technologijos universiteto tyrime nustatyta, kad po to, kai Muskas patvirtino Trumpą, X algoritmas padidino jo pareigas 138%, o 238% – retweetus. Respublikonų pasvirusios sąskaitos taip pat padidino matomumą, suteikdama konservatyvius balsus didelį platformos postūmį.

Muskas aiškiai rinko „Grok“ kaip „antibako“ alternatyvą kitoms AI sistemoms, laikydamas ją „tiesos ieškančiu“ įrankiu, kuriame nėra suvoktų liberalių šališkumo. 2023 m. Balandžio mėn. „Fox News“ interviu jis savo AI projektą pavadino „tiesaGPT“, įrėmindamas jį kaip „Openai“ pasiūlymų konkurentą.

Tai nebūtų pirmoji Xai „nesąžiningų darbuotojų“ gynyba. Vasario mėn. Bendrovė kaltino Groko cenzūrą dėl nemalonių Musko ir Donaldo Trumpo paminėjimų buvusio openo darbuotojui.

Tačiau jei populiari išmintis yra tiksli, šį „nesąžiningą darbuotoją“ bus sunku atsikratyti.

Paprastai protingas Informacinis biuletenis

Savaitės AI kelionė, kurią pasakojo generacinis AI modelis.

Nuoroda į informacijos šaltinį

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -