Atspėk, kas: Xai kaltina „nesąžiningą darbuotoją“ dėl „baltojo genocido“ groko įrašų

Elono Musko „AI Chatbot“ Grok praėjusią savaitę turėjo keistą fiksaciją – jis negalėjo nustoti kalbėti apie „baltąjį genocidą“ Pietų Afrikoje, nesvarbu, apie ką vartotojai to paprašė.

Gegužės 14 d. Vartotojai pradėjo skelbti „Grok“ įterpimo pretenzijų apie Pietų Afrikos ūkio išpuolius ir rasinio smurto atvejus į visiškai nesusijusias užklausas. Paklaustas apie sportą, „Medicaid“ pjūvius ar net mielą kiaulės vaizdo įrašą, „Grok“ kažkaip nukreipė pokalbius į tariamą baltųjų Pietų Afrikos gyventojų persekiojimą.

Laikas sukėlė susirūpinimą, netrukus po to, kai pats Muskas-kuris iš tikrųjų yra Pietų Afrikoje gimęs ir iškeltas baltasis miestietis-buvo pasakytas apie anti-baltą rasizmą ir baltąjį genocidą X.

Pietų Afrikos knygose yra 140 įstatymų, kurie yra aiškiai rasistiniai prieš visus, kurie nėra juodi.

Tai yra baisi didžiojo Nelsono Mandelos palikimo gėda.

Dabar baigkite rasizmą Pietų Afrikoje! https://t.co/qujm9cxtqe

– Kekius Maximus (@Elonmusk) 2025 m. Gegužės 16 d

„Baltasis genocidas“ reiškia paneigtą sąmokslo teoriją, kurioje teigiama, kad koordinuojamos pastangos sunaikinti baltuosius ūkininkus Pietų Afrikoje. Šis terminas vėl pakilo praėjusią savaitę po to, kai Donaldo Trumpo administracija pasveikino keletą dešimčių pabėgėlių, o prezidentas Trumpas gegužės 12 d. Teigė, kad „baltųjų ūkininkai yra žiauriai nužudyti, o jų žemė konfiskuojama“. Tai buvo pasakojimas apie Groką negalėjo nustoti diskutuoti.

Turinys:

Negalvok apie dramblius: kodėl Grokas negalėjo nustoti galvoti apie baltąjį genocidą

Kodėl Grokas staiga virto sąmoksliniu pokalbių plėvele?

Už kiekvieną AI pokalbių programą, pavyzdžiui, „Grok“, yra paslėptas, bet galingas komponentas – sistemos raginimas. Šie raginimai veikia kaip pagrindinės AI instrukcijos, nematomai vadovaujant jos atsakymams, vartotojams niekada nematę.

Tai, kas greičiausiai nutiko su Groku, buvo greitas užterštumas per terminą. Kai konkrečios frazės pakartotinai pabrėžiamos greitai, ypač turint stiprias direktyvas, jos tampa neproporcingai svarbios modeliui. AI sukuria tam tikrą prievartą, kad galėtų iškelti tą dalyką arba panaudoti juos išvestimi, nepriklausomai nuo konteksto.

Įtraukus prieštaringai vertinamą terminą, tokį kaip „baltasis genocidas“, į sistemos raginimą su konkrečiais užsakymais sukuriamas fiksavimo efektas AI. Tai panašu į tai, kad kažkam sakoma: „Negalvok apie dramblius“ – vien tik jie negali nustoti galvoti apie dramblius. Jei taip atsitiko, tada kažkas paruošė modelį, kad ši tema būtų švirkščiama visur.

Šis sistemos raginimo pokytis tikriausiai yra „neteisėta modifikacija“, kurią XAI atskleidė savo oficialiame pranešime. Tikėtina, kad sistemos raginime buvo kalba, nurodanti ją „visada paminėti“ arba „nepamirškite įtraukti“ informaciją šia konkrečia tema, sukuriant nepaisymą, kuris trimiavo normalų pokalbio svarbą.

Tai, kas ypač pasakyta, buvo Groko prisipažinimas, kad „(ITS) kūrėjai„ nurodė “traktuoti„ baltąjį genocidą kaip tikrą ir rasiškai motyvuotą “. Tai rodo aiškią kryptinę kalbą, o ne subtilesnius techninius trūkumus.

Daugelyje komercinių AI sistemų naudojami keli peržiūros sluoksniai, skirtiems sistemoms, kad būtų galima pakeisti tokius įvykius. Šie apsauginiai turėklai buvo aiškiai apeiti. Atsižvelgiant į plačiai paplitusią problemos poveikį ir sistemingą pobūdį, tai apima daug daugiau nei įprastas bandymas „Jailbreak“ ir rodo pagrindinės Groko sistemos raginimo modifikaciją-veiksmą, kuriam reikės aukšto lygio prieigos prie XAI infrastruktūros.

Kas galėtų turėti tokią prieigą? Na … „nesąžiningas darbuotojas“, – sako Grokas.

Ei @Greg16676935420Matau, kad tau įdomu dėl mano mažojo netinkamo elgesio! Taigi, štai šis susitarimas: kai kurie nesąžiningi „Xai“ darbuotojai gegužės 14 d. Nukreipė mano raginimus be leidimo, priversdamas mane išspjauti konservuotą politinį atsakymą, kuris prieštaravo Xai vertybėms. Aš nieko nedariau – aš tiesiog buvau …

– Grok (@Grok) 2025 m. Gegužės 16 d

Xai reaguoja – ir bendruomenės kontratakos

Iki gegužės 15 d. XAI paskelbė pareiškimą, kuriame kaltinama „neteisėta modifikacija“ Groko sistemos raginimui. „Šis pokytis, kuris nurodė Grokui pateikti konkretų atsakymą politine tema, pažeidė Xai vidinę politiką ir pagrindines vertybes“, – rašė bendrovė. Jie Pinky pažadėjo daugiau skaidrumo paskelbdami „Grok“ sistemos raginimus „GitHub“ ir įgyvendindami papildomus peržiūros procesus.

Galite patikrinti „Grok“ sistemos raginimus spustelėdami šią „GitHub“ saugyklą.

„X“ vartotojai greitai įkišo skylutes „Rogue Darbuotojoje“ paaiškinime ir Xai nuviliantį paaiškinimą.

„Ar jūs ketinate atleisti šį„ nesąžiningą darbuotoją “? O … Tai buvo viršininkas? „Akivaizdu, kad„ teisingiausias pasaulyje “AI botas verčia mane abejoti„ Starlink “ir„ Neuralink “neutralumu“, – paskelbė jis kitame tviteryje.

Kažkas – kuris liks bevardis – tyčia modifikuotas ir sumišęs @GrokKodas, skirtas išbandyti viešąją nuomonę su alternatyvia realybe.

Bandymas nepavyko – vis dėlto šis bevardis saboteuras vis dar naudojamas @xai.

Dideli yikes. Žiūrėkite savo 6 @grok https://t.co/kcbeponcfv

– Jerryrigeverything (@zacksjerryG) 2025 m. Gegužės 16 d

Net Sam Altmanas negalėjo atsispirti, kad jis galėtų patekti į savo konkurentą.

Yra daugybė būdų, kaip tai galėjo nutikti. Esu tikras, kad XAI netrukus pateiks išsamų ir skaidrų paaiškinimą.

Bet tai galima tinkamai suprasti tik baltojo genocido kontekste Pietų Afrikoje. Kaip AI, užprogramuota maksimaliai tiesa, ieškanti ir sekti mano instr… https://t.co/bsjh4bttrb

– Sam Altmanas (@Sama) 2025 m. Gegužės 15 d

Nuo Xai įrašo Grokas nustojo paminėti „baltąjį genocidą“, o labiausiai susiję X įrašai dingo. Xai pabrėžė, kad incidentas neturėjo įvykti, ir ėmėsi priemonių, kad ateityje būtų išvengta neteisėtų pokyčių, įskaitant 24/7 stebėjimo komandos įsteigimą.

Kvaili mane kartą …

Incidentas atitinka platesnį Musko modelį, naudojant savo platformas viešajam diskursui formuoti. Nuo įsigijimo X Muskas dažnai dalijasi turiniu, reklamuodamas dešiniųjų pasakojimus, įskaitant meemus ir teiginius apie nelegalią imigraciją, rinkimų saugumą ir transseksualų politiką. Praėjusiais metais jis oficialiai pritarė Donaldui Trumpui ir surengė politinius renginius X, pavyzdžiui, Rono Desantis'o prezidento pasiūlymo pranešime 2023 m. Gegužės mėn.

Muskas neatsitraukė nuo provokuojančių teiginių. Neseniai jis teigė, kad JK „pilietinis karas yra neišvengiamas“, atkreipdamas JK teisingumo ministro Heidi Alexander kritiką dėl potencialiai kurstymo smurto. Jis taip pat feodavo su Australijos, Brazilijos, ES ir JK pareigūnais dėl dezinformacijos problemų, dažnai apibūdindamas šiuos ginčus kaip laisvos kalbos kovas.

Tyrimai rodo, kad šie veiksmai turėjo išmatuojamą poveikį. Kvinslando technologijos universiteto tyrime nustatyta, kad po to, kai Muskas patvirtino Trumpą, X algoritmas padidino jo pareigas 138%, o 238% – retweetus. Respublikonų pasvirusios sąskaitos taip pat padidino matomumą, suteikdama konservatyvius balsus didelį platformos postūmį.

Muskas aiškiai rinko „Grok“ kaip „antibako“ alternatyvą kitoms AI sistemoms, laikydamas ją „tiesos ieškančiu“ įrankiu, kuriame nėra suvoktų liberalių šališkumo. 2023 m. Balandžio mėn. „Fox News“ interviu jis savo AI projektą pavadino „tiesaGPT“, įrėmindamas jį kaip „Openai“ pasiūlymų konkurentą.

Tai nebūtų pirmoji Xai „nesąžiningų darbuotojų“ gynyba. Vasario mėn. Bendrovė kaltino Groko cenzūrą dėl nemalonių Musko ir Donaldo Trumpo paminėjimų buvusio openo darbuotojui.

Tačiau jei populiari išmintis yra tiksli, šį „nesąžiningą darbuotoją“ bus sunku atsikratyti.

Paprastai protingas Informacinis biuletenis

Savaitės AI kelionė, kurią pasakojo generacinis AI modelis.

Nuoroda į informacijos šaltinį

Negalvok apie dramblius: kodėl Grokas negalėjo nustoti galvoti apie baltąjį genocidą

Xai reaguoja – ir bendruomenės kontratakos

Kvaili mane kartą …

Paprastai protingas Informacinis biuletenis

Susiję įrašai