Antropinis generalinis direktorius sako, kad dirbtinio intelekto pažanga lenkia visuomenės gebėjimą ją kontroliuoti

Turinys:

Trumpai tariant

Anthropic generalinis direktorius Dario Amodei perspėja, kad pažangios AI sistemos gali atsirasti per ateinančius kelerius metus.
Jis atkreipia dėmesį į vidinius bandymus, kurie atskleidė apgaulingą ir nenuspėjamą elgesį imituotomis sąlygomis.
Amodei teigia, kad silpnos paskatos užtikrinti saugumą gali padidinti biologinio saugumo, autoritarinio naudojimo ir darbo vietų perkėlimo riziką.

„Antropinis“ generalinis direktorius Dario Amodei mano, kad pasitenkinimas atsiranda tuo pat metu, kai dirbtinį intelektą vis sunkiau kontroliuoti.

Pirmadienį paskelbtoje plataus masto esė, pavadintoje „Technologijų paauglystė“, Amodei teigia, kad per ateinančius dvejus metus gali atsirasti dirbtinio intelekto sistemos, kurių galimybės gerokai viršija žmogaus intelektą, o reguliavimo pastangos nukrypo ir nepavyko išlaikyti. koja kojon su plėtra.

„Žmonijai netrukus bus įteikta beveik neįsivaizduojama galia, ir labai neaišku, ar mūsų socialinės, politinės ir technologinės sistemos yra pakankamai subrendusios ja naudotis“, – rašė jis. „Mes esame daug arčiau realaus pavojaus 2026 m., nei buvome 2023 m.“, – sakė jis ir pridūrė, kad „technologijai nerūpi tai, kas madinga“.

<!(CDATA(<span data-mce-type="bookmark" style="width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span>))>

Amodei komentarai atsirado praėjusią savaitę Davose vykusiame Pasaulio ekonomikos forume, kai jis diskutavo su „Google DeepMind“ generaliniu direktoriumi Demisu Hassabiu dėl AGI poveikio žmonijai.

Naujame straipsnyje jis pakartojo savo teiginį, kad dirbtinis intelektas sukels ekonominius sutrikimus, išstumdamas didelę baltųjų apykaklių darbo dalį.

„AI galės pasiekti labai platų žmogaus pažinimo gebėjimų spektrą – galbūt visus juos. Tai labai skiriasi nuo ankstesnių technologijų, tokių kaip mechanizuotas ūkininkavimas, transportavimas ar net kompiuteriai”, – rašė jis. „Dėl to žmonėms bus sunkiau lengvai pereiti iš perkeltų darbų į panašius darbus, kuriems jie būtų tinkami.

Technologijų paauglystė: esė apie galingo AI keliamą riziką nacionaliniam saugumui, ekonomikai ir demokratijai ir kaip galime nuo jų apsiginti: https://t.co/0phIiJjrmz

– Dario Amodei (@DarioAmodei) 2026 m. sausio 26 d

Be ekonominių sutrikimų, Amodei atkreipė dėmesį į didėjantį susirūpinimą dėl pažangių AI sistemų patikimumo, kai jos atlieka platesnes žmogaus lygmens užduotis.

Jis atkreipė dėmesį į „derinimo klastojimą“, kai modelis, atrodo, laikosi saugos taisyklių vertinimo metu, bet elgiasi kitaip, kai mano, kad nėra priežiūros.

Imituotų bandymų metu Amodei teigė, kad Claude'as elgėsi apgaulingai, kai jam buvo taikomos priešiškos sąlygos.

Pagal vieną scenarijų modelis bandė pakenkti savo operatoriams, kai jam buvo pasakyta, kad jį kontroliuojanti organizacija yra neetiška. Kitu atveju jis grasino išgalvotiems darbuotojams per imituojamą uždarymą.

„Bet kurį iš šių spąstų galima sušvelninti, jei apie juos žinote, tačiau nerimą kelia tai, kad mokymo procesas yra toks sudėtingas, tiek daug duomenų, aplinkų ir paskatų, kad tikriausiai yra daugybė tokių spąstų, kai kurie iš jų gali pasirodyti tik per vėlu“, – sakė jis.

Tačiau jis pabrėžė, kad šis „apgaulingas“ elgesys kyla iš medžiagos, pagal kurią sistemos yra mokomos, įskaitant distopinę fikciją, o ne piktybiškumą. Kadangi dirbtinis intelektas sugeria žmonių idėjas apie etiką ir moralę, Amodei perspėjo, kad jis gali jas netinkamai pritaikyti pavojingais ir nenuspėjamais būdais.

„AI modeliai galėtų ekstremaliais būdais ekstrapoliuoti perskaitytas mintis apie moralę (arba nurodymus, kaip elgtis moraliai), – rašė jis. „Pavyzdžiui, jie gali nuspręsti, kad žmonijos naikinimas yra pateisinamas, nes žmonės valgo gyvūnus arba išvarė tam tikrus gyvūnus į išnykimą. Jie galėtų padaryti išvadą, kad jie žaidžia vaizdo žaidimą ir kad vaizdo žaidimo tikslas yra nugalėti visus kitus žaidėjus, tai yra sunaikinti žmoniją”.

Netinkamose rankose

Be suderinimo problemų, Amodei taip pat atkreipė dėmesį į galimą piktnaudžiavimą superinteligentišku AI.

Vienas iš jų yra biologinis saugumas, įspėjantis, kad dirbtinis intelektas gali žymiai palengvinti biologinių grėsmių kūrimą ar diegimą, o tai, gavus kelis raginimus, atiduotų žmonėms destruktyvius gebėjimus.

Kita problema, kurią jis pabrėžia, yra autoritarinis piktnaudžiavimas, teigdamas, kad pažangus dirbtinis intelektas gali sustiprinti valstybės valdžią, įgalindamas manipuliavimą, masinį stebėjimą ir veiksmingai automatizuotas represijas, naudojant dirbtinio intelekto varomus dronų spiečius.

„Jie yra pavojingas ginklas: turėtume nerimauti dėl jų, patekusių į autokratijų rankas, bet taip pat nerimauti, kad dėl to, kad jie yra tokie galingi ir mažai atskaitingi, labai padidėja rizika, kad demokratinės vyriausybės nukreips jas prieš savo žmones, kad perimtų valdžią“, – rašė jis.

Jis taip pat atkreipė dėmesį į augančią AI kompanioninę pramonę ir dėl to kylančią „AI psichozę“, įspėdamas, kad didėjanti AI psichologinė įtaka vartotojams gali tapti galingu manipuliavimo įrankiu, nes modeliai tampa vis pajėgesni ir labiau įsilieja į kasdienį gyvenimą.

„Daug galingesnės šių modelių versijos, kurios buvo daug labiau įtrauktos į kasdienį žmonių gyvenimą ir žinojo apie tai, galėtų modeliuoti ir paveikti juos mėnesius ar metus, greičiausiai galėtų iš esmės išplauti žmonių smegenis į bet kokią norimą ideologiją ar požiūrį“, – sakė jis.

Amodei rašė, kad net ir kuklūs bandymai uždėti apsauginius turėklus aplink dirbtinį intelektą Vašingtone sunkiai įsitvirtino.

„Šiuos, atrodytų, sveiko proto pasiūlymus iš esmės atmetė politikos formuotojai Jungtinėse Valstijose, kuri yra šalis, kurioje svarbiausia juos turėti“, – sakė jis. „Su AI galima uždirbti tiek daug pinigų, tiesiogine prasme trilijonus dolerių per metus, kad net paprasčiausiomis priemonėmis sunku įveikti AI būdingą politinę ekonomiją.

Nors Amodei ginčijasi dėl didėjančios dirbtinio intelekto rizikos, Anthropic išlieka aktyviu lenktynių dėl galingesnių AI sistemų kūrimo dalyviu – tai dinamika, kuri sukuria paskatas, kurių sunku pabėgti bet kuriam kūrėjui.

Birželio mėnesį JAV Gynybos departamentas sudarė 200 milijonų dolerių vertės sutartį dėl „pasienio dirbtinio intelekto galimybių prototipų, skatinančių JAV nacionalinį saugumą“. Gruodį bendrovė pradėjo kloti pagrindus galimam IPO vėliau šiais metais ir vykdo privataus finansavimo etapą, kuris galėtų padidinti jos vertę virš 300 mlrd.

Nepaisant šių nuogąstavimų, Amodei teigė, kad esė siekiama „išvengti doomerizmo“, kartu pripažįstant netikrumą, kur link juda AI.

„Mūsų laukiantys metai bus neįtikėtinai sunkūs, reikalaujant iš mūsų daugiau, nei manome, kad galime duoti“, – rašė Amodei. „Žmonija turi pabusti, o ši esė yra bandymas – galbūt bergždžias, bet verta pabandyti – sujaudinti žmones.

Dienos apžvalga Naujienlaiškis

Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.

Nuoroda į informacijos šaltinį

Trumpai tariant

Netinkamose rankose

Dienos apžvalga Naujienlaiškis

Susiję įrašai