Sam Altmano „Openai O3“ modelis, kuris praėjusios savaitės pabaigoje buvo nugrimzdęs į „GPT-5“ išleidimą, per keturias tiesias rungtynes ketvirtadienį, kad laimėtų „Google“ „Kaggle“ žaidimų arenos AI šachmatų parodą.
Galite pamanyti, kad tai buvo ypač sudėtingas aukštųjų technologijų begemotų spektaklis, pateikiantis jų samprotavimus galutinį testą, tačiau, kaip užkandis, tarkime, pasaulio čempionas Magnusas Carlsenas palygino abu robotus su „talentingu vaiku, kuris nežino, kaip gabalai juda“.
Trijų dienų turnyras, kuris vyko rugpjūčio 5–7 dienomis, privertė bendrosios ir paskirties pokalbių programas-taip, tie patys, kurie padeda rašyti el. Laišką ir tvirtina, kad artėja prie žmogaus lygio intelekto-žaisti šachmatais be jokių specializuotų mokymų. Jokių šachmatų variklių, jokių ieškojimų judesių, tik kokių šachmatų žinių, kurias jie atsitiktinai įsisavino iš interneto.
Rezultatai buvo maždaug tokie pat elegantiški, kaip jūs tikėjotės priversdami kalbos modelį žaisti stalo žaidimą. Carlsenas, kuris kartu suderino finalą, apskaičiavo, kad abu AIS žaidė atsitiktinių žaidėjų, kurie neseniai išmoko taisyklių, lygį-„Around 800 ELO“. Kontekste jis yra neabejotinai geriausias šachmatininkas, kuris kada nors gyveno, su 2839 taškais. Šie PG žaidė taip, kaip išmoko šachmatais iš sugadinto PDF.
„Jie svyruoja tarp tikrai, tikrai gero žaidimo ir nesuprantamų sekų“, – po žaidimo transliacijos metu sakė Carlsenas. Vienu metu, stebėjęs, kaip Grokas vaikšto savo karaliumi tiesiai į pavojų, jis juokavo, kad gali pamanyti, kad jie vietoj šachmatų žaidžia karalių iš kalno.
Faktiniai žaidimai buvo tarsi meistriškumo klasė, kaip ne žaisti šachmatais, net tiems, kurie nežino žaidimo. Pirmosiose rungtynėse Grok iš esmės atidavė vieną iš svarbių savo kūrinių nemokamai, tada viską dar labiau apsunkino, kai jau už nugaros, prekiaujama daugiau kūrinių.
Antrasis žaidimas tapo dar keistesnis. Grokas bandė įvykdyti tai, ką šachmatininkai vadina „užnuodytu pėstininku“ – rizikinga, bet teisėta strategija, kai jūs patraukiate priešo pėstininką, kuris atrodo nemokamas, bet ne. Išskyrus Groką, visiškai pagriebė neteisingą pėstininką, kuris buvo akivaizdžiai apgintas. Jos karalienė (galingiausias gabalas lentoje) buvo įstrigęs ir iškart užfiksuotas.
Iki trečiojo žaidimo „Grok“ sukūrė tai, kas atrodė kaip tvirta pozicija – gera padėties kontrolė, jokių akivaizdžių pavojų ir iš esmės komplektas, kuris gali padėti jums laimėti rungtynes. Tada žaidimo viduryje jis iš esmės sumušė kamuolį tiesiai priešininkui. Tai prarado gabalą po gabalo greitai iš eilės.
Tai iš tikrųjų buvo keista, atsižvelgiant į tai, kad prieš rungtynes su O3, Grokas buvo gana stiprus varžovas, parodantis tvirtą potencialą – tiek, kad šachmatų grandiozinis meistras Hikaru Nakamura jį gyrė. „Grok iki šiol yra lengvai geriausias, tiesiog būdamas objektyvus, lengvai geriausias”.
Ketvirtasis (ir paskutinis) žaidimas suteikė vienintelį tikrą laikinąjį laikiklį. „Openai“ O3 žaidimo pradžioje padarė didžiulį klaidą, o tai kelia didelį pavojų bet kokiose pagrįstose rungtynėse. Rungtynes transliuojantis Nakamura teigė, kad, nepaisant trūkumų, O3 vis dar buvo „keli triukai“.
Jis buvo teisus – O3 susigrąžino, kad laimėtų savo karalienę atgal ir lėtai išspaudė pergalę, o „Grok's Endgame“ žaidimas subyrėjo kaip šlapias kartonas.
„Grok padarė tiek daug klaidų šiuose žaidimuose, bet„ Openai “to nepadarė“, – per savo tiesioginę transliaciją sakė Nakamura. Tai buvo gana ankstesnės savaitės pasikeitimas.
Laikas negalėjo būti blogesnis Elonui Muskui. Po stiprių Groko ankstyvųjų raundų jis paskelbė X, kad jo AI šachmatų sugebėjimai buvo tik „šalutinis poveikis“ ir kad Xai „beveik nesistengė šachmatų“. Tai pasirodė per maža.
Prieš šį „oficialų“ šachmatų turnyrą tarptautinis meistras Levy Rozmanas šiais metais surengė savo turnyrą su mažiau pažengusiais modeliais. Jis gerbė visus rekomenduojamų pokalbių programų judesius, o visa situacija baigėsi visiška netvarka su neteisėtais judesiais, gabalo šaukimu ir neteisingais skaičiavimais. „Stockfish“, specialiai pastatyta šachmatų AI, baigė laimėti turnyrą prieš „ChatGpt“. Altmano AI buvo suderinta su Musko pusfinalyje, o Grokas pralaimėjo. Taigi Samui tai yra 2: 0.

Tačiau šis turnyras buvo kitoks. Kiekvienas robotas gavo keturias galimybes teisiškai judėti – jei jiems nepavyko keturis kartus, jie automatiškai pralaimėjo. Tai nebuvo hipotetinė. Ankstyvaisiais raundais AIS bandė teleportuoti gabalus visame pasaulyje, sugrąžinti negyvus gabalus ir perkelti pėstininkus į šoną, tarsi jie žaistų kai kuriose „Fever-Deam“ šachmatų versijoje, kurią jie patys sugalvojo.
Jie buvo diskvalifikuoti.
„Google“ „Dvyniai“ patraukė trečiąją vietą, sumušdamas dar vieną „Openai“ modelį, išgelbėdamas tam tikrą orumą turnyro organizatoriams. Tose bronzos medalio rungtynėse buvo ypač absurdiškas nupieštas žaidimas, kuriame abu AIS visiškai laimėjo pozicijas skirtinguose taškuose, tačiau negalėjo išsiaiškinti, kaip baigti.
Carlsenas atkreipė dėmesį, kad AIS geriau skaičiavo užfiksuotus kūrinius, nei iš tikrųjų pristatė „Checkmate“ – jie suprato materialų pranašumą, bet ne kaip laimėti. Tai panašu į puikų ingredientų rinkimą, bet negalite paruošti patiekalo.
Tai yra tie patys AI modeliai, kurie, kaip teigia technologijų vadovai, kreipiasi į žmogaus intelektą, kelia grėsmę baltųjų apykaklių darbus ir revoliucionuoja, kaip mes dirbame. Vis dėlto jie negali žaisti stalo žaidimo, kuris egzistavo 1500 metų, nebandydami apgauti ar pamiršti taisyklių.
Taigi turbūt saugu sakyti, kad esame saugūs, AI kol kas nepaisys žmonijos kontrolės.
Paprastai protingas Informacinis biuletenis
Savaitės AI kelionė, kurią pasakojo generacinis AI modelis.