„OpenAI“ ir „Anthropic Roll Out“ konkurentų dirbtinio intelekto modeliai įkaista dėl įmonių konkurencijos

Ketvirtadienį „OpenAI“ ir „Anthropic“ pristatė naujus pavyzdinius savo atitinkamų produktų linijų AI modelius per valandą vienas nuo kito, pabrėždami suaktyvėjusią konkurenciją tarp pirmaujančių kūrėjų, dominuojančių įmonės programinėje įrangoje ir pažangiuose kodavimo įrankiuose.

Anthropic paskelbė apie Claude Opus 4.6, reklamuojantį ilgo konteksto samprotavimus ir agentais pagrįstą darbo eigą, o OpenAI netrukus išleido GPT-5.3 Codex, modelį, optimizuotą agentiniam kodavimui ir programinės įrangos kūrimui.

Beveik vienu metu paleidimas parodė, kaip greitai konkurentai kartojasi, kai įmonės lenktyniauja siekdamos užsitikrinti ilgalaikes sutartis su stambiais verslo klientais.

<!(CDATA(<span data-mce-type="bookmark" style="display:inline-block;width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span>))>

Palyginimo rezultatai rodo, kad abu modeliai yra optimizuoti skirtingo stiprumo.

Remiantis abiejų įmonių paskelbtais duomenimis, Claude Opus 4.6 pasirodė geriau atlikdama užduotis, susijusias su teisiniais ir finansiniais motyvais, o GPT-5.3 Codex pranoko agentinio kodavimo testus ir efektyvumo metriką.

Išleista, kai investuotojai iš naujo įvertina tradicinių programinės įrangos tiekėjų perspektyvas, o kelių informacijos ir profesionalių paslaugų įmonių akcijų akcijos šią savaitę krinta. tarp rūpesčių kad dirbtinio intelekto platformos gali sumažinti įsitvirtinusių įmonės įrankių paklausą.

Antropinis pasakė kad „Claude Opus 4.6“ pagerino ilgalaikio konteksto samprotavimus ir profesionalias užduotis, nurodydamas 1 milijono žetonų konteksto langą ir 76 % balą naudojant MRCR v2 – sudėtingos informacijos gavimo etaloną.

Bendrovė teigė, kad modelis taip pat pranoko ankstesnes versijas finansų ir teisinių užduočių srityje ir pristatė „agentų komandas“, leidžiančias keliems AI agentams lygiagrečiai dirbti koduojant ir dokumentuojant.

OpenAI paleistas GPT-5.3 Codex netrukus po to, pozicionuodamas jį kaip modelį, optimizuotą agentiniam kodavimui ir tyrimams.

„OpenAI“ teigė, kad „Codex“ surinko 77,3% „Terminal-Bench 2.0“, agentinio kodavimo etalono, kai Claude Opus 4.6 surinko 65,4%, ir užduotis atliko greičiau, naudodamas mažiau žetonų.

„OpenAI“ taip pat teigė, kad ankstyvosios „Codex“ versijos buvo naudojamos viduje, siekiant padėti derinti mokymus ir valdyti diegimą, o tai yra vienas iš pirmųjų kartų, kai modelis atliko tiesioginį vaidmenį spartindamas savo vystymąsi.

Apibendrinant galima teigti, kad nė vienas modelis nėra aiškus bendras pranašumas, o našumo pranašumai priklauso nuo to, ar įmonės teikia pirmenybę profesionaliems argumentams, ar savarankiškam programinės įrangos kūrimui.

Taip pat tikimasi, kad „Google“ artimiausiais mėnesiais pristatys savo „Gemini“ modelių atnaujinimus, o kiti AI kūrėjai, įskaitant „DeepSeek“, ruošia naujus leidimus, kurie padidins konkurencijos tempą šiame sektoriuje.

Vis dėlto mažai tikėtina, kad vien etaloniniai rezultatai lems lyderystę rinkoje, nes platesnis pritaikymas ir įmonių diegimas vis labiau formuoja konkurencinę aplinką.

Konkurencijai ir toliau spaudžiant varžovus, laikas parodys, ar agentais pagrįstos darbo eigos taps pagrindine ekonominės veiklos dalimi. „OpenAI“ ir „Anthropic“ tikrai tuo remiasi.

Dienos apžvalga Naujienlaiškis

Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.

Nuoroda į informacijos šaltinį

Dienos apžvalga Naujienlaiškis

Susiję įrašai