Turinys:
ToggleTrumpai tariant
- NVIDIA birželio 1 d. Computex parodoje pristatė 550 milijardų parametrų atviro svorio modelį Nemotron 3 Ultra.
- Modelis pateikia daugiau nei 300 žetonų per sekundę prieš išleidžiamą DeepInfra galinį tašką, veikiantį nuo trijų iki šešių kartų greičiau nei Kinijos konkurentai.
- Tačiau Kimi K2.6 iš Moonshot AI vis dar pirmauja atvirojo svorio žvalgybos reitinge.
Jensenas Huangas sekmadienį įžengė į „Computex“ sceną Taipėjuje su odine striuke ir pristatė „Nemotron 3 Ultra“ – didžiausią visų laikų „Nvidia“ atvirą dirbtinio intelekto modelį ir bent jau kol kas išmaniausią atviro svorio modelį, pagamintą Amerikoje. Tai gerai. Tai tiesiog nepakankamai gerai, kad nugalėtų Kiniją.
Modelyje yra apytiksliai 550 milijardų parametrų, bet bet kuriuo momentu veikia tik 55 milijardai aktyvių parametrų, naudojant dizainą, vadinamą ekspertų mišiniu. Parametrai lemia AI modelio žinių platumą, o didesnis skaičius paprastai reiškia galingesnį.
Norėdami suprasti, kaip veikia ekspertų mišinio modelis, pagalvokite apie tai kaip apie ligoninę, kurioje dirba šimtai specialistų: kai pacientas ateina, iš tikrųjų pasirodo tik atitinkami gydytojai, o ne visi darbuotojai. Dėl šio metodo modelio eksploatavimo išlaidos yra daug mažesnės, nei rodo antraštės parametrų skaičius, todėl „Nvidia“ gali teigti, kad išvada yra 5 kartus greitesnė ir kainuoja 30% mažiau nei panašios atviros alternatyvos.
Nepriklausomas vertintojas Artificial Analysis, bendradarbiaujantis su Nvidia vertindamas prieš išleidimą, „Nemotron 3 Ultra“ įvertino 48 savo intelekto indeksu – sudėtiniu etalonu, kuris apibendrina 10 vertinimų, apimančių samprotavimą, kodavimą, bendrąsias žinias ir agento našumą, įvertintus numeruota skale, kur aukštesnis reiškia protingesnis.
Dėl to jis yra geriausias JAV atviro svorio modelis. Kitas artimiausias amerikietiškas variantas yra „Gemma 4 31B“ iš „Google“ (39), „Nemotron 3 Super“ – 36, ir „OpenAI“ gpt-oss-120b – 33.
NVIDIA ką tik paskelbė apie „Nemotron 3 Ultra“ išleidimą Jensen Huang „Computex“ pagrindiniame pranešime: pagal 550B parametrus (55B aktyvus) tai yra didžiausias iki šiol „Nemotron 3“ modelis ir išmaniausias JAV atviro svorio modelis.
Bendradarbiavome su @nvidia, kad įvertintume šį modelį… pic.twitter.com/WPXZGLBOn8
— Dirbtinė analizė (@ArtificialAnlys) 2026 m. birželio 1 d
Atotrūkis nuo savo pirmtako yra ryškus. „Nemotron 3 Super“, išleistas 2026 m. kovą su 120 milijardų parametrų, jau buvo laikomas tvirtu atviru autonominių agentų modeliu. „Ultra“ pakyla 12 indekso taškų aukščiau, o tai šiame etaloniniame pasaulyje yra didelis šuolis.
Kas yra Nemotronų šeima
„Nvidia“ modelių versle dirba ilgiau, nei dauguma žmonių supranta. Pirmasis „Nemotron“ prekės ženklo modelis buvo išleistas 2023 m. lapkritį, o trečioji karta buvo paskelbta 2025 m. gruodį.
Šeima yra trijų dydžių: „Nano“, skirta lengvoms užduotims, „Super“, skirta vidutinės klasės įmonėms, ir „Ultra“, skirta sudėtingiems samprotavimo darbo krūviams. Visi trys turi tą pačią hibridinę architektūrą, jungiančią Mamba-2 sluoksnius, standartinį transformatoriaus dėmesį ir ekspertų derinį.
Mamba-2 yra alternatyva standartiniam dėmesiui, kuris apdoroja ilgas sekas už nedidelę kainą – tai svarbu, kai norite modelio, galinčio vienu metu atmintyje laikyti milijoną žetonų. „Nemotron 3 Ultra“ palaiko 1 milijono žetonų konteksto langą, o tai reiškia, kad agentas teoriškai vienu metu gali matyti visą didelę kodų bazę arba šimtus tyrimų dokumentų.
„Ultra“ modelis taip pat apima techniką, vadinamą kelių žetonų numatymu (MTP), kuri leidžia modeliui numatyti kelis būsimus žetonus vienu metu, o ne po vieną, o tai pagreitina generavimą. Visi trys „Nemotron 3“ modeliai buvo apmokyti naudojant sustiprinimo mokymąsi keliose interaktyviose aplinkose, mokant juos planuoti ir atlikti kelių etapų užduotis, o ne tik atsakyti į klausimus.
Ultra svoriai yra vieši, o jo treniruočių receptai skelbiami. Ar norint jį paleisti, reikia superkompiuterio? Iš esmės taip – 550 milijardų parametrų modelis yra duomenų centro teritorijoje. Bet jūs galite jį pasiekti naudodami „Nvidia“ API arba debesies paslaugų teikėjus, patys neturėdami aparatinės įrangos, lygiai taip pat, kaip bet kas jau naudoja GPT arba Claude per naršyklę.
Greitas modelis, lėtesnės smegenys
„Nemotron 3 Ultra“ tikrai išsiskiria greičio istorija. Išankstinio išleidimo DeepInfra galutiniame taške modelis aptarnavo daugiau nei 300 išvesties prieigos raktų per sekundę. Kinijos modeliai savo intelekto klasėje – DeepSeek V4 Pro ir Kimi K2.6 – šiandien aptarnaujami 50–100 žetonų per sekundę per jų komercines API. Šis greičio skirtumas yra svarbus diegiant realiame pasaulyje, ypač autonominiams agentams, vykdantiems ilgas kelių etapų užduotis, kai laukiama kiekvieno žingsnio greitai.
Tačiau neapdorotas greitis neišsprendžia žvalgybos varžybų. Paskelbtoje Dirbtinės analizės diagramoje aiškiai pasakojama tikroji istorija. Vertikaliame ašyje – intelektas – „Nemotron 3 Ultra“ yra 48, o tai yra puiku, tačiau Kinijos „Moonshot AI“ Kimi K2.6 – 54. Šis šešių taškų atotrūkis indekse rodo reikšmingą skirtumą: Kimi K2.6 buvo išleistas 2026 m. balandžio mėn. patentuoti flagmanai – visi lygiai 57.
JAV atvirojo svorio situacija nėra nauja. Kinijos laboratorijos užtvindo atvirą ekosistemą stipriais modeliais, o Amerikos įmonės – OpenAI, Anthropic, Google – savo geriausias sistemas laiko už API. Kaip kovo mėn. pranešė Decrypt, Kinijos atvirojo kodo modeliai šoktelėjo nuo maždaug 1,2 % pasaulinio atvirojo modelio naudojimo 2024 m. pabaigoje iki maždaug 30 % iki 2025 m. pabaigos. Nvidia yra didžiausias Amerikos pavadinimas, aktyviai bandantis pakeisti šią tendenciją, viešai paskelbtas penkerių metų planas išleisti 26 mlrd. USD atvirojo svorio AI plėtrai.
Nemotron 3 Ultra yra kol kas matomiausias šio statymo rezultatas. „Nvidia“ taip pat paskelbė, kad jau dirba su naujos kartos „Nemotron 4“, kurią sukūrė „Nemotron Coalition“ – aštuonių AI laboratorijų, įskaitant „Mistral AI“ ir „Perplexity“, grupę, kurią „Nvidia“ surinko 2026 m. kovo mėn., siekdama kartu kurti atviros sienos modelius DGX debesų infrastruktūroje. „Nemotron 3 Ultra“ bus pristatytas birželio 4 d.
Dienos apžvalga Naujienlaiškis
Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.