„Mistral AI“ atsisako naujo atvirojo kodo modelio. Internetas nėra sužavėtas, išskyrus vieną dalyką

Trumpai tariant

  • „Mistral Medium 3.5“ yra 128 milijardų parametrų tankus modelis, kurio kaina yra 1,50 USD įvesties / 7,50 USD išvesties vienam milijonui žetonų, o tai gerokai viršija panašias Kinijos alternatyvas.
  • Kinijos atvirojo kodo modeliai – Qwen, GLM, MiMo-V2 – dominuoja pirmaujančiųjų sąrašo viršūnėje, todėl „Mistral“ yra vienišas Vakarų lyderis.
  • „Mistral“ išleidžia leidimą kaip būsimo didelio pavyzdinio modelio bloką.

„Mistral AI“ atsisakė „Mistral Medium 3.5“ balandžio 29 d. Paryžiuje įsikūrusi laboratorija paskelbė apie tankų 128 milijardų parametrų modelį, agentinių savybių rinkinį ir žengė tiesiai į internetinių „meh“ reakcijų sieną.

Išleidimas buvo sudarytas iš trijų dalių. Pirma, pats modelis. Antra, nuotoliniai kodavimo agentai per „Mistral Vibe CLI“ – debesimi pagrįsti kodavimo seansai, galintys nukreipti ištraukimo užklausas į „GitHub“ ir veikti lygiagrečiai jums nesėdint prie terminalo. Trečia, darbo režimas Le Chat, Mistral ChatGPT stiliaus vartotojo sąsaja, kuri dabar tvarko daugiapakopes savarankiškas užduotis, tokias kaip el. pašto skirstymas, tyrimų sintezė ir kelių įrankių darbo eigos.

Didelės ambicijos, bet netvarkinga etaloninė realybė.

Vidutinis 3,5 balas – 77,6 % SWE-Bench Verified – kodavimo etalonas, kuris tikrina, ar modelis gali išspręsti tikras „GitHub“ problemas generuodamas veikiančias pataisas. Jis taip pat pasiekia 91,4 % τ³-Telecom, kuris matuoja agentų įrankių naudojimą specializuotoje aplinkoje. „Mistral“ taip pat sujungė tris anksčiau atskirus modelius (Medium 3.1, Magistral ir Devstral 2) į vieną svorių rinkinį su konfigūruojamomis argumentavimo pastangomis pagal užklausą.

Vieningas modelis, pakeičiantis tris, yra tikras inžinerijos laimėjimas. Problema yra ta, kiek tai kainuoja ir su kuo ji susiduria.

„Mistral“ ima 1,50 USD už milijoną įvesties žetonų ir 7,50 USD už milijoną išvesties žetonų. Alibaba Qwen 3.6 su 27 milijardais parametrų – mažiau nei ketvirtadalis Medium 3.5 parametrų skaičiaus – pasiekia 72,4 % pagal tą patį SWE-Bench Verified etaloną ir pristatomas naudojant Apache 2.0, o tai reiškia, kad galite atsisiųsti ir paleisti jį nemokamai.

Ar žinojai?

Parametrai lemia AI gebėjimą mokytis, samprotauti ir saugoti informaciją. Kuo daugiau parametrų, tuo platesnė modelio žinių sritis.

Slinkite per atvirojo kodo pirmaujančiųjų sąrašus ir vaizdas bus ryškus. Aukščiausios vietos priklauso Alibaba Qwen, GLM iš Kinijos Zhipu AI ir MiMo-V2 iš Xiaomi, kurie visi yra pigesni, galingesni ir konkurencingesni nei naujasis Mistral leidimas. Vidutinis 3.5 dar net nepateko į pagrindinius nepriklausomus lyderių sąrašus – vis dar laukiama trečiųjų šalių įvertinimų.

Vienintelis geras dalykas, kaip kai kurie teigia, yra tai, kad „Mistral“ šiuo metu yra vienintelis ne Kinijos modelis, kuris rimtai dalyvauja atvirojo kodo pokalbyje.

Internetas reaguoja

Pedro Domingosas, Vašingtono universiteto mašininio mokymosi profesorius, nebuvo švelnus:

„Įprastos dirbtinio intelekto įmonės giriasi tuo, kiek geresnis jų modelis yra lyginant su etalonais. Tik „Mistral“ giriasi, kiek blogesnis jo modelis.

Vėliau jis pateikė aštresnį klausimą: „Nežinau, kas yra blogiau, jei Europa nedalyvaus dirbtinio intelekto lenktynėse arba jai atstovaus toks juokelis kaip „Mistral“.

Youssof Altoukhi, „Yoyo Studios“ įkūrėjas, atliko skaičiavimus: Qwen 3.6, esant 27 milijardams parametrų, yra 4,7 karto mažesnis nei „Medium 3.5“, o kodavimo rezultatai yra panašūs. Vidutinė 3.5 produkcijos kainodara leidžia ją naudoti kartu su uždarais modeliais, kurių balai yra žymiai aukštesni pagal kiekvieną pagrindinį etaloną.

„Jei ne jų politiniai įgūdžiai, jie jau būtų bankrutavę“, – sakė jis.

Ne visi buvo vien atmestinai. AI kūrėjas Michalas Langmajeris užfiksavo dviprasmiškumą:

„Nuoširdžiai džiaugiuosi, kad vis dar yra ne JAV, ne Kinijos laboratorija, kuri bando kurti paribius LLM, bet mes turime išlyginti žaidimą Europoje. Jų naujasis pavyzdinis modelis iš esmės nėra „geriausias“ pagal bet kurį etaloną, tačiau kainuoja kelis kartus daugiau nei dauguma konkurentų.

Kai kurie kūrėjai teigė, kad atviri svoriai yra ilgaamžiškumo, o ne lyderių lentelės žaidimas. Modeliui, kurį gali atsisiųsti, patikslinti ir savarankiškai priimti, šiandien nereikia laimėti reitingų, kad išliktų aktualus. Kiti kaip įrodymą, kad griovys nėra vien techninis, nurodė realias „Mistral“ įmonių dislokacijas visoje Europoje.

Geopolitinis saugos tinklas

Čia gyvena tikroji „Mistral“ aikštelė.

Europos įmonės, kurioms taikomas GDPR, bankai, tvarkantys jautrius klientų duomenis, ir vyriausybės, kurios neperkels dirbtinio intelekto darbo krūvio per Kinijos infrastruktūrą, turi ribotas galimybes. Kaip Iššifruoti praėjusių metų gruodį pranešė, kad HSBC pasirašė daugiametę sutartį su „Mistral“, kad sukurtų modelius savarankiškai savo infrastruktūroje. ES įsikūrusios atviros svorio laboratorijos patrauklumas, kurio vertinimas buvo 14 mlrd. USD, neparodomas lyginamųjų indeksų lentelėse, tačiau jis atsispindi pirkimų sprendimuose.

Ne pats geriausias kodavimo meistras ir ne pats pigiausias. Bet tai yra: ne amerikietiška, ne kiniška, tikrinama, savarankiška ir teisiškai saugi Europos įmonėms.

Dienos apžvalga Naujienlaiškis

Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.

Nuoroda į informacijos šaltinį

Draugai: - Marketingo agentūra - Teisinės konsultacijos - Skaidrių skenavimas - Klaipedos miesto naujienos - Miesto naujienos - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Teniso treniruotės - Pranešimai spaudai - Kauno naujienos - Regionų naujienos - Palangos naujienos