„Mistral Medium 3.5“ yra 128 milijardų parametrų tankus modelis, kurio kaina yra 1,50 USD įvesties / 7,50 USD išvesties vienam milijonui žetonų, o tai gerokai viršija panašias Kinijos alternatyvas.
Kinijos atvirojo kodo modeliai – Qwen, GLM, MiMo-V2 – dominuoja pirmaujančiųjų sąrašo viršūnėje, todėl „Mistral“ yra vienišas Vakarų lyderis.
„Mistral“ išleidžia leidimą kaip būsimo didelio pavyzdinio modelio bloką.
„Mistral AI“ atsisakė „Mistral Medium 3.5“ balandžio 29 d. Paryžiuje įsikūrusi laboratorija paskelbė apie tankų 128 milijardų parametrų modelį, agentinių savybių rinkinį ir žengė tiesiai į internetinių „meh“ reakcijų sieną.
Išleidimas buvo sudarytas iš trijų dalių. Pirma, pats modelis. Antra, nuotoliniai kodavimo agentai per „Mistral Vibe CLI“ – debesimi pagrįsti kodavimo seansai, galintys nukreipti ištraukimo užklausas į „GitHub“ ir veikti lygiagrečiai jums nesėdint prie terminalo. Trečia, darbo režimas Le Chat, Mistral ChatGPT stiliaus vartotojo sąsaja, kuri dabar tvarko daugiapakopes savarankiškas užduotis, tokias kaip el. pašto skirstymas, tyrimų sintezė ir kelių įrankių darbo eigos.
Didelės ambicijos, bet netvarkinga etaloninė realybė.
Vidutinis 3,5 balas – 77,6 % SWE-Bench Verified – kodavimo etalonas, kuris tikrina, ar modelis gali išspręsti tikras „GitHub“ problemas generuodamas veikiančias pataisas. Jis taip pat pasiekia 91,4 % τ³-Telecom, kuris matuoja agentų įrankių naudojimą specializuotoje aplinkoje. „Mistral“ taip pat sujungė tris anksčiau atskirus modelius (Medium 3.1, Magistral ir Devstral 2) į vieną svorių rinkinį su konfigūruojamomis argumentavimo pastangomis pagal užklausą.
Vieningas modelis, pakeičiantis tris, yra tikras inžinerijos laimėjimas. Problema yra ta, kiek tai kainuoja ir su kuo ji susiduria.
„Mistral“ ima 1,50 USD už milijoną įvesties žetonų ir 7,50 USD už milijoną išvesties žetonų. Alibaba Qwen 3.6 su 27 milijardais parametrų – mažiau nei ketvirtadalis Medium 3.5 parametrų skaičiaus – pasiekia 72,4 % pagal tą patį SWE-Bench Verified etaloną ir pristatomas naudojant Apache 2.0, o tai reiškia, kad galite atsisiųsti ir paleisti jį nemokamai.
Ar žinojai?
Parametrai lemia AI gebėjimą mokytis, samprotauti ir saugoti informaciją. Kuo daugiau parametrų, tuo platesnė modelio žinių sritis.
Slinkite per atvirojo kodo pirmaujančiųjų sąrašus ir vaizdas bus ryškus. Aukščiausios vietos priklauso Alibaba Qwen, GLM iš Kinijos Zhipu AI ir MiMo-V2 iš Xiaomi, kurie visi yra pigesni, galingesni ir konkurencingesni nei naujasis Mistral leidimas. Vidutinis 3.5 dar net nepateko į pagrindinius nepriklausomus lyderių sąrašus – vis dar laukiama trečiųjų šalių įvertinimų.
Vienintelis geras dalykas, kaip kai kurie teigia, yra tai, kad „Mistral“ šiuo metu yra vienintelis ne Kinijos modelis, kuris rimtai dalyvauja atvirojo kodo pokalbyje.
Manau, kad „Mistral“ turi 10 aukščiausią įvertinimą visoje AI scenoje (kažkas panašaus).
Tuo tarpu jie nuolat išleidžia kai kuriuos blogiausius modelius.
Jie išgyveno dėl Europos biurokratijos, lobizmo ir politikos.
Viskas dėl to, kad jie įtikino silpnaprotį biurokratą… https://t.co/kh7ASvdi7C
Pedro Domingosas, Vašingtono universiteto mašininio mokymosi profesorius, nebuvo švelnus:
„Įprastos dirbtinio intelekto įmonės giriasi tuo, kiek geresnis jų modelis yra lyginant su etalonais. Tik „Mistral“ giriasi, kiek blogesnis jo modelis.
Įprastos dirbtinio intelekto įmonės giriasi tuo, kad jų modelis yra geresnis pagal etalonus. Tik „Mistral“ giriasi, kuo jis blogesnis. pic.twitter.com/WcAKskaVpL
Vėliau jis pateikė aštresnį klausimą: „Nežinau, kas yra blogiau, jei Europa nedalyvaus dirbtinio intelekto lenktynėse arba jai atstovaus toks juokelis kaip „Mistral“.
Youssof Altoukhi, „Yoyo Studios“ įkūrėjas, atliko skaičiavimus: Qwen 3.6, esant 27 milijardams parametrų, yra 4,7 karto mažesnis nei „Medium 3.5“, o kodavimo rezultatai yra panašūs. Vidutinė 3.5 produkcijos kainodara leidžia ją naudoti kartu su uždarais modeliais, kurių balai yra žymiai aukštesni pagal kiekvieną pagrindinį etaloną.
„Jei ne jų politiniai įgūdžiai, jie jau būtų bankrutavę“, – sakė jis.
Ne visi buvo vien atmestinai. AI kūrėjas Michalas Langmajeris užfiksavo dviprasmiškumą:
„Nuoširdžiai džiaugiuosi, kad vis dar yra ne JAV, ne Kinijos laboratorija, kuri bando kurti paribius LLM, bet mes turime išlyginti žaidimą Europoje. Jų naujasis pavyzdinis modelis iš esmės nėra „geriausias“ pagal bet kurį etaloną, tačiau kainuoja kelis kartus daugiau nei dauguma konkurentų.
Nuoširdžiai džiaugiuosi, kad vis dar yra ne JAV, ne Kinijos laboratorija, kuri bando kurti pasienio LLM (@MistralAI), bet berniukas, mes turime išlyginti žaidimą Europoje.
Jų naujasis pavyzdinis modelis iš esmės nėra „geriausias“ pagal bet kurį etaloną, tačiau kainuoja kelis kartus daugiau nei dauguma konkurentų… pic.twitter.com/JwvR5eKWmT
Kai kurie kūrėjai teigė, kad atviri svoriai yra ilgaamžiškumo, o ne lyderių lentelės žaidimas. Modeliui, kurį gali atsisiųsti, patikslinti ir savarankiškai priimti, šiandien nereikia laimėti reitingų, kad išliktų aktualus. Kiti kaip įrodymą, kad griovys nėra vien techninis, nurodė realias „Mistral“ įmonių dislokacijas visoje Europoje.
Geopolitinis saugos tinklas
Čia gyvena tikroji „Mistral“ aikštelė.
Europos įmonės, kurioms taikomas GDPR, bankai, tvarkantys jautrius klientų duomenis, ir vyriausybės, kurios neperkels dirbtinio intelekto darbo krūvio per Kinijos infrastruktūrą, turi ribotas galimybes. Kaip Iššifruoti praėjusių metų gruodį pranešė, kad HSBC pasirašė daugiametę sutartį su „Mistral“, kad sukurtų modelius savarankiškai savo infrastruktūroje. ES įsikūrusios atviros svorio laboratorijos patrauklumas, kurio vertinimas buvo 14 mlrd. USD, neparodomas lyginamųjų indeksų lentelėse, tačiau jis atsispindi pirkimų sprendimuose.
Ne pats geriausias kodavimo meistras ir ne pats pigiausias. Bet tai yra: ne amerikietiška, ne kiniška, tikrinama, savarankiška ir teisiškai saugi Europos įmonėms.
Dienos apžvalga Naujienlaiškis
Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.
Trumpai tariant „BlackRock“ „iShares Bitcoin Trust“ (IBIT) penktadienį užfiksavo 287,4 mln. Bitcoin ETF penktadienį bendrai surinko 471,3 mln. Remiantis „CoinGecko“…
Cutteris Hodierne'as žinojo, kad šansai prieš jį. Būdamas nepriklausomu filmo kūrėju, bandančiu užsitikrinti „šaltos piniginės“ finansavimą, kriptovaliutų trilerį apie neteisingą…