„Microsoft“ nemokama AI naršant internete tiesiog įveikė „OpenAI“ ir „Google“.

Turinys:

Trumpai tariant

„Fara1.5-27B“ surinko 72 proc. „Online-Mind2Web“, aplenkdamas „OpenAI Operator“ (58,3 proc.) ir „Gemini 2.5 Computer Use“ (57,3 proc.).
Modeliai yra atviro svorio, 4 milijardų, 9 milijardų ir 27 milijardų parametrų dydžių ir yra sukurti naudojant tiksliai sureguliuotą Qwen 3.5.
„Fara1.5-9B“ dabar veikia „Azure AI Foundry“; 4B ir 27B atvyks netrukus.

Įsivaizduokite, kad liepiate kompiuteriui ieškoti nuomojamų atostogų vietų, palyginti penkias svetaines, užpildyti užsakymo formą ir patvirtinti arčiausiai paplūdimio esančią. Eik pasidaryti kavos. Tai daroma, kai grįši. Tai yra „kompiuterio naudojimo agentų“ pažadas – dirbtinis intelektas, kuris nuskaito jūsų naršyklės ekraną ir spustelėja, slenka ir rašo tiksliai taip, kaip tai darytų žmogus, nereikalaujant jokių specialių įskiepių.

„OpenAI“ pirmą kartą tai išbandė su „Operator“, kuris buvo paleistas 2025 m. sausio mėn. už 200 USD per mėnesį, o vėliau buvo įtrauktas į „ChatGPT Agent“ ir uždarytas rugpjūtį. „Google“ naudoja „Gemini 2.5“ kompiuterius. Abu yra patentuoti, pagrįsti debesimis ir brangūs.

Šią savaitę „Microsoft Research“ išleido nedidelį modelį, pavadintą Fara1.5, ir, atsižvelgiant į kriterijus, jis lenkia juos abu.

Šeima yra trijų dydžių: 4 milijardai, 9 milijardai ir 27 milijardai parametrų, sukurti remiantis Qwen3.5 – Alibaba baziniu modeliu, kurį Microsoft patikslino naršyklės darbui, o visi svoriai buvo viešai paskelbti. (Parametrai lemia AI modelio žinių platumą, o apskritai reiškia didesnį pajėgumą.)

Norint tai pasiekti, reikėjo permąstyti visą kūrimo procesą nuo nulio. „Pradėjome nuo paprasto klausimo: ko reikia, kad mažas modelis tikrai gerai atliktų agento užduotis? AI Frontiers komanda rašė. „Atsakymas apėmė visą gyvavimo ciklą – duomenų generavimas, mokymo tikslai, modelio dizainas ir orkestruotė turėjo būti perkurti kartu, o ne atskirai.

Etalonai

„Online-Mind2Web“ yra etalonas, kuris yra svarbus atliekant užduotį, kurią „Microsoft“ norėjo pasiekti. Ji tikrina, kaip dažnai AI agentas teisingai atlieka 300 įvairių, realaus pasaulio užduočių 136 populiariose svetainėse, pvz., produktų palyginimą, formų pildymą ir rezervavimo paslaugas, įvertinant procentais tinkamai atliktų užduočių tikrame, besikeičiančiame internete.

Fara1.5-27B surinko 72 proc. „OpenAI Operator“ surinko 58,3 proc. „Google Gemini 2.5 Computer Use“ surinko 57,3 proc. Yutori's Navigator n1, geriausia patentuota alternatyva, pasiekė 64,7%. Netgi Fara1.5-9B, vidutinio dydžio modelis, pasiekė 63,4 % – tiek OpenAI, tiek Google.

Atvirojo kodo konkurentams taip pat nepavyko. „Alibaba“ GUI-Owl-1.5, esant 8 milijardams parametrų, surinko 48,6%. AI2 „MolmoWeb“ surinko 35,3 proc. Ankstesnis „Microsoft“ modelis Fara-7B surinko 34,1 proc., todėl šis panašaus dydžio leidimas beveik dvigubai viršija savo pirmtaką.

„WebVoyager“ antrasis etalonas, matuojantis užduočių sėkmę tiesioginiame žiniatinklyje, surinko taip pat: Fara1.5-27B pasiekė 88,6%, OpenAI Operator – 87,0%, o H Company 30 milijardų parametrų Holo2 – 83,0%.

Kaip išmoko

Slaptas padažas yra mokymo vamzdynas. Treniruočių duomenims generuoti Microsoft naudojo sistemą, pavadintą FaraGen1.5. Čia yra protinga dalis: jie naudojo GPT-5.4 – OpenAI modelį – kaip „mokytojų agentą“, kad parodytų, kaip atlikti naršyklės užduotis. Tos demonstracijos tampa Fara1.5 treniruočių duomenimis. Iš esmės naudojate labiausiai pajėgų OpenAI modelį, kad išmokytumėte varžovą atvirojo kodo.

Jie taip pat sukūrė šešias netikras, pilnai veikiančias tikrų svetainių kopijas – el. pašto programas, kalendorius, prekyvietes, kad šis modelis galėtų atlikti užduotis, kurioms reikia prisijungimo ar neatšaukiamų veiksmų (pvz., iš tikrųjų išsiųsti el. laišką ar užsisakyti skrydį), neliečiant tikrų paskyrų. Tai vadinama sintetiniu domeno mokymu, ir tai yra reikšminga dalis, kodėl Fara1.5 geriau nei jo pirmtakai susidoroja su uždaromis užduotimis.

Kiekvienas modelis skirtas sustoti ir paklausti prieš darydamas tai, ko jis negali anuliuoti. „Labai svarbu suderinti tvirtas apsaugos priemones, pvz., „Critical Points“ su sklandžiais naudotojų keliais“, – „VentureBeat“ sakė Yashas Lara, „Microsoft Research“ vyriausiasis ministras pirmininkas. „Naudojant vartotojo sąsają, tokią kaip „Microsoft Research“ Magentic-UI, labai svarbu, kad vartotojai prireikus galėtų įsikišti, o taip pat padeda išvengti patvirtinimo nuovargio.

Tai svarbu, nes „OpenAI“ neįvertino rizikos, kai paleido „ChatGPT Agent“. „Kai prisijungiate prie „ChatGPT“ agento svetainėse arba įjungiate jungtis, ji galės pasiekti slaptus duomenis iš tų šaltinių, pvz., el. laiškus, failus ar paskyros informaciją“, – rašė bendrovė.

Fara1.5 paleidžia viską per MagenticLite – smėlio dėžės naršyklės aplinką, kuri registruoja kiekvieną veiksmą ir leidžia vartotojams bet kuriuo metu sustabdyti agentą.

Naršyklės AI tapo gausiomis lenktynėmis – Google Gemini in Chrome, Perplexity Comet, Anthropic Claude for Chrome. „Fara1.5“ pranašumas yra tas, kad jis yra atviras: viešieji svoriai, atviras išvados kodas „GitHub“, veikia jūsų valdomoje aparatinėje įrangoje. „Fara1.5-9B“ dabar veikia „Azure AI Foundry“; 4B ir 27B variantai pasirodys netrukus. „Microsoft“ teigia, kad planuoja išplėsti Fara1.5 ne tik naršyklėje, bet ir darbalaukio bei įmonės programinę įrangą.

Dienos apžvalga Naujienlaiškis

Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.

Nuoroda į informacijos šaltinį

Trumpai tariant

Etalonai

Kaip išmoko

Dienos apžvalga Naujienlaiškis

Susiję įrašai