Turinys:
ToggleTrumpai tariant
- „OpenAI“ svarsto galimybę reikšmingai sumažinti kainas, tikėdamasi panašių „Anthropic“ žingsnių.
- Šis žingsnis išryškėja, kai abi bendrovės varžosi dėl dvikovinių IPO.
- Atvirojo kodo išvadų teikėjai jau teikia „DeepSeek V4“ už uždarojo modelio kainodaros dalį, todėl verslo klientams suteikiama perspektyvi išeitis dar neprasidėjus kainų karui.
„OpenAI“ svarsto galimybę sumažinti kainas, kurias taiko kūrėjams ir įmonėms, rašo „Wall Street Journal“, tikėdamasis panašių „Anthropic“ sumažinimų. Diskusijos tebevyksta, nes abi bendrovės šį mėnesį konfidencialiai pateikė paraiškas dėl IPO ir nė viena neatnešė pelno.
„Manau, kad turėsime daug būdų, kaip padėti žmonėms gauti daugiau naudos už mažesnes išlaidas“, – neseniai vykusiame renginyje sakė Samas Altmanas. „Wall Street Journal“.. Ši citata atsidūrė OpenAI fone, kai 2026 m. pirmąjį ketvirtį koreguota –122 % veiklos marža, o tai reiškia, kad už kiekvieną įneštą dolerį ji prarado 1,22 USD.
Spaudimas tikras. Kaip Iššifruoti Anksčiau buvo pranešta, kad ChatGPT dalis pasaulinio generatyvaus AI žiniatinklio srauto sumažėjo nuo 77,6 % 2025 m. gegužę iki 53,7 % iki 2026 m. balandžio mėn. Pirmą kartą daugiau įmonių, stebimų pagal Ramp AI indeksą, moka už Anthropic nei už OpenAI. „Anthropic“ metinė eigos norma sumažėjo nuo 9 mlrd. USD 2025 m. pabaigoje iki 47 mlrd. USD iki 2026 m. gegužės mėn. – 422 % šuolis per penkis mėnesius – beveik vien dėl Claude Code, o 2026 m. antrasis ketvirtis buvo pirmasis pelningas bendrovės ketvirtis.
Nuo tada „OpenAI“ savo kodavimo įrankį „Codex“ padarė įmonės prioritetu. Bet tai žaidžia pasivyti.
Abi bendrovės kovoja ne tokį tylų karą, kad pritrauktų kuo daugiau klientų, tvyrant didžiausiai pasaulyje technologijų karštinei nuo dot-com eros. Įvairios įmonės dabar lenktyniauja tam, kad vienu ar kitu būdu panaudotų dirbtinį intelektą. Uber CTO iki balandžio mėnesio išnaudojo visą 2026 m. AI biudžetą, kai kurie „JP Morgan“ darbuotojai dirbtiniu intelektu išleidžia daugiau nei savo atlyginimui, pasak banko mokėjimų skyriaus vyriausiojo duomenų pareigūno.
Tai yra praktika, kurią Silicio slėnis ėmė vadinti „tokenmaxxing“ – sudeginant kuo daugiau AI žetonų – AI modeliais apdorojamų duomenų bitų – dažnai be aiškios investicijų grąžos. Palantir generalinis direktorius Alexas Karpas praėjusią savaitę palygino tai su priklausomybe nuo pornografijos AIPCon. JP Morgan analitikai šį mėnesį paskelbė pranešimą pavadinimu „AI sąskaitos nekontroliuojamos“. Bendrovės, kurios labiausiai susiduria su smūgiu, yra tos, kurios dabar svarsto apie kainų karą.
Tommy Shaughnessy iš „Delphi Ventures“ šią savaitę plačiai paplitęs X įrašas išdėstė struktūrines spąstus: 20 USD per mėnesį fiksuoto mokesčio tarifas visada buvo mažesnis už tai, ką iš tikrųjų kainuoja didelis naudojimas – nuostolių lyderis, skirtas paskatinti įsisavinimą, o ne padengti skaičiavimus. Kai tik realiam verslui reikia didelio masto AI, jis pereina prie API, mokėdamas už prieigos raktą, bet sunaudoja daug daugiau skaičiavimo galios.
Ne visi sutinka su šiuo požiūriu. Kai kurie mano, kad dirbtinio intelekto oligopolija Vakarų pusrutulyje leidžia įmonėms imti vis didesnes kainas už raginimų apdorojimą – Kinijos modeliai apmokestina tiek mažai, tai įrodo. Jei taip yra, gali būti vietos drastiškiems kainų pokyčiams, o finansinė padėtis vis dar yra tvirta.
Karštas pasirinkimas: jie nėra subsidijuojami, jų maržos yra beprotiškos. Jie tiesiog absoliučiai prievartauja API klientus. Visi, kurie naudojo „deepseek“ arba ką nors priglobė ir apskaičiavo aparatinės įrangos / energijos sąnaudas, tai žino https://t.co/XQ477Qw3Vv
— Roy'us (@usr_bin_roygbiv) birželio 11 d.
Realios įmonės diegimo metu pereinama prie apskaičiuojamo API kainodaros, o įmonės sudegina kreditus daug greičiau, nei kada nors buvo pasiūlyti fiksuoti mokesčiai. Tuo tarpu atvirojo kodo išvadų teikėjai (įmonės, teikiančios skaičiavimo galią, kad AI modeliai galėtų apdoroti informaciją) sparčiai plečiasi, o agentų įrankiai yra jų augimo katalizatorius. Šios platformos aptarnauja pirmaujančius Kinijos AI modelius, tokius kaip DeepSeek, GLM, MiMo, Kimi ar Minimax, kurie konkuruoja su Claude Opus dėl kodavimo etalonų. maždaug tryliktoji dalis uždaros alternatyvos kaina.
„Kinijos laboratorijų atvirojo kodo pasienio lygio modeliai“, – rašė Shaughnessy. „Modelis yra vienintelė didžiausia kaina, kurią turi išvadų teikėjas, ir jie jį gauna nemokamai. Kol tai galioja, žvalgybos kainodaros žemiausia riba vis krenta link nulio, o bet koks maržos atkūrimas OpenAI ar Anthropic tampa matematikos problema, kuriai nėra aiškaus sprendimo.
Visa disertacija nutrūksta tik tuo atveju, jei Kinija pereis prie uždarojo kodo, pažymėjo Shaughnessy, o tai JAV laboratorijoms būtų nenaudinga.
Iki šiol atrodo, kad dauguma Kinijos AI laboratorijų laikosi priešingo požiūrio.
Dienos apžvalga Naujienlaiškis
Pradėkite kiekvieną dieną nuo populiariausių naujienų dabar ir originalių funkcijų, tinklalaidės, vaizdo įrašų ir kt.