„Kling 2.0“, pagrindinis moderniausio AI vaizdo generatoriaus atnaujinimas, kurį Kinijos technologijų įmonė „Kuaishou“ išleido, praėjusią savaitę pateko į rinką į kūrėjų, kurie greitai sudegė per šimtus dolerių, potvynį, išbandydamas savo galimybes.
„AI vaizdo kokybė Vos per naktį. Aš esu be žodžių”, – tviteryje rašė AI filmų kūrėjas PJ Ace, kuris teigė, kad jau išleido 1 250 USD kreditų, tyrinėjančių įrankio ribas. „Aš niekada nemačiau judesio šio skysčio ar ragina tai tiksliai“. Įrašas surinko daugiau nei 757 000 peržiūrų, pabrėždamas garsą aplink šią laidą.
AI vaizdo kokybė vos 10x'd per naktį. Aš nekalbus.
„Kling 2.0“ ką tik sumažėjo ir aš jau sudeginau 1 250 USD kreditų, išbandydamas jo ribas.
Aš niekada nemačiau judesio šio skysčio ar raginau tai tiksliai.
Štai kaip aš padariau šį vaizdo įrašą, žingsnis po žingsnio 👇🧵 pic.twitter.com/f54efvlczj– PJ ACE (@PJACCETTURO) 2025 m. Balandžio 15 d
Naujoji versija žymi reikšmingą „Kling 1.6“ šuolį į priekį, siūlančią patobulintą greitą supratimą, sklandesnį simbolių judėjimą ir patobulintą vaizdinę estetiką, kurią vartotojai apibūdina kaip „filmuojamus, nesukurtus“. Svarbiausia, kad „Kling 2.0“ gali generuoti vaizdo įrašus iki 2 minučių ilgio, o konkurentai, tokie kaip „Openai's Sora“ dulkėse, kai kalbama apie išplėstines pasakojimo galimybes.
„Apskritai, Klingas iš tikrųjų išlaiko aukščiausią tašką pirmaujančių grupių lentelėje“, – savo apžvalgoje teigė „YouTuber“ Timas Simmonas, kuris specializuojasi peržiūrint generatyvinius AI modelius. Jis mano, kad tai yra aiškus „Image-Video“ kartos nugalėtojas, o konkursas yra arčiau, kai kalbama apie tiesioginį teksto ir vaizdo įrašą.
Ši nauja versija patenka į vis labiau perkrautą AI vaizdo kartos rinką. Konkursai apima kilimo ir tūpimo taką, žinomą dėl didelio tikslumo išėjimų, kurie neseniai išleido savo „V4“ modelį, kurio pagrindinis dėmesys buvo skiriamas kino rezultatams, ir „Google“ „VeO2“, turint tvirtas „Tex-to-Video“ galimybes ir estetiškai malonius rezultatus.
Iki šiol modelis dar turi būti pateiktas dirbtinės analizės „Video Generator“ lyderių lentelėje, kurioje yra visi geriausi generatyviniai vaizdo modeliai-, tačiau jo pirmtakas „Kling 1.6“ jau yra vaizdas į vaizdą ir užima antrą vietą pagal tekstą iki vaizdo, remiantis aklais testais.
„Kling 2.0“ yra kelių elementų redaktorius, leidžiantis vartotojams pridėti, apsikeisti ar ištrinti vaizdo turinį naudojant teksto ar vaizdo įvestis.
Platformoje taip pat pristatomi du specializuoti komponentai: „Kling 2.0 Master for Video Generation“ ir „Kolors 2.0“, skirtas vaizdo kūrimui-ne painiavos su kitu atvirojo kodo kinų AI vaizdo generatoriumi, kuris buvo išleistas tuo pačiu „Kolor“ pavadinimu-teikiančiais kūrėjais, labiau kontroliuojančiais jų išvestis.

Įrankio dėmesys kino kokybei daro jį ypač patrauklų filmų kūrėjams, rinkodaros specialistams ir turinio kūrėjams. Modelis yra nepaprastai galingas išteklių atžvilgiu, o kartos per kelias valandas trunka nemokamame plane ir iki 16 minučių beveik 5 sekundes vaizdo įrašų internetinėse platformose.
Kainos kainos prasideda nuo 29 USD per mėnesį už standartinį planą, kuris apima profesionalų režimą, 8 sekundžių vaizdo įrašus ir 30 vaizdo įrašų per dieną pašalpą. Nemokamas planas siūlo 6 kasdienes kartas su 4 sekundžių ribomis ir vandens ženklais. Profesinis planas, kurio vertė 89 USD per mėnesį, teikia aukštos skiriamosios gebos, pažangių judesių valdiklius ir prioritetų apdorojimą.
Turinys:
ToggleModelio tikrinimas
Mes išbandėme naują modelį penkiose kategorijose-dinamizme, iliustracijoje, tekste-video, struktūrinėje darnoje ir daugialypės srities darnoje. Štai ką mes radome.
Dinamiškumas
Visi vaizdo generatoriai tvarko vis dar gerai, tačiau paprastai kovoja su greitu judesiu, sudėtingomis scenomis ir dinamine sąranka. Tai atspindi realaus gyvenimo vaizdo įrašą ar animaciją-tai jūsų televizorius per „Tom & Jerry“ persekiojimą ar veiksmo kupiną karo sceną, o visur pastebėsite keistus rėmus.
Mes išbandėme modelį su vis dar vaizduojant vyrą, skraidantį per miestą, ir paprašėme jo sugeneruoti sceną.
„Kling 2.0“ pasirodė ypač jautrus nedideliems greitųjų pakeitimams. Pirmasis mūsų bandymas buvo naudojamas: „Dinaminis stebėjimo šūvis: vyras skraido ypač dideliu greičiu šurmuliuojančioje miesto gatvėje. Kamera atidžiai seka už nugaros, užfiksuodamas pastatų ir eismo švilpukų skubėjimą, padidindamas greičio ir jaudulio pojūtį po to, kai jis staigiai pasuka.”
Deja, raginimas sukėlė iliuziją, kai subjektas buvo išsiurbtas atgal gatve. Tai greičiausiai atsirado dėl mūsų pasirinkimo žodžių pasirinkimo.
Taigi mes pašalinome tik vieną žodį: „Už atsilikau“. Tai pakeitė rezultatą, sukuriant daug geresnį vaizdo įrašą, kuriame pavaizduota tema, skraidanti į priekį, nukreipta į fotoaparatą.
Klingas užfiksavo pagrindinius scenos elementus-dinaminį ir greitą judėjimą-, nors subjekto kūnas keistai sukosi keičiant kryptį, o kai kuriems elementams trūko vienodos struktūros. Kiti modeliai, tokie kaip „Google“ „Veo2“ realizmo prekybos dinamiškumas, sukuriant lėtesnes, statiškesnes, bet nuoseklesnes scenas.
Iliustracija
Reikia: „360 laipsnių horizontalioji keptuvė: šurmuliuojantis miestas, sudėtingai pastatytas aplink masyvų medį, užpildytą namais ir tiltais. Kamera sklandžiai juda iš priekio į medžio užpakalį, fiksuodami vaikus, žmones, užsiimančius kasdieniais veiklomis, ir skraidantys automobiliai, nusileidžiantys ant šakų ir išeinant iš šilto, kviečiančio atmosferos”.
Modelis pasižymi tokiais įsivaizduojamais stiliais kaip komiksai ir iliustracijos, tačiau kovoja su nedidelėmis detalėmis. Jame prioritetas yra nuoseklumas, o ne detalės, gerbiant pagrindinius greitus elementus su sklandžiu fotoaparato judėjimu ir skysčio scena.
Objekto struktūra išlieka tvirta be kitų generatorių matomo vingių, nors kai kurie vaikai (tai būtų mažos detalės, esančios už pradinės visos kompozicijos struktūros – medis ir aplink jį užimtas) praranda darną, o skraidantys automobiliai retkarčiais išnyksta.
Vis dėlto šis testas davė geriausius rezultatus, kuriuos matėme iš bet kurio vaizdo įrašų generatoriaus.
Tekstas-Video
Reikia: „Šviesiaplaukė moteris su raudona suknele ir azijietiškas vyras juodu kostiumu kalbasi„ Starbucks “viduje. Vidutinis šūvis.”
„Tekstas-Video“ kelia unikalius iššūkius AI generatoriams. Modelis turi sukurti pradinį rėmelį (iš esmės užduotį tekstu-į vaizdą) ir naudoti tai kaip visų vėlesnių kadrų nuorodą. Idealiu atveju norėtumėte, kad tai būtų specializuotas pirmojo rėmo vaizdo generatorius – ir idealiu atveju ir paskutiniam rėmui, jei norite geriausios darnos.
„Kling 2.0“ čia ne ypač šviečia, tačiau taip pat nėra blogai. Scena pasižymi būdingu daugeliui vaizdo generatorių, būdingų orlaivių stiliui, tačiau kūnai palaiko tinkamą struktūrą, pirštai atrodo tikslūs ir nėra pastebimų artefaktų, kurie sutrikdo sceną.
Tai yra patobulinimas, palyginti su Kling 1.6, bet ne tuo, kuo buvo sukurtas modelis.
Struktūrinė darna
Reikia: „Vaizdas iš oro: Sudėtingos, abstrakčios architektūrinės struktūros, besisukančios, kadras”.
Nors Klingas gali kovoti su mažomis detalėmis perpildytose scenose, tačiau tai puikiai išlaiko nuoseklumą ir detales vieno tiriamojo kadruose.
Mes pasidalinome sudėtingo kūrinio atvaizdu ir paprašėme modelio, kad jis pasuktų. „Kling 2.0“ tai tvarkė beveik nepriekaištingai – apšvietimas išliko pastovus, judėjimas buvo vienodas, neatsirado jokių artefaktų, o struktūra išlaikė savo vientisumą.
Ši galimybė daro jį potencialiai vertingą 3D modeliavimui, įgalinant objekto ir scenos peržiūras iš skirtingų kampų.
Kelių subjektų darna
Reikia: „Penki pilkos spalvos vilkų šuniukai, besisukantys ir vejasi vienas kitą aplink atokų žvyrkelį, apsuptas žolės. Šuniukai bėga ir šokinėja, vejasi vienas kitą ir šypteli vienas kitam, žaidžia.”
Tai išlieka Achilo visų vaizdo modelių kulnu, pridedant „Kling 2.0“. Nuo tada, kai „Openai“ parodė, kad Sorai nesugebėjo sugeneruoti kartu su gyvūnais, žaidžiančiais kartu su kūdikiais, visi vaizdo generatoriai bandė šį iššūkį su įvairiais rezultatais. Nei vienas modelis nuosekliai nepasiekia tobulų rezultatų.
„Kling 2.0“ sukūrė ryškią, realistišką sceną, tačiau vilkai susilieja vienas į kitą, pasirodo ir dingsta tarp kadrų. Jei vienintelis išanalizuotas dalykas yra darnos, tada nėra daug skirtumų tarp „Kling 2.0“ ir „Kling 1.6“.
Vienas pastebimas patobulinimas: nelygumai dažniausiai būna fone, o priekiniai gyvūnai dažniausiai palaiko geresnį darną.
„Kling 2.0“ galima pasiekti per „Kling AI“, „Freepik“, „Pollo AI“ ir kitus teikėjus.
Paprastai protingas Informacinis biuletenis
Savaitės AI kelionė, kurią pasakojo generacinis AI modelis.