Google ujel s Veo 3 dalším AI video nástrojům o parník. Zvládá i dialogy
Google uvedl na vývojářské konferenci I/O řadu novinek a ty nejpodstatnější se pochopitelně týkaly umělé inteligence. Díky ní se mílovými kroky rozvíjí možnost generování videa. Loni jsme byli svědky skokových pokroků z hlediska vizuální kvality výstupů AI video nástrojů, přišlo ale také uvědomění si jejich limitů. Jeden z nejzásadnějších nyní překonává Veo 3. Google navíc zasazuje svůj AI video nástroj do služby Flow, která má zásadním způsobem posunout možnosti ovládání tvorby videa.
Dosavadní omezení AI video nástrojů spočívají zejména v délce videa (na jeden prompt), konzistenci charakterů či scén, uvěřitelnosti fyzického pohybu a možnosti tvorby dialogů. První tři zmíněné problémy již AI video nástroje s různou mírou úspěšnosti řeší, přirozené dialogy byly ovšem dosud něčím, o co se ani nepokoušely. Respektive například Kling AI přišel s Lip Sync funkcí, tedy rozhýbávání úst postav z videa na dodaný hlas. Výsledky byly slibné, ale ne zcela uvěřitelné. S nutností generovat hlas jinde (obvykle v Eleven Labs) šlo navíc o složité kombinování. A právě v tom mění Veo 3 pravidla hry. Můžete mu popsat scénu, napsat dialogy a AI generované charaktery rozmluvíte nebo dokonce rozezpíváte
Skvělou ilustrací je video Ariho Kuschnira zveřejněné na síti X. Jde o koláž scén s rozhovory dvou charakterů, která prý autorovi trvala 2 hodiny i s editem. Ten se ovšem týkal jen poslepování jednotlivých videí vzniklých na základě textových promptů. Zvuková stopa nebyla nijak postprodukčně upravována. Showcase videa přímo od výrobců bývají vycizelovaná do posledního detailu a je těžké je brát jako neidealizovaný obraz schopností nástroje. Zde je vidět, že některé scény nezáměrně zápasí s fotorealističností, absolutní většina je ovšem těžko ropoznatelná od skutečnosti, a platí to i pro pohyb úst k hlasu atd.
WE CAN TALK! I spent 2 hours playing with Veo 3 @googledeepmind and it blew my mind now that it can do sound! It can talk, and this is all out of the box... pic.twitter.com/ufplpcZWbq
— Ari K (@arikuschnir) May 20, 2025
Před necelými 2 lety jsme informovali o tlaku herců a scénáristů v Hollywoodu na regulaci využití AI. Nyní můžete vidět, že se rozhodně bylo čeho bát. Expert na tvorbu AI videí, Ondřej Svoboda, uvedl pro Marketing Journal:
„První film vytvořený AI, který nerozeznáte od skutečnosti, se přiblížil. Model Veo3 od Googlu předčí ve všech ohledech jakýkoliv ze současných genAI video nástrojů.
Předchozí model Veo2 patřil k těm nejlepším (a nejdražším). V minulosti, když byl nějaký super model, tak se dříve nebo později objevila jiná společnost, která představila model lepší. Toto je poprvé, co někdo předčil sám sebe dříve, než to udělal někdo jiný.“
Svoboda spatřuje revolučnost Veo 3 v těchto aspektech:
- generuje video rovnou včetně realistických mluvících postav (už žádný lip-sync)
- generuje video včetně zvuku
- kontrola pohybu kamery
- konzistentní postavy, prostředí, objekty a styly
- základní editace videa včetně generativního rozšíření, outpaintingu apod.
- neuvěřitelně realistické zpracování
- je součástí nového nástroje Flow
Služba Flow byla vytvořena ve spolupráci s předními tvůrci AI videí a má být jakýmsi video a foto ovládacím panelem, kde můžete tvořit videa s nástroji Veo. I Veo 2 nabídne ovládání kamery a odstraňování objektů. V rámci Flow je k dispozici i genAI nástroj pro tvorbu obrázků Imagen v nové verzi 4, která má lepší kvalitu, umí exportovat do více formátů a poradí si také s texty na vizuálech.
Veo 3 má být mimo uvedených vlastností také mnohem lepší v chápání delších promptů a schopnosti vytvářet na sebe nevazující scény. Způsob práce s tímto nástrojem skvěle přibližuje video YT tvůrce Franklin AI.
Následující počin je pak koláží videí vytvořených s Veo 3 posbíraných ze sítě X.
Služba Flow je již spuštěna v USA pro předplatitele plánů Google AI Pro a Google AI Ultra. „Google AI Pro vám dává klíčové funkce služby Flow a 100 tvoreb měsíčně a Google AI Ultra vám dává nejvyšší limity používání a brzký přístup k Veo 3 s nativním generováním zvuku,“ říká v tiskové zprávě Google. AI Ultra přitom stojí 250 dolarů měsíčně a ani zde není limit na tvorbu videí nekonečný. Ceník i s výčtem všech funkcí naleznete níže.
Zdroj: one.google.com
Flow a tím pádem i Veo 3 nejsou nyní dostupné v Česku, samozřejmě existují různé cesty obcházení podobných opatření. Důrazně ale varujeme před stránkou veo3.ai.
Zdroj: v3.ai
Nejde jen o náhodnou shodu v názvu. Web se chlubí novými funkcemi Veo 3 a láká na výhodné předplatné. Vykazuje tak velmi podezřelé znaky scamu.