Je tu gamechanger? AI video nástroj Sora od OpenAI přináší dosud neviděnou kvalitu

16. 2. 2024 | Petr Michl
Už i OpenAI má svůj „text-to-video“ nástroj. Sora umí vytvářet až minutová FullHD videa na základě textového zadání, dokáže v nich udržet konzistenci a generovat přesvědčivé postavy, které vyjadřují živé emoce.


Zdroj: OpenAI

Společnost OpenAI vstupuje do sféry umělé inteligence, která byla dosud považovaná za nejkomplexnější a v níž je také nejméně konkurence: do tvorby videa na základě textových promptů. Její nový nástroj Sora dokáže vytvářet komplexní a složité scény až filmové kvality v rozlišení 1080p a v délce až 1 minuty.

Před dalším čtením se prosím podívejte na video.

 

A zkuste si nyní vzpomenout, jestli by vás třeba před 2 lety napadlo, že může vzniknout něco podobného jen na základě textových instrukcí.

Ano, není to dokonalé. V některých okamžicích jsou zřetelné rysy „AI videí“, obzvláště u scén typu „3D art“ se výstupy neliší tolik od toho, co jsme viděli od konkurence Runway nebo Pika. Dechberoucí jsou ovšem fotorealistické městské scény se stíny, odrazy světel v kalužích, a především s postavami, které vypadají lidsky jako běžný herec. Má jít přitom o čistý výstup bez další editace.

Sora umí generovat celá videa najednou nebo generovaná videa prodlužovat. Dle Open AI si model díky předvídání mnoha snímků najednou umí držet konzistenci v zobrazování stejného objektu (třeba právě člověka), i když dočasně zmizí z dohledu. Na svém blogu říká:

„Sora dokáže generovat složité scény s více postavami, specifickými typy pohybu a přesnými detaily objektu a pozadí. Model rozumí nejen tomu, o co uživatel požádal v zadání, ale také tomu, jak tyto věci existují ve fyzickém světě.“

Nástroj má mít „hluboké porozumění jazyku, což mu umožňuje přesně interpretovat podněty a generovat přesvědčivé postavy, které vyjadřují živé emoce“.

Služba je zatím v testovací fázi, ve které je jeden z největších důrazů kladen na bezpečnost. Čím lepší AI video nástroj, tím větší hrozbu v podobě tvorby přesvědčivých dezinformací představuje. Mimo pracovníků OpenAI ho mají k dispozici jen vybraní video profesionálové.  Níže dáváme další ukázky, které na základě promptů od sledujících vytvářel na síti X CEO OpenAI, Sam Altman. 

 

Kam dál?

Otázka označení obsahu vytvořeného s pomocí AI je z bezpečnostního hlediska čím dál palčivější. Minulý týden zveřejnila své plány  v této oblasti OpenAI a také Meta. Obrázky vytvořené AI dostanou na Facebooku a Instagramu označení v meta datech i na úrovni viditelné uživateli.

Štítky dokumentu: AI

To nejlepší z moderního marketingu každý pátek do vašeho inboxu.

Ochrana proti spamovacím robotům. Odpovězte prosím na následující otázku: Jaký je letos rok?
Podobné články: