PR krize pro OpenAI. Testeři video nástroje Sora ho vypustili na veřejnost spolu se znepokojivou deklarací
Zdroj: OpenAI, repro Marketing Journal
Generativní AI video nástroj Sora od společnosti OpenAI uchvátil obrazovou kvalitou svého teaseru už na začátku tohoto roku. Obrazová kvalita byla tak blízko skutečnému světu zachycenému na kameru, že začal být brán jako lídr AI video pelotonu. A to vše, zatímco řada dalších konkurenčních nástrojů se od té doby dostala k rukám uživatelů a ty, co jsou už na trhu déle jako Runway nebo Pika Labs, získaly řadu nových verzí a vylepšení. Uvedení Sora se odkládalo až po amerických prezidentských volbách, údajně jako bezpečnostní opatření proti vzniku záplavy deepfakes nerozpoznatelných od reality. 3 týdny po volbách ale Sora stále venku není a její poslední kolo testování s videotvůrci získalo nečekanou pachuť.
Minulý týden vypustila ven skupina beta testerů z řad videotvůrců přístup k verzím, které s nimi byly sdíleny. K tomu zveřejnila otevřený dopis se značně popuzenou rétorikou, včetně úvodní oslovení: „Dear corporate overlords.“ Přičemž slovem „overlord“ se nejčastěji titulují nikým neomezení vládci v diktaturách nebo třeba šéfové skupin organizovaného zločinu. Zde má jít pravděpodobně o jejich obdobu z korporátního světa. Mezi klíčové pasáže dopisu patří:
„Přístup do Sory jsme získali s příslibem, že se staneme prvními testery, součástí červeného týmu (v IT světě to jsou lidé, kteří tetují bezpečnost softwaru, často metodami hackerů, pozn. red.) a kreativními partnery. Domníváme se však, že místo toho jsme lákáni do „art washingu“, abychom světu sdělili, že Sora je užitečný nástroj pro umělce.
UMĚLCI NEJSOU VAŠI NEPLACENÉ ODDĚLENÍ VÝZKUMU A VÝVOJE
Nejsme vaši: bezplatní testeři bugů, PR loutky, tréninková data, validační tokeny.“
Z dalších částí dopisu vyplývá, že rozhodně nejde o žádné odpůrce generativní AI jako takové:
„Nejsme proti využívání technologie umělé inteligence jako nástroje pro umění (kdybychom byli, pravděpodobně bychom nebyli pozváni do tohoto programu). S čím nesouhlasíme, je způsob, jakým byl tento program pro umělce zaveden a jak se nástroj formuje před možným veřejným zpřístupněním.“
Trailer k Soře zveřejněný v únoru 2024
Jedním ze zásadních momentů, který vedl k tak ostré reakci, je to, že tvůrci zapojení do testování si měli údajně nechat veškeré své hodnocení schvalovat před jeho zveřejněním. Tedy byli spíše v pozici placených influencerů při komerční spolupráci, akorát nedostali zaplaceno a mimo potenciálního sdílení na sociálních sítích si měli ještě odpracovat nemalé množství práce při testování.
Co nyní Sora umíDodejme, že OpenAI autory otevřeného dopisu sdílené přístupy rychle anulovala. Veřejnost k nim měla přístup jen asi 3 hodiny. Na sociální sítě uniklo přesto několik ukázek toho, co Sora nyní umí. Prohlédnout si je můžete v následujícím videu. Sora v beta verzi dokázala po zadání krátkého textového popisu vytvořit 10sekundové video v rozlišení až 1080p. Video nadšenci zkoumající kód softwaru v něm objevili i možnost úpravy stylů a omezené možnosti úprav již vytvořeného videa. |
OpenAI nicméně říká, že zapojení tvůrci nebyli do spolupráce nijak nuceni a čistě dobrovolná byla i jejich zpětná vazba na software. Mluvčí OpenAI, Niko Felix, uvedl pro The Verge:
„Sora je stále ve fázi předběžného výzkumu a pracujeme na tom, abychom vyvážili kreativitu s robustními bezpečnostními opatřeními pro širší použití. Stovky umělců v naší alfa verzi ovlivňovaly vývoj Sory a pomáhaly určovat priority nových funkcí a bezpečnostních opatření. Účast je dobrovolná, bez povinnosti poskytovat zpětnou vazbu nebo nástroj používat. S nadšením jsme těmto umělcům nabídli bezplatný přístup a budeme je nadále podporovat prostřednictvím grantů, akcí a dalších programů. Věříme, že umělá inteligence může být mocným tvůrčím nástrojem, a jsme odhodláni zajistit, aby byla Sora užitečná a bezpečná."
Je sice pravda, že OpenAI například nabídla financování 5 krátkých AI filmů promítaných v soutěži na filmovém festivalu Tribeca. Z pohledu rozhořčených testerů, kterých je 20, to ovšem není dostatečné od společnosti, jejíž poslední investiční kolo, posunulo její valuaci na 150 miliard dolarů. Pětice vybraných v soutěži s početným obsazením dostane zaplaceno, ostatní budou pracovat zdarma — stejně jako na samotném testování, do něhož mělo být přizváno dle otevřeného dopisu na 300 umělců.
Co je cílem otevřeného dopisu? „Sdílíme to se světem v naději, že se OpenAI stane otevřenější, přátelštější k umělcům a bude podporovat umění nad rámec PR stuntů," uvádí jeho autoři a zároveň doporučují tyto open-source nástroje:
- CogVideoX
- Mochi 1
- LTX Video
- Pyramid Flo
Právě LTX video přitom reprezentuje směr, kterým dost možná vývoj v genAI videu půjde. Tím je dle videotvůrce Davida Havrana Spáčila možnost lepšího ovládání procesu videotvorby, včetně úhlů kamery a selektivních úprav nastavené a prvků v rámci konkrétních scén. Tedy to, co je příslibem právě LTX, ale na daných prvcích pracují i jiné nástroje.
Jak na tom bude v tomto ohledu Sora, nikdo neví. Dle vyjádření hlavního produktového manažera Sory, Kevina Wella, na Redditu tento nástroj nebyl otevřen pro veřejnost z důvodu, že musí ještě vyřešit škálování schopností k softwaru dedikovaného výkonu (v cloudu) tak, aby mohl odolat předpokládané poptávce, a ladění potřebují i bezpečností opatření spojené například s ochranou proti tvorbě známých osobností. Je tak možné, že OpenAI se Sorou mírně ujede vlak.
Vyznění otevřeného dopisu a dosavadní cesta nástroje Sora před uvedením nicméně pro OpenAI zadělávají na další problém. A tím je riziko, že bude vnímána jako „zlá technologická společnost". To je cejch, který nechce mít žádná firma, a už vůbec ne u regulátorů odpovědných za legislativu ovlivňující fungování velkých světových trhů. Stejně důležité je však i to, jak ji budou vnímat tvůrci. Jejich volba pracovních nástrojů může významně ovlivnit budoucí vývoj videoprodukce.
Kam dál?
Ty údajně nejschopnější AI video nástroje jsou aktuálně dostupné jen omezenému počtu uživatelů. Podívejte se na jejich příslib v článcích:
Je tu gamechanger? AI video nástroj Sora od OpenAI přináší dosud neviděnou kvalitu
Dosud největší příslib pro AI video. LTX Studio nabídne bezprecedentní možnosti nastavení při tvorbě
Zdroj: Kling
Velmi slibný je nicméně čínský nástroj Vidu. Dokáže po zadání textového promptu vytvořit až 16sekundový klip ve FullHD rozlišení, kvalita ve smyslu fotorealističnosti se přitom skutečně blíží ukázce, s kterou ohromila svět Sora.
Ještě kratší dobu je dostupný čínský AI video nástroj Kling, který lze omezeně vyzkoušet i zdarma.