Open AI představila DALL-E 3. Uživatelé ChatGPT Plus budou nadšení

21. 9. 2023 | Petr Michl
Čeká nás již v říjnu „nejlepší text to image generátor obrázků“? Třetí generace nástroje DALL-E si na tento titul brousí zuby. Jeho výraznou přidanou hodnotou má být vytváření obrázků přímo v ChatGPT a Enterprise bez složitého promptingu.

Společnost Open AI si většina lidí spojí s velkým jazykovým modelem ChatGPT. Své místo má ale i ve sféře vizuální generativní AI. U statických vizuálů ujela konkurenci notně Midjourney. Ještě před rokem byl ale jejím zdatným konkurentem nástroj DALL-E 2 právě z dílny OpenAI. Nyní přichází s novou verzí a slibuje zásadní zlepšení.

Třetí generace „text-to-image“ generátoru má být silně propojená s ChatGPT. V říjnu by ho měli mít k dispozici uživatelé ChatGPT Plus a „korporátního“ ChatGPT Enteprise. Silou tohoto spojení má být, že obrázky mohou doplňovat konverzaci uživatele s chatbotem zcela přirozeně. Tvůrci DALL-E 3 dokonce mluví o konci promptingu. Co tím myslí může ilustrovat konverzace o tom, že má dcera ráda ježky, kterou sdílel CEO Open AI Sam Altman na X.

Ilustrace dětských knih už zkusilo vytvořit s nástroji generativní AI mnoho lidí. Kdyby šlo vše tak hladce jako v přiloženém videu, mohou je ale lidé tvořit třeba jako doplnění večerního vyprávění pohádek dětem.

Silou DALL-E 3 má být schopnost skutečně zapracovat detaily, které se v textovém zadání objeví. Můžete to vidět na vizuálu s přiloženými popisky detailů z promptu na níže  i v dalších  fotografiích z blogu Open AI doplněných přímo o prompty.

O schopnostech DALL-E3 mluvil už před měsícem youtuber MattVidPro, který si vyzkoušel alfa verzi nástroje. O jeho nadšení mluví i titul videa (v překladu) „Ještě nikdy jsme neviděli tak dobrou tvorbu obrázků!". Vyzdvihuje v něm například možnost zvolit si dimenze potřebného vizuálu.

Další ne tak obvyklou expertízou je poté schopnost umístit na obrázek požadovaný text. Což je něco, s čím se dosud pere i jinak adorovaná Midjourney.


Ukázka obalu hry vytvořeného MattVidPro s alfa verzí DALL-E 3.

Silnou stránkou DALL-E 2 je tvorba uměleckých vizuálů. Příklad níže (vpravo) při zadání stejného promptu ukazuje, že umělecká abstrakce je nyní detailnější a realističtější.


Zároveň Open AI říká:

DALL-E 3 je navržen tak, aby odmítal žádosti, které požadují obrázek ve stylu žijícího umělce. Tvůrci mohou nyní také vyřadit své obrázky z tréninku našich budoucích modelů generování obrázků.“

DALL-E 2 ztrácel za dalšími generacemi Midjourney (zejména IV. a V.) ve schopnosti vytvářet fotorealistické vizuály. I s prompty, co si fotografickou přesnost a detail žádaly, generoval snímky připomínající v lepším případě hodně realistickou videohru. Nyní se to lepší, a Open AI s tím spojuje nová opatření proti šířením dezinformací s pomocí AI:

DALL-E 3 má zmírňující opatření pro odmítnutí žádostí, které požadují veřejnou osobu podle jména. Zlepšili jsme výkonnost bezpečnosti v rizikových oblastech, jako je generování veřejných osobností a škodlivé předsudky související s nadměrnou/podměrnou vizuální reprezentací, a to ve spolupráci s pracovníky červených týmů (tedy s odborníky na danou oblast, kteří model zátěžově testují), aby nám pomohli informovat o hodnocení rizik a zmírňování v oblastech, jako je propaganda a dezinformace.

Prognózy o úspěchu jednotlivých AI nástrojů jsou nesmírně obtížné. Nebudeme se tak dopouštět odhadů, zdali DALL-E 3 sesadí z trůnu AI generátorů vizuálů Midjourney. Je nicméně zřejmé, že má velmi silné trumfy v ruce – zejména ty spojené s integrací do ChatGPT a zásadního zjednodušení zadání promptu. Těšíme se, až si to budeme moct sami vyzkoušet.

Níže naleznete další ukázky (klik na fotku vás zavede na její zvětšenou verzi). 

Zdroj: Open AI


Tip redakce

„ChatGPT je mrtvý. Toto je 20 AI nástrojů vzniklých tento týden, bez kterých se vaše podnikání nemůže obejít.“

Podobná prohlášení vídáte zejména na LinkedInu zas a znovu. Jenom pravděpodobně nemáte další 3 životy, abyste měli čas něco z toho skutečně ověřit.

Jsme na tom podobně, a i to je jeden z důvodů, proč jsme se v Marketing Journalu spolu s jeho vydavatelem, PR a digitální agenturou Focus, rozhodli uspořádat setkání AI Connect.

 

Co na něm uvidíte?

5 uznávaných profesionálů z různých oborů, kteří vám v krátkých přednáškách poví, jak jim reálně AI pomáhá v jejich práci a podnikání.

 

Žádná omáčka ani teoretické debaty o tom, kdy nás AI zahubí.

Žádná etická dilemata.

Prostě jen příklady z praxe. 

 

Buďte u toho!

 

AI Connect

Kdy: 21. září 2023

Kde: Impact Hub Praha D10       

Podívejte se na medailonky řečníků a plné anotace prezentací.

Kupte si vstupenku za zvýhodněnou early bird cenu ZDE.


To nejlepší z moderního marketingu každý pátek do vašeho inboxu.

Ochrana proti spamovacím robotům. Odpovězte prosím na následující otázku: Jaký je letos rok?
Podobné články: