Ženský hlas AI agentky Sky z ChatGPT-4o mizí. Scarlet Johansson žaluje OpenAI, že je jí příliš podobný
Zdroj: Marvel Studios, film Black Widow
„Podobnost se skutečnými událostmi je čistě náhodná,“ myjí si někdy ruce autoři uměleckých děl nad někdy vyloženě zjevnou inspirací realitou. Když slyšela herečka Scarlet Johansson hlas mluvené verze AI chatbota ChatGPT-4o, řekla si, že tím vzorem byla ona. Vedou ji k tomu z jejího pohledu poměrně silné nepřímé důkazy. Podala proto na společnost Open AI žalobu, a věci se již dávají do pohybu.
Nejprve si přečtěte celé vyjádření Scarlet Johansson.
|
Nyní si poslechněte hlas ChatGPT-4o v podobě AI chatbotky Sky.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
A následuje trailer k filmu Her, v němž uslyšíte hlas slavné herečky.
Dle nás chybí hlasu Sky něco ze zastřenosti hlasu Scarlet Johansson. Posouzení necháme na vás.
Je nicméně zřejmé, že vedení OpenAI neodolalo využít na prezentaci umělé inteligence schopného simulovat emoce využít ženský hlas. Takový, který s inženýry na videoukázkách někdy bezmála flirtuje.
Existují AI služby, které se již zaměřují na tvorbu AI agentů simulujících objekty lásky / virtuální lidské partnery ke konverzaci. Sam Altman se takovému poslání u práce OpenAI vždy bránil. Trocha ženského sexappelu pro prodání nové verze ChatGPT-4o se ale evidentně hodila. A dle vyjádření hollywoodské hvězdy měl Altman v hlavě právě její hlas. Ten je obecně považován za sexy a hrál zásadní roli „AI agentky“ Samanthy ve zmiňovaném filmu Ona (Her) z roku 2013, v němž se do ní nerd Theodor hraný Joaquinem Phoenixem zamiloval. Snímek končí nešťastně. Dozví se totiž, že „AI láska“ má podobných šamstrů online celou řadu a její city nebyly nikdy pravé.
CEO OpenAI nicméně tvrdí, že jeho okouzlení Scarlet Johansson také nebylo zcela ultimátní. Pro CNBC Sam Altman uvedl:
„Hlas Sky není Scarlett Johansson a nikdy nebyl zamýšlen, aby ji připomínal. Dabérku, která hlas namluvila, jsme najali ještě před tím, než jsme oslovili paní Johansson. Z úcty k paní Johansson jsme přestali hlas Sky v našich produktech používat. Omlouváme se paní Johansson, že jsme nekomunikovali lépe.“
Advokáti herečky bezpochyby namítnou, proč ji tedy kvůli využití jejího hlasu oslovoval? V rozporu je to i s oficiálním vyjádřením na blogu OpenAI, kde stojí:
„Jsme přesvědčeni, že hlasy umělé inteligence by neměly záměrně napodobovat charakteristický hlas celebrit – hlas Sky není napodobeninou Scarlett Johansson, ale patří jiné profesionální herečce, která používá svůj vlastní přirozený hlas. Z důvodu ochrany jejich soukromí, nemůžeme zveřejnit jména našich dabérů.“
Z preventivních důvodů navíc OpenAI hlas Sky vyřazuje.
We’ve heard questions about how we chose the voices in ChatGPT, especially Sky. We are working to pause the use of Sky while we address them.
— OpenAI (@OpenAI) May 20, 2024
Read more about how we chose these voices: https://t.co/R8wwZjU36L
Ve zmíněném oficiálním prohlášení je také uvedeno, že hlasy byly nahrány už v září 2023. I když nyní odstraní z nabídky hlasů „Sky“, zbydou ještě další 4 nazvané Breeze, Cove, Ember, Juniper.
Bylo by jistě zajímavé, jak by dopadl podobný spor u veřejného soudu. Podobné záležitosti jsou nicméně velmi často řešeny civilní žalobou a mimosoudním vyrovnáním, kdy jsou poté informace uniklé na veřejnost poměrně stručné.
Pokud se nicméně OpenAI domnívá, že má „nabito“, co nejveřejnější spor by se mohl zaplatit jako vděčný PR stunt upozorňující na to, že ChatGPt-o mluví jako hollywodské star. Kdo by pak něco podobného nechtěl mít v telefonu?
Jistým poučením pro AI společnosti bude ale pravděpodobně rozvoj umělých hlasů a jejich míchání dle nastavených parametrů, kdy mu přidají několik „esencí“ tak, že bude namíchán k nepoznání od jednoho vzoru, ale směsí několika bude snad o to atraktivnější. Není to hudba příliš daleké budoucnosti. Rozvoj syntetického hlasu v posledních letech je neuvěřitelný a ostatně i živé osoby pro zmíněný dabing hlasů ChatGPT-4o byly najaty jako základ, cvičící materiál různé škály emocí, který je pak využíván v „živé konverzaci“ pro tvorbu nových vět.