AI zdarma: OpenAI uvedla argumentační model o3-mini pro všechny
Zdroj: OpenAI, repro Marketing Journal
Poslední 2 týdny pořádně vzedmuly vlny generativní umělé inteligence. Čínský DeepSeek uvedl svůj argumentační model R1, který v něčem překonává model ChatGPt-o1 od OpenAI představený na podzim. Navíc je k dispozici zdarma a jeho vývoj stál údajně necelých 6 milionů dolarů. OpenAI v odpovědi urychleně vydává svůj další argumentační model o3-mini-high, a ve verzi o3-mini ho navíc dává k dispozici všem.
o3-mini je víc než o1 a 4o
To, že modely o3 přijdou se vědělo již od prosince, kdy byly představeny veřejnosti v rámci 12denní šňůry novinek OpenAI. Jeho uvedení do ChatGPT ale mělo být otázkou příštích týdnů. Právě vzestup DeepSeeku ale vše urychlil.
Argumentační modely jsou přirovnávány ke studentovi doktorských studií, kterého ho máte po ruce 24/7. Dokáží rozdělit složité úkoly na menší kroky. Navíc vám popíší i to, „jak uvažují“, ověřují si fakta.
Pro sumarizaci textu jsou možná „až příliš“, navíc jsou poměrně pomalé. Například o1 zpracovává zadání, na které odpovídá model 4o v mžiku, klidně desítky vteřin až přes minutu. Na druhou stranu má menší chybovost a dokáže vyřešit zapeklitější úkoly, zejména ty z oblasti logiky, matematiky a kódování.
Ukaž mi svůj „myšlenkový řetězec“
Model o3-mini má ty samé přednosti, které jsme jmenovali u o1, akorát má reagovat o 24 procent rychleji než o1-mini a poskytovat přitom přesnější odpovědi. To vše za dosud nejmenších nákladů z argumentačních modelů od OpenAI. Stejně jako o1-mini před samotným vykonáním promptu uvidíte, jak se k odpovědi dopracoval — odhalí vám svůj „myšlenkový řetězec“.
Verze modelu o3 mají vlastní faktickou sebekontrolu a lépe se dokážou vyhnout častým chybám. Co všechno umí, představuje následující video.
OpenAI — patrně v reakci na DeepSeek — uvádí model o3-mini i ve své verzi zdarma. A to s omezeními podobnými těm u modelu 4o. V prémiové verzi získávají navíc uživatelé k dispozici model o3-mini-high. První je označen popiskem „Rychlý v pokročilém uvažování“, druhý pak „Skvělý v programování a logice“.
o3-mini je k dispozici přes API, jde tedy na něj napojit další nástroje. K dispozici bude ve třech úrovních: mini, medium a high. Prosincové představení přitom naznačuje, že by měl přijít ještě o3 bez přívlastku mini.
Model o3 prý trhá rekordy ve srovnání s 01. V testech kódování (SWE-Bench Verified) je o 22,8 % lepší a dosáhl 79,7 % v expertních vědeckých úlohách. V této souvislosti bychom rádi upozornili na nejpopulárnější komentář pod výše vloženým videem. Zní:
„Kromě zkoušení samé hranice možností (modelu) a dosahování vysokých skóre v nesmyslně obtížných úlohách, mi chybí měřítko spolehlivosti u jednoduchých úloh. Pokud se dostaneme blízko 100 % u relativně jednoduchých úloh, mohla by automatizace začít přinášet vážný ekonomický rozdíl. Spíše bych byl ohromen, kdybychom viděli 99,9999 % u úloh pro střední školy než 87 % u úloh na úrovni Ph.D. (doktorského studia, pozn. red.). To by znamenalo, že se na tyto modely můžeme spolehnout při řešení každodenních úkolů bez jakéhokoli dohledu. Těším se na tyto srovnávací testy. Kdo ví? Možná už tam jsme.“
Podobné přání mají jistě všichni, kteří chtějí využívat možnosti automatizace — ať už přes API v jiných nástrojích nebo na osobní úrovni nedávno představených agentů (funkce Operator je zatím dostupná v USA nebo ve verzi Premium s předplatným za 200 dolarů měsíčně, pozn. red.).
Zrychlené dodání popsaných funkcí uživatelům je důsledkem blahodárného vlivu konkurence v oblasti AI. DeepSeek můžeme popisovat jako trojského koně Číny s potenciálním nebezpečím podobným tomu, které představuje TikTok. Je ale zřejmé, že nutí převážně americkou konkurenci k tomu, aby dorovnával jeho nabídku.
Zejména okopírování nákladově úspornějšího trénování modelů od DeepSeek pak může výrazně rozšířit počet subjektů, které AI nástroje tvoří. Výzkumný tým AI z Kalifornské univerzity v Berkeley vedený doktorandem Jiayi Panem tvrdí, že se mu podařilo reprodukovat základní technologie DeepSeek R1-Zero za pouhých 30 dolarů. Mezitím společnost OpenAI jedná o dalším investičním kole, ze kterého by měla získat až 40 miliard dolarů. Tento nepoměr bije do očí.
Zdroje: OpenAI, Tom’s Hardware, Nitter
Kam dál?
Zdroj: Dall-e, repro Marketing Journal