V mnohém lepší než ChatGPT-o1 a zadarmo. Je tu čínský DeepSeek-R1
Ani Čína nevzdává boj o nejlepší velký jazykový model (LLM) současnosti. Z tamní laboratoře pro umělou inteligenci DeepSeek vzešla nová verze takzvaného „argumentačního modelu“ DeepSeek-R1. A není to žádné ořezávátko.
DeepSeek tvrdí, že překonává ChatGPT-o1 v benchmarcích AIME (výkon LLM), MATH-500 (slovní matematické úlohy) a SWE-bench Verified (programování). Jde o open-source projekt, který je pro běžné užití zdarma. Má tzv. MIT License, a nedává tak žádné zábrany ani komerčnímu využití.
Zdroj: huggingface.co
R1 je modelem zaměřeným na uvažování (reasoning), podobně jako zmíněný o1 od ChatGPT. Stejně jako on, je pomalejší v reakcích, ale zvládá být pomocníkem i vědcům a je spolehlivější v matematice, fyzice nebo přírodních vědách. Využívá posilování učení (RL), aby zdokonalil své uvažování a potvrdil si fakta.
Ověřuje si informace, umí hledat online. Dokáže přemýšlet (nejen sumarizovat) o obsahu PDF dokumentů.
Zajímavé je projít si poznatky z promptování od profesora z univerzity ve Whartonu, Ethana Mollicka. Ten nazývá myšlenkový řetězec R1 fascinujícím, je dle něj, jako by člověk přemýšlel nahlas.
Je na něm vidět, jak usilovně přemýšlí a dokáže vás svým myšlenkovým procesem provést.
There’s a subtle psychological impact also. As opposed to models that just answer you, or even o1’s distilled version, the chain of thought with its little bits of hesitation & near anxiety makes you really feel for the model: “The poor little LLM is working so hard for me” pic.twitter.com/yc7MzoBdzV
Přes to všechno je při napojení na API o 95 % levnější než o1.
Je tu tedy nový velký jazykový model, který dle dodaných benchmaků překonává v mnohém ChatGPT-01 i model Claude Sonnet 3.5 od společnosti Anthropic. Ty s ním přitom nemohou cenou soupeřit.
To ovšem neznamená, že zmíněné LLMs od amerických společností to nyní mohou zabalit. Ač Donald Trump hned po nástupu do úřadu anuloval Bidenův exekutivní příkaz o AI, a omezil tak regulační požadavky na AI společnosti, jsou data u OpenAI nebo Anthropic pravděpodobně ve větším bezpečí než u čínských nástrojů, ke kterým má tamní vláda tzv. „zadní vrátka“. Není to tak zrovna místo pro probírání byznysových tajemství.
Zdroj: X / Ethan Mollick
A samozřejmě je v něm i cenzura. O nezávislosti Taiwanu nebo masakru na náměstí Tchien-an-men v roce 1989 se s vámi R1 prostě bavit nebude. I tak ale stojí za to si s ním popovídat.
V tuto chvíli to jde po lokální instalaci jazykového modelu na vašem počítači, na což potřebujete slušnou hardwarovou výbavu a nižší stovky gigabajtů volné paměti na disku. Více např. v tomto návodu, o menších hardwarových požadavcích (R1 funguje od 16 GB RAM) mluví uživatelé v této diskuzi na Redditu.
Online se po jednoduché registraci dostanete k nedávno spuštěnému modelu DeepSeek-V3, v němž se vám schopnosti modelu R1 zpřístupní poté, co přímo v boxu pro prompty kliknete na volbu "DeepThink".
Do jaké hloubky přemýšlí? Podívejte se na jeho schopnosti v oblasti marketingové strategie ve videu AI experta Rubena Hassida, který chtěl pomoci s propagací svého LLM nástroje pro tvorbu obsahu na LinkedIn, EasyGen.
Kam dál?
Připomeňte si, co vše umí argumentační model ChatGPT-o1 v článku: