V mnohém lepší než ChatGPT-o1 a zadarmo. Je tu čínský DeepSeek-R1

23. 1. 2025 | Petr Michl

Z Číny přichází nový konkurent ChatGPT – model DeepSeek-R1. Tvůrci tvrdí, že je rychlejší, chytřejší a navíc úplně zdarma. Má to ale háček… přečtěte si, zda mu opravdu stojí za to dát šanci.

Ani Čína nevzdává boj o nejlepší velký jazykový model (LLM) současnosti. Z tamní laboratoře pro umělou inteligenci DeepSeek vzešla nová verze takzvaného „argumentačního modelu“ DeepSeek-R1. A není to žádné ořezávátko.

DeepSeek tvrdí, že překonává ChatGPT-o1 v benchmarcích AIME (výkon LLM), MATH-500 (slovní matematické úlohy) a SWE-bench Verified (programování). Jde o open-source projekt, který je pro běžné užití zdarma. Má tzv. MIT License, a nedává tak žádné zábrany ani komerčnímu využití.

Zdroj: huggingface.co

R1 je modelem zaměřeným na uvažování (reasoning), podobně jako zmíněný o1 od ChatGPT. Stejně jako on, je pomalejší v reakcích, ale zvládá být pomocníkem i vědcům a je spolehlivější v matematice, fyzice nebo přírodních vědách. Využívá posilování učení (RL), aby zdokonalil své uvažování a potvrdil si fakta.

Ověřuje si informace, umí hledat online. Dokáže přemýšlet (nejen sumarizovat) o obsahu PDF dokumentů.

Zajímavé je projít si poznatky z promptování od profesora z univerzity ve Whartonu, Ethana Mollicka. Ten nazývá myšlenkový řetězec R1 fascinujícím, je dle něj, jako by člověk přemýšlel nahlas.

Je na něm vidět, jak usilovně přemýšlí a dokáže vás svým myšlenkovým procesem provést.

There’s a subtle psychological impact also. As opposed to models that just answer you, or even o1’s distilled version, the chain of thought with its little bits of hesitation & near anxiety makes you really feel for the model: “The poor little LLM is working so hard for me” pic.twitter.com/yc7MzoBdzV
— Ethan Mollick (@emollick) January 20, 2025

Přes to všechno je při napojení na API o 95 % levnější než o1.

Je tu tedy nový velký jazykový model, který dle dodaných benchmaků překonává v mnohém ChatGPT-01 i model Claude Sonnet 3.5 od společnosti Anthropic. Ty s ním přitom nemohou cenou soupeřit.

To ovšem neznamená, že zmíněné LLMs od amerických společností to nyní mohou zabalit. Ač Donald Trump hned po nástupu do úřadu anuloval Bidenův exekutivní příkaz o AI, a omezil tak regulační požadavky na AI společnosti, jsou data u OpenAI nebo Anthropic pravděpodobně ve větším bezpečí než u čínských nástrojů, ke kterým má tamní vláda tzv. „zadní vrátka“. Není to tak zrovna místo pro probírání byznysových tajemství.

Zdroj: X / Ethan Mollick

A samozřejmě je v něm i cenzura. O nezávislosti Taiwanu nebo masakru na náměstí Tchien-an-men v roce 1989 se s vámi R1 prostě bavit nebude. I tak ale stojí za to si s ním popovídat.

V tuto chvíli to jde po lokální instalaci jazykového modelu na vašem počítači, na což potřebujete slušnou hardwarovou výbavu a nižší stovky gigabajtů volné paměti na disku. Více např. v tomto návodu, o menších hardwarových požadavcích (R1 funguje od 16 GB RAM) mluví uživatelé v této diskuzi na Redditu.

Online se po jednoduché registraci dostanete k nedávno spuštěnému modelu DeepSeek-V3, v němž se vám schopnosti modelu R1 zpřístupní poté, co přímo v boxu pro prompty kliknete na volbu "DeepThink".

Do jaké hloubky přemýšlí? Podívejte se na jeho schopnosti v oblasti marketingové strategie ve videu AI experta Rubena Hassida, který chtěl pomoci s propagací svého LLM nástroje pro tvorbu obsahu na LinkedIn, EasyGen.

Kam dál?

Připomeňte si, co vše umí argumentační model ChatGPT-o1 v článku:

Přemýšlí jako člověk s doktorátem. Nový model ChatGPT vám dá odpovědi i na velmi složité otázky

Štítky dokumentu: AI

Adresáti:*
Váš e-mail:*		Váše jméno:
Připojit zprávu: