V mnohém lepší než ChatGPT-o1 a zadarmo. Je tu čínský DeepSeek-R1
Ani Čína nevzdává boj o nejlepší velký jazykový model současnosti. Z tamní laboratoře pro umělou inteligenci DeepSeek vzešla nová verze takzvaného „argumentačního modelu“ DeepSeek-R1. A není to žádné ořezávátko.
DeepSeek tvrdí, že překonává ChatGPT-o1 v benchmarcích AIME (výkon LLM), MATH-500 (slovní matematické úlohy) a SWE-bench Verified (programování). Jde o open-source projekt, který je pro běžné užití zdarma. Má tzv. MIT License, a nedává tak žádné zábrany ani komerčnímu využití.
Zdroj: huggingface.co
R1 je modelem zaměřeným na uvažování (reasoning), podobně jako zmíněný o1 od ChatGPT. Stejně jako on, je pomalejší v reakcích, ale zvládá být pomocníkem i vědcům a je spolehlivější v matematice, fyzice nebo přírodních vědách. Využívá posilování učení (RL), aby zdokonalil své uvažování a potvrdil si fakta.
Ověřuje si informace, umí hledat online. Dokáže přemýšlet (nejen sumarizovat) o obsahu PDF dokumentů.
Zajímavé je projít si poznatky z promptování od profesora z univerzity ve Whartonu, Ethana Mollicka. Ten nazývá myšlenkový řetězec R1 fascinujícím, je dle něj, jako by člověk přemýšlel nahlas.
Je na něm vidět, jak usilovně přemýšlí a dokáže vás svým myšlenkovým procesem provést.
There’s a subtle psychological impact also. As opposed to models that just answer you, or even o1’s distilled version, the chain of thought with its little bits of hesitation & near anxiety makes you really feel for the model: “The poor little LLM is working so hard for me” pic.twitter.com/yc7MzoBdzV
Přes to všechno je při napojení na API o 95 % levnější než o1.
Obzvláště vývojáře pak potěší, že ho lze provozovat i lokálně z vlastního hardwaru (Viz Reddit).
Je tu tedy nový velký jazykový model, který údajně překonává ChatGPT-01 a i model Claude Sonnet 3.5 od společnosti Anthropic. Ty s ním přitom nemohou cenou soupeřit.
To ovšem neznamená, že zmíněné LLM od amerických společností to nyní mohou zabalit. Ač Donald Trump hned po nástupu do úřadu anuloval Bidenův exekutivní příkaz o AI a omezil tak regulační požadavky na AI společnosti, jsou data u OpenAI nebo Anthropic pravděpodobně ve větším bezpečí než u čínských nástrojů, ke kterým má tamní vláda tzv. „zadní vrátka“. Není to tak zrovna místo pro probírání byznysových tajemství.
Zdroj: X / Ethan Mollick
A samozřejmě je v něm i cenzura. O nezávislosti Taiwanu nebo masakru na náměstí Tchien-an-men v roce 1989 se s vámi R1 prostě bavit nebude. I tak ale stojí za to si s ním popovídat