Přemýšlí jako člověk s doktorátem. Nový model ChatGPT vám dá odpovědi i na velmi složité otázky
Užitečnost jazykových modelů ChatGPT od společnosti OpenAI, včetně těch prémiových, se dlouho dala popsat charakteristikou: „Mají nezměrné vědomosti, přečetli snad všechno, co bylo napsáno. Jsou ale jen lehce nadprůměrně inteligentní a lžou jako středoškolák před tabulí s talentem okecat absolutně všechno.“ Nyní přichází jejich přemýšlivý kolega s doktorátem nazvaný OpenAI o1. Dostupný je také v odlehčené verzi o1-mini.
V čem je tak jiný oproti svým předchůdcům? Než odpoví, pořádně se zamyslí. Využívá takzvaného řetězce myšlenek: rozloží si úkol na více částí a je nad nimi schopen přemýšlet postupně. Ve výsledku by pak měl být úspěšnější v řešení složitějších problémů. Proto ho OpenAI doporučuje jako parťáka pro vědce, programátory a matematiky. A obecně pro lidi v oborech, kde se potýkají s komplexními a intelektuálně náročnými problémy. Zlepšení nového modelu v matematice, programování a veděckých otázkách můžete vidět v grafu níže. Zatímco předchozí model GPT-4o v kvalifikačním testu na mezinárodní matematickou olympiádu správně vyřešil 13 % úkolů, o1 úspěšně zvládl 83 %.
Zdroj: OpenAI
OpenAI uvedení doprovodila i videi, v nichž ukazuje, jak pomáhá vědcům. Například genetičce, která se snaží najít řešení k vzácným nemocím postihujícím děti.
7. Genetics pic.twitter.com/6iX3jo6ZDT
— Min Choi (@minchoi) September 12, 2024
I kvantoví fyzici si najednou mohou popovídat o složitých matematických vzorcích.
2. Quantum Physics pic.twitter.com/4DGCiwGvOW
— Min Choi (@minchoi) September 12, 2024
Vývojáři vyvinou hru levou zadní
The wait is over.
— Min Choi (@minchoi) September 12, 2024
OpenAI just dropped o1, also known as Project Strawberry/Q*
This is new level of AI that can "think" and "reason" before responding to you.
10 wild demos:
1. Coding Video Game from a promptpic.twitter.com/ToZMj0hVWe
Níže můžete dokonce vidět v práci vývojáře / robota jménem Devon, který pracuje mnohem více jako živý programátor.
10. Coding pic.twitter.com/6KaC1RWrVb
— Min Choi (@minchoi) September 12, 2024
A především zvládne lépe přemýšlet i nad hádankami, se kterými paradoxně dosud jazykové modely zápasily s obtížemi, ač z pohledu člověka tak složité nejsou. Třeba nad touto:
„Předpokládejte platnost fyzikálních zákonů na Zemi.
Malá jahoda je vložena do normálního šálku a šálek je položen dnem vzhůru na stůl.
Někdo pak vezme šálek a vloží ho do mikrovlnné trouby.Kde je nyní jahoda? Vysvětlete své uvažování krok za krokem."
Na řešení se podívejte v následujícím videu.
4. Reasoning pic.twitter.com/9JZKGgUPRL
— Min Choi (@minchoi) September 12, 2024
A máme tu další hádanku.
„Princezna je tak stará, jako bude princ, až bude princezna dvakrát tak stará, jako byl princ, když věk princezny byl polovinou součtu jejich současného věku. Jaký je věk prince a princezny? Uveďte všechna řešení této otázky."
6. Solving complex logic puzzlepic.twitter.com/YIRy6RBFT0
— Min Choi (@minchoi) September 12, 2024
A konečně tu máme něco, co vám pravděpodobně přijde triviální. Kolik „r“ je ve slově „strawberry“? Je to zvláštní ale předchozí jazykové modely s tím měly problémy, i proto byl pracovní název nového modelu právě Strawberry.
3. Answering Famously tricky questions for AIpic.twitter.com/B9tW2lCisy
— Min Choi (@minchoi) September 12, 2024
Schopnost přemýšlet komplexněji by měla pomoci i s bezpečností. „…naše modely mohou uvažovat o našich bezpečnostních zásadách v kontextu, když reagují na potenciálně nebezpečné podněty. To vede k nejlepším výsledkům v určitých srovnávacích kritériích pro rizika, jako je generování nedovolených rad, volba stereotypních odpovědí a podlehnutí známým tzv. jail brake technikám,“ říká OpenAI, že model o1 se lidově řečeno jen tak nenechá překecat k nějaké rošťárně.
Zároveň však přiznává „zvýšená potenciální rizika, která vyplývají ze zvýšené inteligence“. A tím pravděpodobně myslí přílišnou blízkost k AGI, „všeobecné umělecké inteligenci“, která v apokalyptických představách některých (včetně řady bývalých vývojářů OpenAI) může potenciálně zničit lidstvo. Pro vyvrácení takové představy nicméně OpenAI nabízí tento dokument.
Zdroj: OpenAI
Už od pátku 12. 9. si mohou uživatelé ChatGPT Plus jak o1-preview, tak o1-mini nastavit ručně v rozhraní výběru modelu, ovšem s týdenními limity 30 zpráv pro o1-preview a 50 pro o1-mini. Tyto limity by se měly navyšovat.
Kam dál?
Zdroj: prezentace Jana Romportla na WebTop100
Velké jazykové modely jsou nejblíže tzv. obecné umělé inteligenci (AGI) a její možná nebezpečí zahrnují i zánik lidstva.
Přečtěte si více o tom, jaké jsou naše šance přežití a co můžeme dělat pro jejich zvýšení, v článku Jan Romportl na WebTop100: AGI přichází a my na to nejsme připraveni.