o3-mini přišla pozdě v noci a OpenAI konečně odhalila svůj nejnovější trumf. Během dotazů a odpovědí na Redditu AMA Altman hluboce přiznal, že stál na špatné straně open source AI.

Uvedl, že interní strategie open source se zvažuje a model se bude nadále rozvíjet, ale náskok OpenAI nebude tak velký jako dříve.

Zatímco všichni stále žasli nad úžasným výkonem DeepSeek, OpenAI už konečně nemohla zůstat v klidu.

Včera brzy ráno byl naléhavě spuštěn o3-mini, který stanovil nové SOTA ve srovnávacích testech, jako je matematický kód a návrat na trůn.

Nejdůležitější je, že si to mohou vyzkoušet i uživatelé zdarma! o3-mini není žádný vtip. V "poslední zkoušce pro lidi" dosáhl o3-mini (high) přímo nejlepší přesnosti a chyby kalibrace.

Několik hodin po o3-mini je online, společnost OpenAI oficiálně otevřela přibližně hodinovou diskusi AMA na Redditu.

Sám Altman se také připojil na internet a odpověděl na všechny otázky uživatelů sítě.

Mezi hlavní body patří:

  • DeepSeek je skutečně velmi dobrýa budeme pokračovat ve vývoji lepších modelů, ale náskok nebude tak velký jako dříve.
  • V porovnání s dobou před několika lety se nyní více přikláním k názoru, že umělá inteligence může zaznamenat rychlý skok.
  • V otázce open-sourcingu vážených modelů AI stojíme na špatné straně
  • Brzy bude aktualizován pokročilý hlasový režim, který budeme nazývat přímo GPT-5, nikoli GPT-5o. Konkrétní časový plán zatím neexistuje.

Kromě samotného Altmana byli online také ředitel výzkumu Mark Chen, produktový ředitel Kevin Weil, viceprezident pro inženýrství Srinivas Narayanan, vedoucí výzkumu API Michelle Pokrass a vedoucí výzkumu Hongyu Ren, kteří pečlivě odpovídali na všechny otázky uživatelů sítě.

Dále se podívejme na to, co všichni řekli.

Altman se hluboce kaje, že se v bitvě o open source AI postavil na špatnou stranu

Náhlý návrat DeepSeek byl možná pro všechny nečekaný.

Sám Altman se v průběhu AMA Q&A také hluboce kál, že se v bitvě o open source AI postavil na špatnou stranu, a musel přiznat silné výhody DeepSeek.

Mnoho lidí udivilo, že Altman dokonce řekl, že náskok OpenAI už není tak silný jako dříve.

Následují všechny klasické odpovědi, které jsme od Altmana shromáždili.

Otázka: Promluvme si o velkém tématu týdne: Deepseek. Je to zjevně velmi působivý model a vím, že byl pravděpodobně vycvičen na základě výstupů jiných LLM. Jak to změní vaše plány pro budoucí modely?

Altman: Je to skutečně velmi působivý model! Budeme vyvíjet lepší modely, ale nebudeme schopni udržet tak velký náskok jako v předchozích letech.

Otázka: Myslíte si, že rekurzivní sebezdokonalování bude postupný proces, nebo náhlý start?

Altman: Osobně si myslím, že jsem více nakloněn názoru, že umělá inteligence může dosáhnout rychlého pokroku, než jsem byl před několika lety. Možná je načase napsat něco na toto téma...

Otázka: Můžeme vidět všechny žetony, na které model myslí?

Altman: Ano, brzy ukážeme užitečnější a podrobnější verzi. Děkujeme R1 za aktualizaci.

Kevin Weil, ředitel pro produkty: Pracujeme na tom, abychom ukázali více než nyní - to se stane brzy. Zda budeme ukazovat všechno, nebo ne, se teprve rozhodne. Zobrazení všech myšlenkových řetězců (CoT) by vedlo k destilaci konkurenčních modelů, ale také víme, že uživatelé (alespoň pokročilí) to chtějí vidět, takže najdeme dobrou rovnováhu.

Otázka: Kdy bude k dispozici plná verze o3?

Altman: Odhaduji, že to bude trvat déle než několik týdnů, ale ne déle než několik měsíců.

Otázka: Bude aktualizován hlasový režim? Je to potenciální zaměření pro GPT-5o? Jaký je přibližný časový plán pro GPT-5o?

Altman: Ano, aktualizace pokročilého hlasového režimu se chystá! Myslím, že mu budeme říkat GPT-5, ne GPT-5o. Zatím nemáme žádný konkrétní časový plán.

Otázka: Uvažujete o zveřejnění některých modelových vah a o zveřejnění nějakého výzkumu?

Altman: Ano, diskutujeme o tom. Osobně si myslím, že jsme v této otázce na špatné straně a musíme přijít s jinou open source strategií; ne všichni v OpenAI tento názor sdílejí a v tuto chvíli to není naše nejvyšší priorita.

Ještě jedna sada otázek:

  • Jak blízko jsme nabídce operátora v běžném programu Plus?
  • Jaké jsou hlavní priority oddělení robotiky?
  • Co si OpenAI myslí o specializovanějších čipech/TPU, jako je Trillium, Cerebras atd.? Věnuje tomu OpenAI pozornost?
  • Jaké investice se provádějí k zajištění proti budoucím rizikům v AGI a ASI?
  • Jaká byla vaše nezapomenutelná dovolená?

Altman:

  • Několik měsíců
  • vyrobit skutečně dobrého robota v malém měřítku a poučit se ze zkušeností.
  • GB200 je v současné době těžko překonatelný!
  • Dobrou volbou by bylo zlepšit svůj vnitřní stav - odolnost, přizpůsobivost, klid, radost atd.
  • Je těžké si vybrat! Ale první dvě, které mě napadají, jsou: cestování s batohem v jihovýchodní Asii nebo safari v Africe.

Otázka: Plánujete zvýšit cenu řady Plus?

Altman: Vlastně je chci postupně snižovat.

Otázka: Předpokládejme, že se píše rok 2030 a vy jste právě vytvořili systém, který by většina lidí nazvala AGI. Vyniká ve všech srovnávacích testech a rychlostí a výkonem předčí vaše nejlepší inženýry a výzkumníky. Co bude dál? Máte kromě toho, že "to umístíte na web a budete to nabízet jako službu", nějaké další plány?

Altman: Nejdůležitějším dopadem bude podle mého názoru urychlení vědeckých objevů, což je podle mého názoru faktor, který nejvíce přispěje ke zlepšení kvality života.

4o generování obrázků, již brzy

Dále byly přidány odpovědi od ostatních členů OpenAI.

Otázka: Plánujete ještě spustit generátor obrázků 4o?

Kevin Weil, ředitel pro produkty: Ano! A myslím, že se vyplatí počkat.

Otázka: Skvělé! Existuje nějaký hrubý časový plán?

Kevin Weil, ředitel pro produkty: Chceš po mně, abych se dostal do potíží. Možná na pár měsíců.

A další podobná otázka.

Otázka: Kdy můžeme očekávat ChatGPT-5?

Kevin Weil, ředitel pro produkty: Krátce po o-17 micro a GPT-(π+1).

A vyvstává další otázka:

  • Jaké další typy agentů můžeme očekávat?
  • A také poskytnout agenta pro uživatele zdarma, což by mohlo urychlit přijetí...
  • Nějaké novinky ohledně nové verze DALL-E?
  • Poslední otázka, na kterou se ptá každý: Kdy bude AGI zavedeno?

Kevin Weil, ředitel pro produkty:

  • Více agentů: velmi, velmi brzy. Myslím, že budete spokojeni.
  • Generování obrázků na základě 4o: za pár měsíců, nemůžu se dočkat, až ho budete používat. Je to skvělé.
  • AGI: Ano

Otázka: Plánujete do modelu zdůvodnění přidat funkci přikládání souborů?

Srinivas Narayanan, viceprezident pro inženýrství: Je ve vývoji. V budoucnu bude model uvažování schopen využívat různé nástroje, včetně vyhledávacích funkcí.

Kevin Weil, ředitel pro produkty: Jen chci říct, že se nemůžu dočkat, až uvidím model uvažování, který bude schopen používat nástroje.

Otázka: Opravdu. Když tento problém vyřešíte, otevřou se vám některé velmi užitečné scénáře použití umělé inteligence. Představte si, že by dokázala porozumět obsahu vašich 500GB pracovních dokumentů.

Když se chystáte odpovědět na e-mail, otevře se vedle e-mailové aplikace panel, který průběžně analyzuje všechny informace týkající se této osoby, včetně vašeho vztahu, diskutovaných témat, předchozí práce atd. Možná bude označeno něco z dokumentu, na který jste již dávno zapomněli, protože je vysoce relevantní pro aktuální diskusi. Tuhle funkci bych strašně chtěl.

Srinivas Narayanan, viceprezident pro inženýrství: Pracujeme na prodloužení délky kontextu. Zatím nemáme žádné pevné datum/oznámení.

Otázka: Jak důležitý je projekt Stargate pro budoucnost OpenAI? Kevin Weil, ředitel pro produkty: Velmi důležité. Vše, co jsme viděli, naznačuje, že čím větší výpočetní výkon máme, tím lepší modely můžeme vytvářet a tím hodnotnější produkty můžeme vytvářet.

V současné době škálujeme modely ve dvou dimenzích - větší předtrénování a větší posilování učení (RL)/"jahodové" trénování - obojí vyžaduje výpočetní zdroje.

Obsluha stovek milionů uživatelů vyžaduje také výpočetní zdroje! A s přechodem na inteligentnější agentské produkty, které pro vás mohou pracovat nepřetržitě, to také vyžaduje výpočetní zdroje. Hvězdnou bránu tedy můžete považovat za naši továrnu, kde se elektřina/GPU přeměňují na úžasné produkty.

Otázka: Jaký model nyní používáte? o4, o5 nebo o6? O kolik jsou tyto interní modely inteligentnější ve srovnání s modelem o3?

Michelle Pokrass, vedoucí oddělení výzkumu API: Ztratili jsme přehled.

Otázka: Umožněte nám prosím interakci s textem/plátnem při použití pokročilých hlasových funkcí. Chci mít možnost na něj mluvit a nechat ho iterativně upravovat dokumenty.

Kevin Weil, ředitel pro produkty: Ano! Máme spoustu skvělých nástrojů, které byly vyvinuty relativně nezávisle - cílem je dostat tyto nástroje do vašich rukou co nejrychleji.

Dalším krokem je integrace všech těchto funkcí tak, abyste mohli komunikovat s modelem, který zároveň vyhledává a zdůvodňuje, a vygenerovat plátno, na kterém lze spustit Python. Všechny nástroje musí lépe spolupracovat. A mimochodem, všechny modely potřebují plný přístup k nástrojům (modely řady o v současné době nemohou používat všechny nástroje), což bude také implementováno.

Otázka: Kdy budou modely řady o podporovat funkci paměti v aplikaci ChatGPT?

Michelle Pokrass, vedoucí oddělení výzkumu API: Je ve vývoji! Sjednocení všech našich funkcí s modely řady o je naší hlavní prioritou.

Otázka: Budou v systému 4o nějaká zásadní vylepšení? Velmi se mi líbí vlastní GPT a bylo by skvělé, kdyby se dalo vylepšit, nebo kdybychom si mohli vybrat, který model se použije ve vlastním GPT (například o3 mini).

Michelle Pokrass, vedoucí oddělení výzkumu API: Ano, se sérií 4o jsme ještě neskončili!

Podobné příspěvky

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *