
o3-mini laat op de avond, en OpenAI onthulde eindelijk zijn nieuwste troef. Tijdens een Reddit AMA Q&A bekende Altman diep dat hij aan de verkeerde kant van de open source AI had gestaan.
Hij zei dat de interne strategie van open source wordt overwogen en dat het model verder ontwikkeld zal worden, maar dat de voorsprong van OpenAI niet meer zo groot zal zijn als voorheen.
Terwijl iedereen zich nog steeds verwonderde over de verbazingwekkende kracht van DeepSeek, kon OpenAI eindelijk niet meer stilzitten.
In de vroege ochtend van gisteren werd o3-mini met spoed gelanceerd, waarbij een nieuwe SOTA werd neergezet in benchmarktests zoals wiskundige code en terugkeer naar de troon.
Het belangrijkste is dat gratis gebruikers het ook kunnen ervaren! o3-mini is geen grap. In het "laatste examen voor mensen" behaalde o3-mini (hoog) direct de beste nauwkeurigheid en kalibratiefout.

Een paar uur na o3-mini ging onlineopende OpenAI officieel een Reddit AMA voor ongeveer een uur.
Altman ging zelf ook online en beantwoordde alle vragen van netizens.

De belangrijkste hoogtepunten zijn:
- DeepSeek is inderdaad erg goeden we zullen betere modellen blijven ontwikkelen, maar de voorsprong zal niet meer zo groot zijn als voorheen.
- Vergeleken met een paar jaar geleden ben ik nu meer geneigd om te geloven dat AI snelle sprongen kan maken
- We staan aan de verkeerde kant van het open-sourcen van gewogen AI-modellen
- Er komt binnenkort een update voor de geavanceerde spraakmodus en we noemen het direct GPT-5, niet GPT-5o. Er is nog geen specifiek tijdschema.
Naast Altman zelf waren ook Chief Research Officer Mark Chen, Chief Product Officer Kevin Weil, Vice President of Engineering Srinivas Narayanan, Head of API Research Michelle Pokrass en Head of Research Hongyu Ren online en beantwoordden ze zorgvuldig alle vragen van netizens.
Laten we vervolgens eens kijken naar wat ze allemaal zeiden.
Altman heeft diep berouw, de verkeerde kant gekozen in de open source AI-strijd
De plotselinge comeback van DeepSeek kwam misschien voor iedereen onverwacht.
Tijdens de AMA Q&A had Altman zelf ook diep berouw over het kiezen van de verkeerde kant in de open source AI-strijd en moest hij de sterke voordelen van DeepSeek toegeven.
Wat veel mensen verbaasde was dat Altman zelfs zei dat de voorsprong van OpenAI niet meer zo sterk was als vroeger.
Hieronder volgen alle klassieke antwoorden die we van Altman hebben verzameld.
V: Laten we het hebben over het grote onderwerp van de week: Deepseek. Het is duidelijk een zeer indrukwekkend model, en ik weet dat het waarschijnlijk is getraind bovenop de output van andere LLM's. Hoe verandert dit uw plannen voor toekomstige modellen?
Altman: Het is inderdaad een indrukwekkend model! We zullen betere modellen ontwikkelen, maar we zullen niet zo'n grote voorsprong kunnen houden als in voorgaande jaren.
V: Denkt u dat recursieve zelfverbetering een geleidelijk proces zal zijn of een plotselinge start?
Altman: Persoonlijk denk ik dat ik meer geneigd ben om te denken dat AI snel vooruitgang kan boeken dan een paar jaar geleden. Misschien is het tijd om iets over dit onderwerp te schrijven...
V: Kunnen we alle tokens zien waar het model aan denkt?
Altman: Ja, we zullen binnenkort een nuttigere en meer gedetailleerde versie laten zien. Met dank aan R1 voor de update.
Kevin Weil, Chief Product Officer: We werken eraan om meer te laten zien dan we nu doen - dit zal binnenkort gebeuren. Of we alles laten zien of niet, moeten we nog bepalen. Het tonen van alle gedachteketens (CoT) zou leiden tot het distilleren van concurrentiemodellen, maar we weten ook dat gebruikers (in ieder geval gevorderde gebruikers) dit willen zien, dus we zullen een goede balans vinden.
V: Wanneer is de volledige versie van o3 beschikbaar?
Altman: Ik schat dat het meer dan een paar weken zal zijn, maar niet meer dan een paar maanden.
V: Komt er een update voor de spraakmodus? Is dit mogelijk een aandachtspunt voor GPT-5o? Wat is de ruwe tijdslijn voor GPT-5o?
Altman: Ja, er komt een update voor de geavanceerde spraakmodus! Ik denk dat we het gewoon GPT-5 gaan noemen, niet GPT-5o. Er is nog geen specifieke tijdlijn.
V: Zou je overwegen om wat modelgewichten vrij te geven en wat onderzoek te publiceren?
Altman: Ja, we zijn het aan het bespreken. Persoonlijk denk ik dat we aan de verkeerde kant van deze kwestie staan en met een andere open source strategie moeten komen; niet iedereen bij OpenAI deelt deze mening en het heeft op dit moment niet onze hoogste prioriteit.
Nog één vragenset:
- Hoe dicht zijn we bij het aanbieden van Operator in het reguliere Plus-programma?
- Wat zijn de topprioriteiten van de robotica-afdeling?
- Wat vindt OpenAI van meer gespecialiseerde chips/TPU's, zoals Trillium, Cerebras, etc.? Besteedt OpenAI hier aandacht aan?
- Welke investeringen worden gedaan om toekomstige risico's in AGI en ASI af te dekken?
- Wat was je meest gedenkwaardige vakantie?
Altman:
- Een paar maanden
- op kleine schaal een echt goede robot produceren en leren van de ervaring
- De GB200 is momenteel moeilijk te verslaan!
- Een goede keuze zou zijn om je innerlijke staat te verbeteren - veerkracht, aanpassingsvermogen, kalmte, vreugde, enz.
- Het is moeilijk kiezen! Maar de eerste twee die in me opkomen zijn: backpacken in Zuidoost-Azië of een safari in Afrika.
V: Bent u van plan om de prijs van de Plus-serie te verhogen?
Altman: Eigenlijk wil ik het geleidelijk verminderen.
V: Stel dat het nu 2030 is en je hebt net een systeem gemaakt dat de meeste mensen een AGI zouden noemen. Het blinkt uit in alle benchmarktests en overtreft je beste ingenieurs en onderzoekers op het gebied van snelheid en prestaties. Wat is de volgende stap? Heb je, behalve "het op de website zetten en het als dienst aanbieden", nog andere plannen?
Altman: De belangrijkste impact zal naar mijn mening het versnellen van wetenschappelijke ontdekkingen zijn, wat volgens mij de factor is die het meest zal bijdragen aan het verbeteren van de kwaliteit van leven.
4o beeldgeneratie, binnenkort
Vervolgens werden reacties van andere OpenAI leden toegevoegd.
V: Zijn jullie nog steeds van plan om de 4o image generator te lanceren?
Kevin Weil, Chief Product Officer: Ja! En ik denk dat het wachten het waard is.
V: Geweldig! Is er een ruw tijdschema?
Kevin Weil, Chief Product Officer: Je vraagt me om in de problemen te komen. Misschien een paar maanden.
En nog een soortgelijke vraag.
V: Wanneer kunnen we ChatGPT-5 verwachten?
Kevin Weil, Chief Product Officer: Kort na o-17 micro en GPT-(π+1).
En er komt nog een vraag naar boven:
- Welke andere soorten agenten kunnen we verwachten?
- En ook een agent leveren voor gratis gebruikers, wat de adoptie zou kunnen versnellen...
- Nog updates over de nieuwe versie van DALL-E?
- Nog een laatste vraag, de vraag die iedereen stelt... Wanneer wordt AGI geïmplementeerd?
Kevin Weil, Chief Product Officer:
- Meer agenten: zeer, zeer binnenkort. Ik denk dat je blij zult zijn.
- Beeldgeneratie gebaseerd op 4o: over een paar maanden, ik kan niet wachten tot je het gebruikt. Het is geweldig.
- AGI: Ja
V: Bent u van plan om functionaliteit voor bestandsbijlagen toe te voegen aan het redeneermodel?
Srinivas Narayanan, VP Engineering: Het is in ontwikkeling. In de toekomst zal het redeneermodel verschillende tools kunnen gebruiken, waaronder zoekfuncties.
Kevin Weil, Chief Product Officer: Gewoon om te zeggen dat ik niet kan wachten om het redeneringsmodel te zien om tools te kunnen gebruiken
V: Echt waar. Als je dit probleem oplost, opent zich een aantal zeer nuttige AI-toepassingsscenario's. Stel je voor dat het de inhoud van je werkdocumenten van 500 GB kan begrijpen.
Wanneer je op het punt staat om een e-mail te beantwoorden, wordt er een paneel geopend naast je e-mail app dat continu alle informatie analyseert die betrekking heeft op deze persoon, inclusief jullie relatie, de onderwerpen die zijn besproken, werk in het verleden, enz. Misschien wordt iets uit een document dat je al lang vergeten bent gemarkeerd omdat het zeer relevant is voor de huidige discussie. Ik wil deze functie zo graag.
Srinivas Narayanan, VP Engineering: We werken aan het verlengen van de context. Er is nog geen vaste datum/aankondiging.
V: Hoe belangrijk is het Stargate-project voor de toekomst van OpenAI? Kevin Weil, Chief Product Officer: Heel belangrijk. Alles wat we hebben gezien wijst erop dat hoe meer rekenkracht we hebben, hoe betere modellen we kunnen bouwen en hoe waardevollere producten we kunnen maken.
We schalen modellen op dit moment in twee dimensies - grotere pre-training en meer reinforcement learning (RL)/"strawberry" training - die beide rekenkracht vereisen.
Voor het bedienen van honderden miljoenen gebruikers zijn ook computermiddelen nodig! En omdat we steeds meer intelligente agentproducten ontwikkelen die continu voor je kunnen werken, zijn hiervoor ook computermiddelen nodig. Je kunt Stargate dus zien als onze fabriek, waar elektriciteit/GPU's worden omgezet in geweldige producten.
V: Welk intern model gebruiken jullie nu? o4, o5 of o6? Hoeveel slimmer zijn deze interne modellen vergeleken met o3?
Michelle Pokrass, hoofd API-onderzoek: We zijn de tel kwijtgeraakt.
V: Sta ons alsjeblieft toe om te communiceren met tekst/canvas met behulp van geavanceerde spraakfuncties. Ik wil ertegen kunnen spreken en het documenten laten aanpassen.
Kevin Weil, Chief Product Officer: Ja! We hebben een heleboel geweldige tools die relatief onafhankelijk van elkaar zijn ontwikkeld - het doel is om die tools zo snel mogelijk in uw handen te krijgen.
De volgende stap is om al deze functies te integreren, zodat je kunt praten met een model, dat tegelijkertijd zoekt en redeneert, en een canvas kunt genereren dat Python kan uitvoeren. Alle tools moeten beter samenwerken. En trouwens, alle modellen hebben volledige toegang tot de tools nodig (de o-serie modellen kunnen momenteel niet alle tools gebruiken), wat ook geïmplementeerd zal worden.
V: Wanneer ondersteunen de modellen uit de o-serie de geheugenfunctie in ChatGPT?
Michelle Pokrass, hoofd API-onderzoek: Het is in ontwikkeling! Het verenigen van al onze functies met de modellen uit de o-serie heeft onze hoogste prioriteit.
V: Komen er nog grote verbeteringen aan 4o? Ik hou echt van de aangepaste GPT, en het zou geweldig zijn als het kon worden geüpgraded, of als we konden kiezen welk model te gebruiken in de aangepaste GPT (zoals de o3 mini).
Michelle Pokrass, hoofd API-onderzoek: Ja, we zijn nog niet klaar met de 4o-serie!