o3-mini en o3-mini (hoog) worden vandaag uitgebracht.

Regelmatige gebruikers krijgen ook o3-minien plus-gebruikers kunnen o3-mini (hoog) gebruiken.

o3-mini (hoog) is ongeveer 200 punten hoger dan o1 op Codeforce, sneller dan o1 en presteert beter op het gebied van codering en wiskunde, maar de kosten liggen nog steeds op het niveau van o1-mini.

Plus-gebruikers kunnen o3-mini 100 keer per dag gebruiken. De gebruikslimiet van o3-mini (hoog) moet echter nog verder worden bevestigd.

Sommige netizens zeiden, ja, R1 is zo populair dat Openai zich niet kan inhouden:

En eerder bracht het Alibaba Qwen team qwen2.5-max uit op oudejaarsavond. Tijdens het Lentefeest moet iedereen nog rollen, haha...

In feite al tijdens de live-uitzending van Kerstmis, Openai kondigde aan dat o3 mini begin 2025 beschikbaar zal zijn:

Moeten we het nog hebben over wat o3 en o3-mini zijn?

o3: Een geavanceerd inferentiemodel dat uitblinkt in codering, wiskunde en zelfs AGI-georiënteerde benchmarktests. Het stelt een nieuwe norm voor intelligentie en probleemoplossing.

o3-mini: Een kosteneffectieve versie van o3 die superieure prestaties levert tegen zeer lage kosten en snelheden.

Deze modellen hebben inferentie naar een geheel nieuw niveau getild, waardoor doorbraken mogelijk zijn in complexe taken die diepgaand begrip en logica vereisen.

o3 zorgt voor drie belangrijke doorbraken.

Programmeervaardigheid: 71,7% nauwkeurigheid in praktische programmering, 20% hoger dan o1. 2727 punten op Codeforces, overtreft nu al het menselijke niveau.

Wiskunde-niveau: bijna 97% nauwkeurigheid in de VS Wiskunde Olympiade kwalificatieronde. Zelfs de moeilijkste Epic AI-frontier wiskundeproblemen kunnen 25% resultaten opleveren.

Het meest verbazingwekkende is de Arc AGI test: 87.5%, waarmee we mensen voor het eerst overtreffen in deze extreem moeilijke benchmarktest.

Waarom is de o3-mini een baanbrekende innovatie? De o3-mini brengt twee veranderingen.

Adaptief denken: de redeneerdiepte kan worden aangepast aan de moeilijkheidsgraad van de taak, met drie standen om uit te kiezen: laag, gemiddeld en hoog.

Hierdoor sluit de AI beter aan bij echte gebruiksscenario's.

Doorbraak in kosteneffectiviteit: lagere kosten dan de o1-mini, snellere respons en betere resultaten.

Netizens klagen echter dat o3 high $1,000 per taak verbruikt:

Bovendien zijn er inderdaad te veel modellen beschikbaar, en we moeten nog bevestigen hoe we tussen de modellen kunnen schakelen.

Vergelijkbare berichten

Geef een reactie

Uw e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *