
o3-mini og o3-mini (høj) bliver frigivet i dag.

Almindelige brugere vil også få o3-mini, og plus-brugere vil kunne bruge o3-mini (high).
o3-mini (høj) er ca. 200 point højere end o1 på Codeforce, hurtigere end o1 og klarer sig bedre i kodning og matematik, men prisen er stadig på niveau med o1-mini.

Plus-brugere kan bruge o3-mini 100 gange om dagen. Brugsgrænsen for o3-mini (høj) skal dog bekræftes yderligere.
Nogle netbrugere sagde, ja, R1 er så populær, at Openai ikke kan holde sig tilbage:


Og tidligere udgav Alibaba Qwen-teamet qwen2.5-max på nytårsaften. Under forårsfestivalen har alle stadig brug for at rulle, hahaha ...
Faktisk allerede i julens live-udsendelse, Openai annoncerede, at o3 mini vil være tilgængelig i begyndelsen af 2025:


Vi mangler stadig at tale om, hvad o3 og o3-mini er?
o3: En banebrydende inferensmodel, der udmærker sig i kodning, matematik og endda AGI-orienterede benchmark-tests. Den sætter en ny standard for intelligens og problemløsning.
o3-mini: En omkostningseffektiv version af o3, der giver overlegen ydelse til en meget lav pris og hastighed.
Disse modeller har bragt slutninger op på et helt nyt niveau og muliggjort gennembrud i komplekse opgaver, der kræver dybtgående forståelse og logik.
o3 bringer tre store gennembrud.
Programmeringsevne: 71,7% nøjagtighed i praktisk programmering, 20% højere end o1. 2727 point på Codeforces, hvilket allerede overgår det menneskelige niveau.
Matematisk niveau: næsten 97% nøjagtighed i kvalifikationsrunden til den amerikanske matematikolympiade. Selv de sværeste matematiske problemer på Epic AI-grænsen kan give resultater på 25%.
Det mest fantastiske er Arc AGI-testen: 87,5%, hvilket overgår mennesker for første gang i denne ekstremt vanskelige benchmark-test.

Hvorfor er o3-mini en disruptiv innovation? o3-mini medfører to ændringer.
Adaptiv tænkning: Ræsonnementets dybde kan justeres i forhold til opgavens sværhedsgrad med tre tilstande at vælge imellem: lav, medium og høj.
Det gør, at AI'en kommer tættere på brugsscenarier i den virkelige verden.
Gennembrud for omkostningseffektivitet: lavere omkostninger end o1-mini, hurtigere respons og bedre resultater.
Men netbrugere klager over, at o3 high bruger $1.000 pr. opgave:

Derudover er der faktisk for mange modeller til rådighed, og vi har endnu ikke fået bekræftet, hvordan man skifter mellem dem.
