o3-mini og o3-mini (høj) bliver frigivet i dag.

Almindelige brugere vil også få o3-mini, og plus-brugere vil kunne bruge o3-mini (high).

o3-mini (høj) er ca. 200 point højere end o1 på Codeforce, hurtigere end o1 og klarer sig bedre i kodning og matematik, men prisen er stadig på niveau med o1-mini.

Plus-brugere kan bruge o3-mini 100 gange om dagen. Brugsgrænsen for o3-mini (høj) skal dog bekræftes yderligere.

Nogle netbrugere sagde, ja, R1 er så populær, at Openai ikke kan holde sig tilbage:

Og tidligere udgav Alibaba Qwen-teamet qwen2.5-max på nytårsaften. Under forårsfestivalen har alle stadig brug for at rulle, hahaha ...

Faktisk allerede i julens live-udsendelse, Openai annoncerede, at o3 mini vil være tilgængelig i begyndelsen af 2025:

Vi mangler stadig at tale om, hvad o3 og o3-mini er?

o3: En banebrydende inferensmodel, der udmærker sig i kodning, matematik og endda AGI-orienterede benchmark-tests. Den sætter en ny standard for intelligens og problemløsning.

o3-mini: En omkostningseffektiv version af o3, der giver overlegen ydelse til en meget lav pris og hastighed.

Disse modeller har bragt slutninger op på et helt nyt niveau og muliggjort gennembrud i komplekse opgaver, der kræver dybtgående forståelse og logik.

o3 bringer tre store gennembrud.

Programmeringsevne: 71,7% nøjagtighed i praktisk programmering, 20% højere end o1. 2727 point på Codeforces, hvilket allerede overgår det menneskelige niveau.

Matematisk niveau: næsten 97% nøjagtighed i kvalifikationsrunden til den amerikanske matematikolympiade. Selv de sværeste matematiske problemer på Epic AI-grænsen kan give resultater på 25%.

Det mest fantastiske er Arc AGI-testen: 87,5%, hvilket overgår mennesker for første gang i denne ekstremt vanskelige benchmark-test.

Hvorfor er o3-mini en disruptiv innovation? o3-mini medfører to ændringer.

Adaptiv tænkning: Ræsonnementets dybde kan justeres i forhold til opgavens sværhedsgrad med tre tilstande at vælge imellem: lav, medium og høj.

Det gør, at AI'en kommer tættere på brugsscenarier i den virkelige verden.

Gennembrud for omkostningseffektivitet: lavere omkostninger end o1-mini, hurtigere respons og bedre resultater.

Men netbrugere klager over, at o3 high bruger $1.000 pr. opgave:

Derudover er der faktisk for mange modeller til rådighed, og vi har endnu ikke fået bekræftet, hvordan man skifter mellem dem.

Lignende indlæg

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *