
o3-mini in o3-mini (visoko) bosta izšla danes.

Prejeli bodo tudi običajni uporabniki o3-mini, uporabniki plus pa bodo lahko uporabljali o3-mini (visoko).
o3-mini (visoko) je približno 200 točk višji od o1 na Codeforce, hitrejši od o1 in se bolje obnese pri kodiranju in matematiki, vendar je cena še vedno na ravni o1-mini.

Poleg tega lahko uporabniki uporabljajo o3-mini 100-krat na dan. Vendar je treba omejitev uporabe o3-mini (visoko) dodatno potrditi.
Nekateri uporabniki interneta so rekli, da, R1 je tako priljubljen, da se Openai ne more zadržati:


In prej je ekipa Alibaba Qwen izdala qwen2.5-max na predvečer novega leta. Med pomladnim festivalom se morajo še vsi vrtati, hahaha ...
Pravzaprav že v božičnem prenosu v živo, Openai je napovedal, da bo o3 mini na voljo v začetku leta 2025:


Moramo še govoriti o tem, kaj sta o3 in o3-mini?
o3: Vrhunski model sklepanja, ki blesti pri kodiranju, matematiki in celo primerjalnih testih, usmerjenih v AGI. Postavlja nova merila za inteligenco in reševanje problemov.
o3-mini: Stroškovno učinkovita različica o3, ki zagotavlja vrhunsko delovanje ob zelo nizkih stroških in hitrosti.
Ti modeli so sklepanje dvignili na povsem novo raven in omogočili preboje pri kompleksnih nalogah, ki zahtevajo poglobljeno razumevanje in logiko.
o3 prinaša tri velike preboje.
Sposobnost programiranja: 71.7% natančnost v praktičnem programiranju, 20% višja od o1. 2727 točk na Codeforces, kar že presega človeško raven.
Raven matematike: skoraj 97% natančnost v kvalifikacijskem krogu ameriške matematične olimpijade. Celo najtežje mejne matematične težave Epic AI lahko dobijo rezultate 25%.
Najbolj neverjetna stvar je test Arc AGI: 87.5%, ki je prvič presegel ljudi na tem izjemno težkem primerjalnem testu.

Zakaj je o3-mini prelomna inovacija? O3-mini prinaša dve spremembi.
Prilagodljivo razmišljanje: globino razmišljanja je mogoče prilagoditi glede na težavnost naloge, na izbiro pa so trije načini: nizka, srednja in visoka.
Zaradi tega je umetna inteligenca bolj usklajena s scenariji uporabe v resničnem svetu.
Preboj glede stroškovne učinkovitosti: nižji stroški kot o1-mini, hitrejši odziv in boljši rezultati.
Vendar uporabniki interneta objokujejo, da o3 high porabi $1000 na opravilo:

Poleg tega je na voljo res preveč modelov in moramo še potrditi, kako preklapljati med njimi.
