
o3-mini ja o3-mini (kõrge) vabastatakse täna.

Tavakasutajad saavad ka o3-mini, ja pluss kasutajad saavad kasutada o3-mini (kõrge).
o3-mini (kõrge) on umbes 200 punkti kõrgem kui o1 Codeforce'il, kiirem kui o1 ja saavutab paremaid tulemusi kodeerimisel ja matemaatikas, kuid kulud on endiselt o1-mini tasemel.

Lisaks saavad kasutajad kasutada o3-mini 100 korda päevas. Siiski tuleb o3-mini (kõrge) kasutuspiirangut veel kinnitada.
Mõned netikodanikud ütlesid, et jah, R1 on nii populaarne, et Openai ei saa end tagasi hoida:


Ja varem, Alibaba Qwen meeskond avaldas uusaasta õhtul qwen2.5-max. Kevadfestivali ajal peavad kõik ikka veel veerema, hahaha...
Tegelikult juba jõulude ajal otseülekandes, Openai teatas, et o3 mini on saadaval 2025. aasta alguses:


Me peame veel rääkima, mis on o3 ja o3-mini?
o3: Tipptasemel järeldusmudel, mis paistab silma kodeerimise, matemaatika ja isegi AGI-le orienteeritud võrdlustestides. See seab uue mõõdupuu intelligentsuse ja probleemide lahendamise jaoks.
o3-mini: Kulutõhus o3 versioon, mis pakub parimat jõudlust väga madala hinna ja kiirusega.
Need mudelid on viinud järeldamise täiesti uuele tasemele, võimaldades läbimurdeid keerukates ülesannetes, mis nõuavad põhjalikku mõistmist ja loogikat.
o3 toob kaasa kolm olulist läbimurret.
Programmeerimisvõime: 71,7% täpsus praktilises programmeerimises, 20% kõrgem kui o1. 2727 punkti Codeforces, mis ületab juba inimese taset.
Matemaatika tase: peaaegu 97% täpsus USA matemaatikaolümpiaadi kvalifikatsioonivoorus. Isegi kõige keerulisemate Epic AI frontier matemaatikaülesannete puhul on võimalik saada 25% tulemusi.
Kõige hämmastavam on Arc AGI test: 87,5%, ületades esimest korda inimesi selles äärmiselt keerulises võrdlustestis.

Miks on o3-mini murranguline uuendus? o3-mini toob kaasa kaks muudatust.
Kohanduv mõtlemine: mõtlemise sügavust saab reguleerida vastavalt ülesande raskusastmele; valida saab kolme režiimi vahel: madal, keskmine ja kõrge.
See muudab tehisintellekti paremini vastavaks tegelikele kasutusstsenaariumidele.
Läbimurre kulutõhususes: madalamad kulud kui o1-mini, kiirem reageerimine ja paremad tulemused.
Kuid netikodanikud kurdavad, et o3 kõrge tarbib $1,000 ühe ülesande kohta:

Lisaks on tõepoolest liiga palju mudeleid ja me ei ole veel kinnitanud, kuidas nende vahel vahetada.
