o3-mini i o3-mini (visoki) bit će objavljen danas.

Dobit će i redoviti korisnici o3-mini, i plus korisnici će moći koristiti o3-mini (visoki).

o3-mini (high) je za oko 200 bodova viši od o1 na Codeforceu, brži je od o1 i ima bolje rezultate u kodiranju i matematici, no cijena je još uvijek na razini o1-minija.

Plus korisnici mogu koristiti o3-mini 100 puta dnevno. Međutim, potrebno je dodatno potvrditi ograničenje upotrebe o3-mini (visoko).

Neki korisnici interneta rekli su, da, R1 je toliko popularan da se Openai ne može suzdržati:

A ranije je Alibaba Qwen tim na Staru godinu izdao qwen2.5-max. Tijekom Proljetnog festivala, svi još uvijek trebaju kotrljati, hahaha…

Naime, već u božićnom prijenosu uživo, Openai je najavio da će o3 mini biti dostupan početkom 2025:

Moramo još razgovarati o tome što su o3 i o3-mini?

o3: Vrhunski model zaključivanja koji se ističe u kodiranju, matematici, pa čak i AGI-orijentiranim referentnim testovima. Postavlja nova mjerila za inteligenciju i rješavanje problema.

o3-mini: Troškovno učinkovita verzija o3 koja pruža vrhunske performanse uz vrlo nisku cijenu i brzinu.

Ovi su modeli podigli zaključivanje na potpuno novu razinu, omogućujući proboje u složenim zadacima koji zahtijevaju dubinsko razumijevanje i logiku.

o3 donosi tri velika otkrića.

Sposobnost programiranja: 71.7% točnost u praktičnom programiranju, 20% veća od o1. 2727 bodova na Codeforcesu, što već premašuje ljudsku razinu.

Razina matematike: gotovo 97% točnost u kvalifikacijskom krugu Američke matematičke olimpijade. Čak i najteži matematički problemi Epic AI frontier mogu dati 25% rezultate.

Najnevjerojatnija stvar je Arc AGI test: 87.5%, koji po prvi put nadmašuje ljude na ovom izuzetno teškom benchmark testu.

Zašto je o3-mini revolucionarna inovacija? O3-mini donosi dvije promjene.

Prilagodljivo razmišljanje: dubina rasuđivanja može se prilagoditi prema težini zadatka, s tri načina za odabir: niskim, srednjim i visokim.

Time je AI bolje usklađen sa scenarijima korištenja u stvarnom svijetu.

Proboj u pogledu isplativosti: niži trošak od o1-mini, brži odziv i bolji rezultati.

Međutim, internet korisnici žale da o3 high troši $1000 po zadatku:

Osim toga, doista je dostupno previše modela, a tek trebamo potvrditi kako se mijenjati između njih.

Slični postovi

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)