OpenAI je objavio svoj najnoviji model zaključivanja, o3-mini, koji je optimiziran za područja kao što su znanost, matematika i programiranje, pružajući brži odgovor, veću točnost i nižu cijenu.
U usporedbi sa svojim prethodnikom o1-mini, o3-mini je značajno poboljšao svoje mogućnosti zaključivanja, posebno u rješavanju složenih problema. Testeri preferiraju o3-mini odgovore od 56%, a stopa pogrešaka je smanjena za 39%. od danas, ChatGPT Plus, tim i profesionalac korisnici mogu koristiti o3-mini i besplatni korisnici također može doživjeti neke od njegovih značajki.

U usporedbi s modelom zaključivanja DeepSeek-R1, koliko je bolje OpenAI o3-mini nego R1?
Ovaj članak prvo će dati pregled najvažnijih značajki o3-mini, a zatim ćemo izdvojiti podatke s obje strane za svaku referentnu vrijednost i napraviti grafikon za njihovu vizualnu usporedbu. Osim toga, usporedit ćemo i cijenu o3-minija.
Glavni naglasci
1.STEM optimizacija: ističe se u područjima matematike, programiranja, znanosti itd., posebno nadmašujući o1-mini u načinu rada s velikim naporom zaključivanja.
2.Funkcije programera: podržava funkcije kao što su pozivi funkcija, strukturirani izlaz i poruke programera kako bi se zadovoljile potrebe proizvodnog okruženja.
3.Brz odgovor: 24% brži od o1-mini, s vremenom odgovora od 7,7 sekundi po zahtjevu.
4.Poboljšanje sigurnosti: osigurava siguran i pouzdan izlaz kroz tehnologiju dubokog poravnanja.
5.Isplativo: mogućnosti zaključivanja i optimizacija troškova idu ruku pod ruku, uvelike smanjujući prag za korištenje umjetne inteligencije.
Usporedi
Open AI Kako bi istaknuo svoju klasu, svoj službeni blog samo ga uspoređuje sa svojim modelima. Stoga je ovaj članak tablica izvađena iz DeepSeek R1 papira i podataka sa službenog OpenAI bloga.
OpenAI službeno uspoređuje o3-mini na popisu verzija, razlažući ga na tri verzije: nisku, srednju i visoku, koje označavaju snagu zaključivanja. Budući da DeepSeek koristi Math-500, a OpenAI koristi skup podataka Math, ova je usporedba ovdje uklonjena.

Grafikon je intuitivniji, a Codeforces je uklonjen jer su vrijednosti prevelike da bi se intuitivno prikazale. Međutim, usporedba na Codeforcesu pokazuje da visoka snaga zaključivanja o3-minija nije velika prednost.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified
Iz grafikona ima ukupno 4 usporedbe, a O3-mini (visoka) uglavnom vodi, ali prednost je vrlo mala.
Cijena
model | Ulazna cijena | Pogodak predmemorije | Izlazna cijena |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Deepseek R1 | $0.55 | $0.14 | $2.19 |
Sažetak
Uz DeepSeek R1 koji je pokrenuo DeepSeek Panic u Sjedinjenim Državama, prvi se osjetio ugroženim OpenAI, što je posebno vidljivo u cijenama njegovog novog modela o3-mini.
Kada je Openai o1 prvi put objavljen, njegova visoka cijena izvršila je pritisak na mnoge programere i korisnike. Pojava DeepSeek R1 svima je dala više izbora.Od 30-struke razlike u cijeni između o1 i R1 do toga da je konačna cijena o3-mini dvostruko veća cijena DeepSeek R1,
pokazuje utjecaj DeepSeek R1 na openai.Međutim, besplatni korisnici ChatGPT-a mogu iskusiti o3-mini samo na ograničen način, dok je Deep Thinking DeepSeek trenutno dostupan svim korisnicima.Također se radujem što će openai donijeti više vodećih AI modela uz smanjenje troškova korištenja za korisnike.
Iz perspektive osobnog iskustva blogera u korištenju R1, želio bih reći da R1-ovo duboko razmišljanje uvijek otvori moj um. Preporučam da ga svi više koriste za razmišljanje o problemima~