OpenAI je izdal svoj najnovejši model sklepanja, o3-mini, ki je optimiziran za področja, kot so znanost, matematika in programiranje, ter zagotavlja hitrejši odziv, večjo natančnost in nižje stroške.

V primerjavi s svojim predhodnikom o1-mini je o3-mini bistveno izboljšal svoje sposobnosti sklepanja, predvsem pri reševanju kompleksnih problemov. Preizkuševalci imajo raje odgovore o3-mini s 56%, stopnja napak pa se je zmanjšala za 39%. od danes naprej ChatGPT Plus, ekipa in Pro uporabniki lahko uporabljajo o3-mini in brezplačni uporabniki lahko izkusijo tudi nekatere njegove lastnosti.

V primerjavi z modelom sklepanja DeepSeek-R1, koliko bolje je OpenAI o3-mini kot R1?

Ta članek bo najprej podal pregled vrhuncev o3-mini, nato pa bomo izluščili podatke z obeh strani za vsako merilo uspešnosti in naredili graf za vizualno primerjavo. Poleg tega bomo primerjali tudi ceno o3-mini.

Osnovni poudarki

1.STEM optimizacija: odlikuje se na področjih matematike, programiranja, znanosti itd., še posebej prekaša o1-mini v načinu visokega sklepanja.

2.Funkcije razvijalca: podpira funkcije, kot so funkcijski klici, strukturirani izhodi in sporočila razvijalcev za izpolnjevanje potreb produkcijskega okolja.

3.Hitra odzivnost: 24% hitrejši od o1-mini, z odzivnim časom 7,7 sekunde na zahtevo.

4.Izboljšanje varnosti: zagotavlja varen in zanesljiv izpis s tehnologijo globoke poravnave.

5.Stroškovno učinkovito: zmožnosti sklepanja in optimizacija stroškov gredo z roko v roki, kar močno zmanjša prag za uporabo umetne inteligence.

Primerjaj

Open AI Da bi poudaril svoj razred, je uradni blog le primerja s svojimi modeli. Zato je ta članek tabela, pridobljena iz papirja DeepSeek R1 in podatkov iz uradnega bloga OpenAI.

OpenAI uradno primerja o3-mini na seznamu različic in ga razdeli na tri različice: nizko, srednjo in visoko, ki označujejo moč sklepanja. Ker DeepSeek uporablja Math-500, OpenAI pa nabor podatkov Math, je bila ta primerjava tu odstranjena.

Grafikon je bolj intuitiven, Codeforces pa je bil odstranjen, ker so vrednosti prevelike, da bi jih lahko prikazali intuitivno. Vendar pa primerjava na Codeforces kaže, da visoka moč sklepanja o3-mini ni velika prednost.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-preverjeno

Iz lestvice so skupaj 4 primerjave in O3-mini (visoko) na splošno vodi, vendar je prednost zelo majhna.

Cena

modelVhodna cenaZadetek predpomnilnikaIzhodna cena
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

Povzetek

Z DeepSeek R1, ki je v ZDA sprožil paniko DeepSeek, se je prvi počutil ogroženega OpenAI, kar je še posebej očitno pri cenah njegovega novega modela o3-mini.

Ko je bil Openai o1 prvič izdan, je njegova visoka cena pritiskala na številne razvijalce in uporabnike. Videz DeepSeek R1 je vsem dal več izbire.Od 30-kratne razlike v ceni med o1 in R1 do dvakratne končne cene o3-mini cena DeepSeek R1,

prikazuje vpliv DeepSeek R1 na openai.Vendar lahko brezplačni uporabniki ChatGPT izkusijo o3-mini le na omejen način, medtem ko je Deep Thinking DeepSeek trenutno na voljo vsem uporabnikom.Veselim se tudi, da bo openai prinesel več vodilnih modelov AI in hkrati znižal stroške uporabe za uporabnike.

Z vidika blogerjeve osebne izkušnje z uporabo R1 bi rad rekel, da mi globoko razmišljanje R1 vedno odpre misli. Priporočam, da ga vsi uporabljajo več za razmišljanje o težavah~

Podobne objave

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja