OpenAI a lansat cel mai recent model de inferență, o3-mini, care este optimizat pentru domenii precum știința, matematica și programarea, oferind un răspuns mai rapid, o precizie mai mare și un cost mai scăzut.

Comparativ cu predecesorul său o1-mini, o3-mini și-a îmbunătățit semnificativ capacitățile de inferență, în special în rezolvarea problemelor complexe. Evaluatorii preferă răspunsurile lui o3-mini cu 56%, iar rata de eroare a fost redusă cu 39%. Începând de astăzi, ChatGPT Plus, Echipa și Pro utilizatorii pot utiliza o3-mini, iar utilizatori liberi poate experimenta, de asemenea, unele dintre caracteristicile sale.

Comparativ cu modelul de inferență DeepSeek-R1, doar cât de mult mai bine este OpenAI o3-mini decât R1?

Acest articol va oferi mai întâi o imagine de ansamblu a aspectelor principale ale o3-mini și apoi vom extrage datele din ambele părți pe fiecare punct de referință și vom face un grafic pentru a le compara vizual. În plus, vom compara și prețul o3-mini.

Aspecte principale

1.Optimizarea STEM: excelează în domeniile matematicii, programării, științei etc., depășind în special o1-mini în modul efort mare de inferență.

2.Funcțiile dezvoltatorului: suportă funcții precum apeluri de funcții, ieșire structurată și mesaje pentru dezvoltatori pentru a satisface nevoile mediului de producție.

3.Răspuns rapid: 24% mai rapid decât o1-mini, cu un timp de răspuns de 7,7 secunde per cerere.

4.Îmbunătățirea securității: asigură o ieșire sigură și fiabilă prin tehnologia de aliniere profundă.

5.Rentabil: capacitățile de inferență și optimizarea costurilor merg mână în mână, reducând considerabil pragul pentru utilizarea IA.

Comparați

Open AI Pentru a evidenția clasa sa, sistemul său blog oficial îl compară doar cu propriile sale modele. Prin urmare, acest articol este un tabel extras din lucrarea DeepSeek R1 și datele de pe blogul oficial OpenAI.

OpenAI compară oficial o3-mini în lista de versiuni, împărțind-o în trei versiuni: scăzută, medie și ridicată, care indică puterea de inferență. Deoarece DeepSeek utilizează Math-500 și OpenAI utilizează setul de date Math, această comparație a fost eliminată aici.

Un grafic este mai intuitiv, iar Codeforces a fost eliminat deoarece valorile sunt prea mari pentru a fi afișate intuitiv. Cu toate acestea, comparația pe Codeforces arată că puterea de inferență ridicată a o3-mini nu este un avantaj prea mare.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verificat

Din grafic, există un total de 4 comparații, iar O3-mini (ridicat) conduce în general, dar avansul este foarte mic.

Preț

modelPrețul de intrareCache hitPrețul de ieșire
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

Rezumat

După ce DeepSeek R1 a declanșat panica DeepSeek în Statele Unite, primul care s-a simțit amenințat a fost OpenAI, ceea ce este evident în special în prețul noului său model o3-mini.

Când Openai o1 a fost lansat pentru prima dată, prețul său ridicat a pus presiune pe mulți dezvoltatori și utilizatori. Apariția DeepSeek R1 a oferit tuturor mai multe opțiuni.De la diferența de preț de 30 de ori între o1 și R1 la prețul final al o3-mini de două ori mai mare prețul de DeepSeek R1,

arată impactul DeepSeek R1 asupra openai.Cu toate acestea, utilizatorii ChatGPT gratuite pot experimenta o3-mini doar într-un mod limitat, în timp ce DeepSeek Deep Thinking este în prezent disponibil pentru toți utilizatorii.De asemenea, aștept cu nerăbdare ca openai să aducă mai multe modele AI de vârf, reducând în același timp costul de utilizare pentru utilizatori.

Din perspectiva experienței personale a unui blogger care utilizează R1, aș dori să spun că gândirea profundă a lui R1 îmi deschide întotdeauna mintea. Recomand tuturor să-l folosească mai mult pentru a se gândi la probleme~

Posturi similare

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *