O comparație cuprinzătoare între o3-mini și DeepSeek R1 recent lansate de OpenAI

OpenAI a lansat cel mai recent model de inferență, o3-mini, care este optimizat pentru domenii precum știința, matematica și programarea, oferind un răspuns mai rapid, o precizie mai mare și un cost mai scăzut.

Comparativ cu predecesorul său o1-mini, o3-mini și-a îmbunătățit semnificativ capacitățile de inferență, în special în rezolvarea problemelor complexe. Evaluatorii preferă răspunsurile lui o3-mini cu 56%, iar rata de eroare a fost redusă cu 39%. Începând de astăzi, ChatGPT Plus, Echipa și Pro utilizatorii pot utiliza o3-mini, iar utilizatori liberi poate experimenta, de asemenea, unele dintre caracteristicile sale.

Comparativ cu modelul de inferență DeepSeek-R1, doar cât de mult mai bine este OpenAI o3-mini decât R1?

Acest articol va oferi mai întâi o imagine de ansamblu a aspectelor principale ale o3-mini și apoi vom extrage datele din ambele părți pe fiecare punct de referință și vom face un grafic pentru a le compara vizual. În plus, vom compara și prețul o3-mini.

Tabla de conținut

Aspecte principale

1.Optimizarea STEM: excelează în domeniile matematicii, programării, științei etc., depășind în special o1-mini în modul efort mare de inferență.

2.Funcțiile dezvoltatorului: suportă funcții precum apeluri de funcții, ieșire structurată și mesaje pentru dezvoltatori pentru a satisface nevoile mediului de producție.

3.Răspuns rapid: 24% mai rapid decât o1-mini, cu un timp de răspuns de 7,7 secunde per cerere.

4.Îmbunătățirea securității: asigură o ieșire sigură și fiabilă prin tehnologia de aliniere profundă.

5.Rentabil: capacitățile de inferență și optimizarea costurilor merg mână în mână, reducând considerabil pragul pentru utilizarea IA.

Comparați

Open AI Pentru a evidenția clasa sa, sistemul său blog oficial îl compară doar cu propriile sale modele. Prin urmare, acest articol este un tabel extras din lucrarea DeepSeek R1 și datele de pe blogul oficial OpenAI.

OpenAI compară oficial o3-mini în lista de versiuni, împărțind-o în trei versiuni: scăzută, medie și ridicată, care indică puterea de inferență. Deoarece DeepSeek utilizează Math-500 și OpenAI utilizează setul de date Math, această comparație a fost eliminată aici.

Un grafic este mai intuitiv, iar Codeforces a fost eliminat deoarece valorile sunt prea mari pentru a fi afișate intuitiv. Cu toate acestea, comparația pe Codeforces arată că puterea de inferență ridicată a o3-mini nu este un avantaj prea mare.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verificat

Din grafic, există un total de 4 comparații, iar O3-mini (ridicat) conduce în general, dar avansul este foarte mic.

Preț

model	Prețul de intrare	Cache hit	Prețul de ieșire
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Rezumat

După ce DeepSeek R1 a declanșat panica DeepSeek în Statele Unite, primul care s-a simțit amenințat a fost OpenAI, ceea ce este evident în special în prețul noului său model o3-mini.

Când Openai o1 a fost lansat pentru prima dată, prețul său ridicat a pus presiune pe mulți dezvoltatori și utilizatori. Apariția DeepSeek R1 a oferit tuturor mai multe opțiuni.De la diferența de preț de 30 de ori între o1 și R1 la prețul final al o3-mini de două ori mai mare prețul de DeepSeek R1,

arată impactul DeepSeek R1 asupra openai.Cu toate acestea, utilizatorii ChatGPT gratuite pot experimenta o3-mini doar într-un mod limitat, în timp ce DeepSeek Deep Thinking este în prezent disponibil pentru toți utilizatorii.De asemenea, aștept cu nerăbdare ca openai să aducă mai multe modele AI de vârf, reducând în același timp costul de utilizare pentru utilizatori.

Din perspectiva experienței personale a unui blogger care utilizează R1, aș dori să spun că gândirea profundă a lui R1 îmi deschide întotdeauna mintea. Recomand tuturor să-l folosească mai mult pentru a se gândi la probleme~

Fără categorie

Confruntarea celor mai bune patru modele! O recenzie demonstrează cât de puternic este Deepseek R1

Prinzddeepseeker 1 iunie 20251 iunie 2025

În ultimele zile, Deepseek-R1 0528 a fost oficial open-source. Pe LiveCodeBench, performanța sa este aproape la egalitate cu o3 (high) al OpenAI; în testul de referință multilingv al Aider, se compară cu Claude Opus. Când a fost lansat pe site-ul oficial, am testat rapid capacitățile sale front-end și le-am constatat a fi excepțional de...

Fără categorie

DeepSeek a reușit! OpenAI recunoaște greșeala sursei închise, avantajul de lider devine mai mic

Prinzddeepseeker februarie 2, 2025februarie 2, 2025

După ce OpenAI a lansat modelul o3-mini, CEO-ul Sam Altman, Chief Research Officer Mark Chen, Chief Product Officer Kevin Weil; Vicepreședintele departamentului de inginerie Srinivas Narayanan, Head of API Research Michelle Pokrass, și Head of Research Hongyu Ren, au efectuat o Q&A tehnică online pe reddit, unul dintre cele mai mari forumuri cuprinzătoare din lume. Principalele subiecte...

Fără categorie

DeepSeek TOP17 Cele mai bune alternative: analiză cuprinzătoare (2025)

Prindeepseeker 6 februarie 20256 februarie 2025

Introducere În peisajul în evoluție rapidă al inteligenței artificiale, DeepSeek a apărut ca un model de limbaj puternic. Această analiză cuprinzătoare explorează primele 17 alternative la DeepSeek, examinând caracteristicile, capabilitățile și cazurile de utilizare ale acestora. Cercetarea noastră se concentrează atât pe platformele internaționale, cât și pe cele chineze care oferă integrare DeepSeek sau capabilități similare. Analiza alternativelor de top 1….

Fără categorie

În cercul IA, DeepSeek R1 a depășit în mod constant o1 și Claude în testele fizice și am intrat în epoca de aur a RL.

Prinzddeepseeker februarie 1, 2025februarie 1, 2025

Niciunul dintre noi nu se aștepta ca 2025 să înceapă astfel în domeniul inteligenței artificiale. DeepSeek R1 este cu adevărat uimitor! Recent, "misterioasa putere orientală" DeepSeek a "controlat dur" Silicon Valley. I-am cerut lui R1 să explice în detaliu teorema lui Pitagora. Toate acestea au fost făcute de AI în mai puțin de 30 de secunde, fără...

Fără categorie

Cum a fost creat DeepSeek? O analiză a istoriei de creștere a DeepSeek

Prinzddeepseeker februarie 3, 2025februarie 3, 2025

În viitor, vor exista din ce în ce mai multe inovații hardcore. S-ar putea să nu fie ușor de înțeles acum, deoarece întregul grup social trebuie să fie educat prin fapte. Atunci când această societate le va permite oamenilor care inovează radical să aibă succes, mentalitatea colectivă se va schimba. Avem nevoie doar de o grămadă de fapte și de un proces....

Fără categorie

Google a lansat trei modele noi simultan: Gemini-2.0-Pro este gratuit, are un scor remarcabil și se află pe primul loc și este potrivit pentru codificarea și procesarea solicitărilor complexe!

Prinzddeepseeker 8 februarie 20258 februarie 2025

Povestea Gemini 2.0 se accelerează. Versiunea Flash Thinking Experimental din decembrie a adus dezvoltatorilor un model de lucru cu latență scăzută și performanță ridicată. La începutul acestui an, 2.0 Flash Thinking Experimental a fost actualizat în Google AI Studio pentru a îmbunătăți și mai mult performanța, combinând viteza Flash cu capabilități îmbunătățite de inferență. Săptămâna trecută,…

O comparație cuprinzătoare a noilor o3-mini și DeepSeek R1 lansate de OpenAI

Aspecte principale

Comparați

Preț

Rezumat

Confruntarea celor mai bune patru modele! O recenzie demonstrează cât de puternic este Deepseek R1

DeepSeek a reușit! OpenAI recunoaște greșeala sursei închise, avantajul de lider devine mai mic

DeepSeek TOP17 Cele mai bune alternative: analiză cuprinzătoare (2025)

În cercul IA, DeepSeek R1 a depășit în mod constant o1 și Claude în testele fizice și am intrat în epoca de aur a RL.

Cum a fost creat DeepSeek? O analiză a istoriei de creștere a DeepSeek

Google a lansat trei modele noi simultan: Gemini-2.0-Pro este gratuit, are un scor remarcabil și se află pe primul loc și este potrivit pentru codificarea și procesarea solicitărilor complexe!

Lasă un răspuns Anulează răspunsul

Aspecte principale

Comparați

Preț

Rezumat

Posturi similare

Lasă un răspuns Anulează răspunsul