'n Omvattende vergelyking van OpenAI se nuut vrygestelde o3-mini en DeepSeek R1

OpenAI het sy nuutste afleidingsmodel vrygestel, o3-mini, wat geoptimaliseer is vir velde soos wetenskap, wiskunde en programmering, wat vinniger reaksie, hoër akkuraatheid en laer koste bied.

In vergelyking met sy voorganger o1-mini, het o3-mini sy afleidingsvermoë aansienlik verbeter, veral in die oplossing van komplekse probleme. Toetsers verkies o3-mini se antwoorde met 56%, en die foutkoers is verminder met 39%. Van vandag af, ChatGPT Plus, span en Pro gebruikers kan o3-mini gebruik, en gratis gebruikers kan ook sommige van sy kenmerke ervaar.

In vergelyking met die afleidingsmodel DeepSeek-R1, net hoeveel beter is OpenAI o3-mini as R1?

Hierdie artikel sal eers 'n oorsig gee van die hoogtepunte van o3-mini, en dan sal ons die data van beide kante op elke maatstaf onttrek en 'n grafiek maak om dit visueel te vergelyk. Daarbenewens sal ons ook die prys van o3-mini vergelyk.

Inhoudsopgawe

Kernhoogtepunte

1.STEM-optimering: blink uit op die gebied van wiskunde, programmering, wetenskap, ens., en oortref veral o1-mini in die hoë afleidingspogingsmodus.

2.Ontwikkelaar funksies: ondersteun funksies soos funksie-oproepe, gestruktureerde uitset en ontwikkelaarboodskappe om aan die behoeftes van die produksie-omgewing te voldoen.

3.Vinnige reaksie: 24% vinniger as o1-mini, met 'n reaksietyd van 7,7 sekondes per versoek.

4.Sekuriteit verbetering: verseker veilige en betroubare uitset deur diepbelyningstegnologie.

5.Koste-effektief: afleidingsvermoëns en kosteoptimalisering gaan hand aan hand, wat die drempel vir KI-gebruik aansienlik verminder.

Vergelyk

Oop AI Om sy klas uit te lig, sy amptelike blog vergelyk dit net met sy eie modelle. Daarom is hierdie artikel 'n tabel wat uit die DeepSeek R1-vraestel en die data van die amptelike OpenAI-blog onttrek is.

OpenAI vergelyk amptelik o3-mini in die weergawelys, verdeel dit in drie weergawes: laag, medium en hoog, wat afleidingssterkte aandui. Aangesien DeepSeek Math-500 gebruik en OpenAI die Math-datastel gebruik, is hierdie vergelyking hier verwyder.

'n Grafiek is meer intuïtief, en Codeforces is verwyder omdat die waardes te groot is om intuïtief vertoon te word. Die vergelyking op Codeforces toon egter dat o3-mini se hoë afleidingssterkte nie veel van 'n voorsprong is nie.

↑1AIME2024→2GPQA Diamant→3MMLU→4SWE-bank-geverifieer

Uit die grafiek is daar 'n totaal van 4 vergelykings, en die O3-mini (hoog) lei gewoonlik, maar die voorsprong is baie klein.

Prys

model	Insetprys	Kas getref	Uitset prys
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Opsomming

Met DeepSeek R1 wat die DeepSeek Panic in die Verenigde State veroorsaak het, was die eerste wat bedreig voel OpenAI, wat veral duidelik is in die pryse van sy nuwe model o3-mini.

Toe Openai o1 die eerste keer vrygestel is, het die hoë prys daarvan druk op baie ontwikkelaars en gebruikers geplaas. Die voorkoms van DeepSeek R1 het almal meer keuses gegee.Van die 30-voudige prysverskil tussen o1 en R1 tot die finale prys van o3-mini twee keer is die prys van DeepSeek R1,

toon die impak van DeepSeek R1 op openai.ChatGPT gratis gebruikers kan egter net o3-mini op 'n beperkte manier ervaar, terwyl DeepSeek se Deep Thinking tans vir alle gebruikers beskikbaar is.Ek sien ook uit daarna om openai meer toonaangewende AI-modelle te bring, terwyl die gebruikskoste vir gebruikers verminder word.

Uit die perspektief van 'n blogger se persoonlike ervaring met R1, wil ek sê dat R1 se Deep Thinking altyd my gedagtes oopmaak. Ek beveel aan dat almal dit meer gebruik om oor probleme te dink~

Ongekategoriseer

Wat is FlashMLA? 'n Omvattende gids tot die impak daarvan op KI-dekoderingspitte

Deurdeepseeker 24 Februarie 202524 Februarie 2025

FlashMLA het vinnig aandag gekry in die wêreld van kunsmatige intelligensie, veral op die gebied van groot taalmodelle (LLM's). Hierdie innoverende instrument, ontwikkel deur DeepSeek, dien as 'n geoptimaliseerde dekoderingskern wat ontwerp is vir Hopper GPU's - hoëprestasieskyfies wat algemeen in AI-berekeninge gebruik word. FlashMLA fokus op die doeltreffende verwerking van reekse van veranderlike lengte, wat dit besonder goed geskik maak ...

Ongekategoriseer

DeepSeek het dit gedoen! OpenAI erken geslote bron fout, voorpuntvoordeel word kleiner

Deurzddeepseeker 2 Februarie 20252 Februarie 2025

Nadat OpenAI die o3-mini-model vrygestel het, het sy uitvoerende hoof, Sam Altman, hoofnavorsingsbeampte Mark Chen, hoofprodukbeampte Kevin Weil; Visepresident van Ingenieurswese Srinivas Narayanan, hoof van API-navorsing Michelle Pokrass, en hoof van navorsing Hongyu Ren, het 'n aanlyn tegniese V&A op reddit, een van die wêreld se grootste omvattende forums, gedoen. Die hoofonderwerpe…

Ongekategoriseer

Hoe is DeepSeek geskep? 'n Ontleding van DeepSeek se groeigeskiedenis

Deurzddeepseeker 3 Februarie 20253 Februarie 2025

In die toekoms sal daar meer en meer hardcore-innovasie wees. Dit is dalk nie nou maklik om te verstaan nie, want die hele sosiale groep moet deur feite opgevoed word. Wanneer hierdie samelewing mense wat hardcore innoveer toelaat om sukses te behaal, sal die kollektiewe ingesteldheid verander. Ons het net 'n klomp feite en 'n proses nodig ....

Ongekategoriseer

Gemini 2.0 oorheers die kaarte, terwyl DeepSeek V3 huil in sy prys, en 'n nuwe koste-effektiewe kampioen word gebore!

Deurzddeepseeker 8 Februarie 20258 Februarie 2025

Die Google Gemini 2.0-familie is uiteindelik voltooi! Dit oorheers die kaarte sodra dit vrygestel word. Te midde van die agtervolging en blokkades van Deepseek, Qwen en o3, het Google vroeg vanoggend drie modelle in een slag vrygestel: Gemini 2.0 Pro, Gemini 2.0 Flash en Gemini 2.0 Flash-Lite. Op die groot model LMSYS-ranglys, Gemini ...

Ongekategoriseer

a16z dialoog met 27-jarige HUB: AI Agent het 'n groot hefboomeffek, en langtermynpryse sal gekoppel word aan arbeidskoste

Deurzddeepseeker 8 Februarie 20258 Februarie 2025

Hoogtepunte AI Agent hervorm die kliënt-ervaring Jesse Zhang: Hoe word 'n Agent eintlik saamgestel? Ons siening is dat dit mettertyd meer en meer soos 'n natuurlike taalgebaseerde Agent sal word, want dit is hoe die groot taalmodelle (LLM'e) opgelei word. Op die lang termyn, as jy 'n super intelligente agent het wat ...

Ongekategoriseer

Brekende nuus! OpenAI het vandag 2 nuwe afleidingsmodelle vrygestel: o3-mini en o3-mini-hoog.

Deurzddeepseeker 1 Februarie 20251 Februarie 2025

o3-mini en o3-mini (hoog) sal vandag vrygestel word. Gereelde gebruikers sal ook o3-mini kry, en plus gebruikers sal o3-mini (hoog) kan gebruik. o3-mini (hoog) is ongeveer 200 punte hoër as o1 op Codeforce, vinniger as o1, en presteer beter in kodering en wiskunde, maar die koste is steeds op die vlak van o1-mini ….

Kernhoogtepunte

Vergelyk

Prys

Opsomming

Soortgelyke plasings

Maak 'n opvolg-bydrae Kanselleer die opvolg-bydrae