OpenAI het sy nuutste afleidingsmodel vrygestel, o3-mini, wat geoptimaliseer is vir velde soos wetenskap, wiskunde en programmering, wat vinniger reaksie, hoër akkuraatheid en laer koste bied.

In vergelyking met sy voorganger o1-mini, het o3-mini sy afleidingsvermoë aansienlik verbeter, veral in die oplossing van komplekse probleme. Toetsers verkies o3-mini se antwoorde met 56%, en die foutkoers is verminder met 39%. Van vandag af, ChatGPT Plus, span en Pro gebruikers kan o3-mini gebruik, en gratis gebruikers kan ook sommige van sy kenmerke ervaar.

In vergelyking met die afleidingsmodel DeepSeek-R1, net hoeveel beter is OpenAI o3-mini as R1?

Hierdie artikel sal eers 'n oorsig gee van die hoogtepunte van o3-mini, en dan sal ons die data van beide kante op elke maatstaf onttrek en 'n grafiek maak om dit visueel te vergelyk. Daarbenewens sal ons ook die prys van o3-mini vergelyk.

Kernhoogtepunte

1.STEM-optimering: blink uit op die gebied van wiskunde, programmering, wetenskap, ens., en oortref veral o1-mini in die hoë afleidingspogingsmodus.

2.Ontwikkelaar funksies: ondersteun funksies soos funksie-oproepe, gestruktureerde uitset en ontwikkelaarboodskappe om aan die behoeftes van die produksie-omgewing te voldoen.

3.Vinnige reaksie: 24% vinniger as o1-mini, met 'n reaksietyd van 7,7 sekondes per versoek.

4.Sekuriteit verbetering: verseker veilige en betroubare uitset deur diepbelyningstegnologie.

5.Koste-effektief: afleidingsvermoëns en kosteoptimalisering gaan hand aan hand, wat die drempel vir KI-gebruik aansienlik verminder.

Vergelyk

Oop AI Om sy klas uit te lig, sy amptelike blog vergelyk dit net met sy eie modelle. Daarom is hierdie artikel 'n tabel wat uit die DeepSeek R1-vraestel en die data van die amptelike OpenAI-blog onttrek is.

OpenAI vergelyk amptelik o3-mini in die weergawelys, verdeel dit in drie weergawes: laag, medium en hoog, wat afleidingssterkte aandui. Aangesien DeepSeek Math-500 gebruik en OpenAI die Math-datastel gebruik, is hierdie vergelyking hier verwyder.

'n Grafiek is meer intuïtief, en Codeforces is verwyder omdat die waardes te groot is om intuïtief vertoon te word. Die vergelyking op Codeforces toon egter dat o3-mini se hoë afleidingssterkte nie veel van 'n voorsprong is nie.

↑1AIME2024→2GPQA Diamant→3MMLU→4SWE-bank-geverifieer

Uit die grafiek is daar 'n totaal van 4 vergelykings, en die O3-mini (hoog) lei gewoonlik, maar die voorsprong is baie klein.

Prys

modelInsetprysKas getrefUitset prys
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

Opsomming

Met DeepSeek R1 wat die DeepSeek Panic in die Verenigde State veroorsaak het, was die eerste wat bedreig voel OpenAI, wat veral duidelik is in die pryse van sy nuwe model o3-mini.

Toe Openai o1 die eerste keer vrygestel is, het die hoë prys daarvan druk op baie ontwikkelaars en gebruikers geplaas. Die voorkoms van DeepSeek R1 het almal meer keuses gegee.Van die 30-voudige prysverskil tussen o1 en R1 tot die finale prys van o3-mini twee keer is die prys van DeepSeek R1,

toon die impak van DeepSeek R1 op openai.ChatGPT gratis gebruikers kan egter net o3-mini op 'n beperkte manier ervaar, terwyl DeepSeek se Deep Thinking tans vir alle gebruikers beskikbaar is.Ek sien ook uit daarna om openai meer toonaangewende AI-modelle te bring, terwyl die gebruikskoste vir gebruikers verminder word.

Uit die perspektief van 'n blogger se persoonlike ervaring met R1, wil ek sê dat R1 se Deep Thinking altyd my gedagtes oopmaak. Ek beveel aan dat almal dit meer gebruik om oor probleme te dink~

Soortgelyke plasings

Maak 'n opvolg-bydrae

Jou e-posadres sal nie gepubliseer word nie. Verpligte velde word met * aangedui