o3-mini is hier, met die momentum van 'n uitdager

Op 31 Januarie het OpenAI die splinternuwe o3-mini groot model vrygestel en sommige van sy funksies gratis aan alle ChatGPT-gebruikers verskaf. Alhoewel daar 'n beperking op die aantal navrae is, stel dit gebruikers in staat om OpenAI se nuutste kommersiële model so gou moontlik te ervaar.

Net ’n paar dae gelede het DeepSeek, ’n groot modelmaatskappy uit China, sy jongste oopbronmodel, DeepSeek-R1, vrygestel wat ook sy eie invloed in die KI-gemeenskap gevestig het.

Die DeepSeek-R1-model het die vermoë om by die oop ai o1-model te pas, maar dit is goedkoper. Belangriker nog, DeepSeek R1 is 'n oopbronmodel, wat die grootste verskil is in vergelyking met openai.

Die vraag is: is o3-mini regtig beter as DeepSeek-R1?

In die amptelike datavergelyking wat deur OpenAI verskaf word, word slegs sommige van die modelle wat deur OpenAI vrygestel is vergelyk, en die resultate word nie direk vergelyk met dié van die groot DeepSeek R1-model. Sommige nuut vrygestelde maatstaftoetsdata toon egter dat o3-mini in baie opsigte effens beter is. Ons kan hierdie situasie verstaan deur na die tellings van verskillende toetse te kyk.

Kom ons laat die data vanself spreek en die ware sterkte van hierdie twee KI-modelle in diepte ontleed. Soms is data een ding, maar meer dikwels hang dit ook af van die werklike ervaring en gebruik van die gebruiker.

Datavergelyking: o3-mini is slimmer, maar DeepSeek-R1 is meer "wiskundig"

Algehele gemiddelde telling

OpenAI o3-mini: 73,94

DeepSeek-R1: 71,38

Dit is duidelik dat o3-mini se algehele telling effens hoër is, wat daarop dui dat dit meer stabiel in omvattende take presteer. Dit kan take meer stabiel voltooi, maar dit het nie 'n groot gaping met DeepSeek se oopbronmodel nie.

Redeneringsvermoë (KI se vermoë om inligting te verstaan, te ontleed en daaroor te redeneer)

OpenAI o3-mini: 89.58

DeepSeek-R1: 83,17

In redeneringstake wen o3-mini duidelik, wat beteken dat dit beter is om sleutelinhoud uit komplekse inligting te onttrek en logiese afleidings te maak.

Programmeringsvermoë (KI se vermoë om kode te verwerk)

OpenAI o3-mini: 82,74

DeepSeek-R1: 66,74

As jy 'n ontwikkelaar is, kan o3-mini 'n beter keuse wees. Die tellings toon 'n groot verskil, met o3-mini se koderingsvermoë aansienlik voor DeepSeek-R1, en om programmeerprobleme beter te verstaan en op te los. Dit is ook 'n gebied waar o3-mini 'n relatief groot voordeel het

Wiskundige vermoë (berekening, formule-afleiding, wiskundige redenasie)

OpenAI o3-mini: 65.65

DeepSeek-R1: 79,54

DeepSeek-R1 is sterker in wiskundige take, wat aandui dat dit beter is in numeriese berekeninge en wiskundige redenering.

Data-ontledingsvaardighede (vermoë om data te verwerk en te verstaan)

OpenAI o3-mini: 70.64

DeepSeek-R1: 69,78

o3-mini het 'n effense voorsprong in data-ontledingstake.

Taalbegripsvaardighede

OpenAI o3-mini: 50.68

DeepSeek-R1: 48,53

Alhoewel die voordeel nie groot is nie, presteer o3-mini steeds effens beter in taaltake.

NYT Connections (legkaart)

o3-mini: 72.4 punte (uitstekende prestasie)

DeepSeek-R1: 54,4 punte

Menslike finale eksamen (komplekse taak)

o3-mini: 13.0% akkuraatheid

DeepSeek-R1: 9.4% akkuraatheid

Kodekragte (programmeerbekwaamheidstoets)

o3-mini > DeepSeek-R1 AIME 2024 (komplekse instruksiebegrip)

o3-mini > DeepSeek-R1 Ter opsomming, o3-mini is sterker in redenering, programmering en tale, terwyl DeepSeek-R1 meer voordelig is in wiskundige vermoë.

API-prysvergelyking: wie is meer koste-effektief?

DeepSeek-R1 is goedkoper in terme van API-pryse, terwyl o3-mini steeds relatief duur is:

DeepSeek-R1 is goedkoper en is dus geskik vir ontwikkelaars met 'n begroting.

Oopbron vs. geslote bron: OpenAI is steeds gesluit

As jy bekommerd is oor oopbron, is DeepSeek-R1 'n beter keuse. Dit is heeltemal oopbron, terwyl o3-mini steeds die tradisie van OpenAI volg en gesluit bly. Dit kan die vryheid van ontwikkelaars beïnvloed in terme van modeloptimering en aanpassing.

Finale gevolgtrekking: wie is meer waardig om te kies?

Dimensieo3-mini (OpenAI)DeepSeek-R1
Algehele telling73.9471.38
Afleiding89.58 (sterker)83.17
Programmering82.74 (sterker)66.74
Wiskunde65.6579.54
Data-analise70.6469.78
Taalbegrip50.6848.53
API prysDuurdergoedkoper
OopbronnabyTen volle oopbron

Vir wie is dit?

  • As jy 'n ontwikkelaar of ingenieur en behoefte sterk programmerings- en afleidingsvermoëns, die o3-mini is die beter keuse. Ons glo dat die oop en O3mini 'n baie goeie prestasie op hierdie gebied van identifikasie en afleiding het. Terselfdertyd kan die kragtiger programmerings- en afleidingsvermoëns jou ook help om beter kode en programme te skryf, wat jou tyd vir wysiging en inspeksie verminder
  • As jy 'n wiskundige navorser of sensitief vir API-koste, DeepSeek-R1 is 'n meer ekonomiese keuse. Hierdie model het beter ondersteuning en bystand vir wiskundige navorsers, en het 'n meer geskikte gebruikskoste
  • As jy 'n oopbronmodel, DeepSeek-R1 is die wenner. Dit is duidelik dat meta, wat op oopbron fokus, in sommige vermoëns nie vergelykbaar is met DeepSeek nie. Die vergelykbare openAI groot model is egter duurder en is 'n kommersiële geslotebronmodel. DeepSeek sal die navorsing en ontwikkeling van KI lei, terwyl dit meer maatskappye en individuele gebruikers toelaat om groot KI-modelle plaaslik of op wolkbedieners te ontplooi, wat die sekuriteit en privaatheid van hul data beskerm

Toekomsvooruitsigte: mededinging vir KI-modelle neem toe

Beide OpenAI en DeepSeek dryf die ontwikkeling van KI-tegnologie aan. Alhoewel o3-mini tans effens beter is met die meeste take, het DeepSeek-R1 steeds sy eie unieke voordele.

Die oopbron-aard van DeepSeek het die aandag van baie ontwikkelaars en gebruikers getrek. Die laer prys lê ook 'n goeie grondslag vir die ontwikkeling van KI-toepassings.

Daarteenoor het OpenAI, as 'n leier in die KI-industrie, baie innovasie en ontwikkeling, maar die nie-oop kommersiële model en hoë gebruikskoste het die drempel vir gebruik verhoog, wat nie bevorderlik is vir die bevordering van KI nie.

Ons dink deepseek het 'n goeie werk vir die KI-industrie gedoen. Oopbron sal ontwikkelaars meer kans gee om meer te wete te kom oor die gevorderde Ai-model.

In die toekoms sal ons dalk die opkoms van selfs kragtiger modelle sien, soos OpenAI se GPT-5 of DeepSeek-R2. Vir gewone gebruikers is die beste KI nie die "sterkste" KI nie, maar die KI wat die beste by hul behoeftes pas. Wanneer jy 'n KI-model kies wat jou pas, moet jy jou eie toepassingscenario's en begroting oorweeg.

Soortgelyke plasings

Maak 'n opvolg-bydrae

Jou e-posadres sal nie gepubliseer word nie. Verpligte velde word met * aangedui