o3-mini er hermed en udfordrers momentum

Den 31. januar udgav OpenAI den helt nye o3-mini store model og stillede nogle af dens funktioner gratis til rådighed for alle ChatGPT-brugere. Selv om der er en begrænsning på antallet af forespørgsler, giver det brugerne mulighed for at opleve OpenAI's seneste kommercielle model så hurtigt som muligt.

For bare et par dage siden udgav DeepSeek, et stort modelfirma fra Kina, sin seneste open source-model, DeepSeek-R1, som også har etableret sin egen indflydelse i AI-samfundet.

Modellen DeepSeek-R1 har evnen til at matche open ai o1-modellen, men den er billigere. Endnu vigtigere er det, at DeepSeek R1 er en open source-model, hvilket er den største forskel i forhold til openai.

Spørgsmålet er: Er o3-mini virkelig bedre end DeepSeek-R1?

I den officielle datasammenligning fra OpenAI sammenlignes kun nogle af de modeller, der er udgivet af OpenAI, og resultaterne sammenlignes ikke direkte med resultaterne fra de store DeepSeek R1-model. Men nogle nyligt frigivne benchmark-testdata viser, at o3-mini er lidt bedre på mange måder. Vi kan forstå denne situation ved at se på resultaterne af forskellige tests.

Lad os lade dataene tale for sig selv og analysere disse to AI-modellers sande styrke i dybden. Nogle gange er data én ting, men oftere afhænger det også af brugerens faktiske oplevelse og brug.

Datasammenligning: o3-mini er smartere, men DeepSeek-R1 er mere "matematisk"

Samlet gennemsnitlig score

OpenAI o3-mini: 73,94

DeepSeek-R1: 71.38

Det er tydeligt, at o3-minis samlede score er lidt højere, hvilket indikerer, at den klarer sig mere stabilt i omfattende opgaver. Den kan udføre opgaver mere stabilt, men den har ikke et stort hul til DeepSeek's open source-model.

Ræsonneringsevne (AI's evne til at forstå, analysere og ræsonnere over information)

OpenAI o3-mini: 89,58

DeepSeek-R1: 83.17

I ræsonneringsopgaver vinder o3-mini klart, hvilket betyder, at den er bedre til at uddrage nøgleindhold fra kompleks information og lave logiske slutninger.

Programmeringsevne (AI's evne til at behandle kode)

OpenAI o3-mini: 82,74

DeepSeek-R1: 66.74

Hvis du er udvikler, er o3-mini måske et bedre valg. Resultaterne viser en stor forskel, hvor o3-minis kodningsevne er betydeligt bedre end DeepSeek-R1, og den er bedre til at forstå og løse programmeringsproblemer. Dette er også et område, hvor o3-mini har en relativt stor fordel

Matematiske evner (beregning, udledning af formler, matematisk ræsonnement)

OpenAI o3-mini: 65,65

DeepSeek-R1: 79.54

DeepSeek-R1 er stærkere til matematiske opgaver, hvilket indikerer, at den er bedre til numeriske beregninger og matematisk ræsonnement.

Færdigheder i dataanalyse (evne til at behandle og forstå data)

OpenAI o3-mini: 70.64

DeepSeek-R1: 69.78

o3-mini har et lille forspring i dataanalyseopgaver.

Færdigheder i sprogforståelse

OpenAI o3-mini: 50,68

DeepSeek-R1: 48.53

Selvom fordelen ikke er stor, klarer o3-mini sig stadig lidt bedre i sprogopgaver.

NYT-forbindelser (puslespil)

o3-mini: 72,4 point (fremragende præstation)

DeepSeek-R1: 54,4 point

Menneskelig afsluttende eksamen (kompleks opgave)

o3-mini: 13.0% nøjagtighed

DeepSeek-R1: 9,4%-nøjagtighed

Codeforces (færdighedstest i programmering)

o3-mini > DeepSeek-R1 AIME 2024 (kompleks instruktionsforståelse)

o3-mini > DeepSeek-R1 Sammenfattende er o3-mini stærkere i ræsonnement, programmering og sprog, mens DeepSeek-R1 er mere fordelagtig i matematiske evner.

Sammenligning af API-priser: Hvem er mest omkostningseffektiv?

DeepSeek-R1 er billigere med hensyn til API-priser, mens o3-mini stadig er relativt dyr:

DeepSeek-R1 er billigere og egner sig derfor til udviklere med et lille budget.

Open source vs. closed source: OpenAI er stadig lukket

Hvis du er bekymret for open source, er DeepSeek-R1 et bedre valg. Den er helt open source, mens o3-mini stadig følger traditionen fra OpenAI og forbliver lukket. Det kan påvirke udviklernes frihed med hensyn til modeloptimering og -tilpasning.

Endelig konklusion: Hvem er mest værdig til at blive valgt?

Dimensiono3-mini (OpenAI)DeepSeek-R1
Samlet score73.9471.38
Inferenser89.58 (stærkere)83.17
Programmering82,74 (stærkere)66.74
Matematik65.6579.54
Analyse af data70.6469.78
Sproglig forståelse50.6848.53
API-prisMere dyrtbilligere
Åben kildetæt påFuldstændig open source

Hvem er det til?

  • Hvis du er en udvikler eller ingeniør og behov stærke programmerings- og slutningsevnerer o3-mini det bedste valg. Vi mener, at open og O3mini har en meget god ydeevne inden for dette område af identifikation og inferens. Samtidig kan de mere kraftfulde programmerings- og inferensfunktioner også hjælpe dig med at skrive bedre kode og programmer, hvilket reducerer din tid til ændring og inspektion.
  • Hvis du er en matematisk forsker eller følsomme over for API-omkostninger, er DeepSeek-R1 et mere økonomisk valg. Denne model har bedre støtte og hjælp til matematiske forskere og har en mere passende brugsomkostning.
  • Hvis du har brug for en open source-modeler DeepSeek-R1 vinderen. Det er klart, at meta, som fokuserer på open source, ikke kan sammenlignes med DeepSeek på nogle punkter. Men den sammenlignelige store openAI-model er dyrere og er en kommerciel closed source-model. DeepSeek vil lede forskningen og udviklingen af AI, samtidig med at flere virksomheder og individuelle brugere får mulighed for at implementere store AI-modeller lokalt eller på cloud-servere og beskytte sikkerheden og privatlivets fred for deres data.

Fremtidsudsigter: Konkurrencen om AI-modeller intensiveres

Både OpenAI og DeepSeek driver udviklingen af AI-teknologi. Selvom o3-mini i øjeblikket er lidt bedre til de fleste opgaver, har DeepSeek-R1 stadig sine egne unikke fordele.

Open source-karakteren af DeepSeek har tiltrukket sig opmærksomhed fra mange udviklere og brugere. Den lavere pris skaber også et godt grundlag for udviklingen af AI-applikationer.

I modsætning hertil har OpenAI, som er førende inden for AI-industrien, en masse innovation og udvikling, men den ikke-åbne kommercielle model og de høje omkostninger ved brug har hævet tærsklen for brug, hvilket ikke er befordrende for fremme af AI.

Vi synes, at deepseek har gjort et stort stykke arbejde for AI-industrien. Open source vil give udviklere større chance for at få mere at vide om den avancerede AI-model.

I fremtiden vil vi måske se endnu mere kraftfulde modeller som OpenAI's GPT-5 eller DeepSeek-R2. For almindelige brugere er den bedste AI ikke den "stærkeste" AI, men den AI, der passer bedst til deres behov. Når du vælger en AI-model, der passer til dig, skal du overveje dine egne applikationsscenarier og dit budget.

Lignende indlæg

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *