o3-mini je tukaj, z zagonom izzivalca

31. januarja je OpenAI izdal popolnoma nov velik model o3-mini in vsem uporabnikom ChatGPT brezplačno zagotovil nekatere njegove funkcije. Čeprav je število poizvedb omejeno, omogoča uporabnikom, da čim prej izkusijo najnovejši komercialni model OpenAI.

Pred nekaj dnevi je DeepSeek, veliko kitajsko modelsko podjetje, izdalo svoj najnovejši odprtokodni model DeepSeek-R1, ki je prav tako vzpostavil svoj vpliv v skupnosti AI.

Model DeepSeek-R1 se lahko ujema z modelom open ai o1, vendar je cenejši. Še pomembneje pa je, da je DeepSeek R1 odprtokodni model, kar je največja razlika v primerjavi z openai.

Vprašanje je: je o3-mini res bolje kot DeepSeek-R1?

V uradni primerjavi podatkov, ki jo je zagotovil OpenAI, so primerjani samo nekateri modeli, ki jih je izdal OpenAI, rezultati pa niso neposredno primerjani z rezultati velikih Model DeepSeek R1. Vendar pa nekateri na novo objavljeni primerjalni testni podatki kažejo, da je o3-mini nekoliko boljši v mnogih pogledih. To situacijo lahko razumemo, če pogledamo rezultate različnih testov.

Pustimo, da podatki govorijo sami zase, in poglobljeno analizirajmo resnično moč teh dveh modelov AI. Včasih so podatki eno, pogosteje pa so odvisni tudi od dejanske izkušnje in uporabe uporabnika.

Primerjava podatkov: o3-mini je pametnejši, DeepSeek-R1 pa bolj "matematičen"

Skupna povprečna ocena

OpenAI o3-mini: 73,94

DeepSeek-R1: 71,38

Jasno je, da je skupna ocena o3-mini nekoliko višja, kar kaže, da deluje stabilneje pri obsežnih nalogah. Naloge lahko opravlja bolj stabilno, vendar nima velikega zaostanka z odprtokodnim modelom DeepSeek.

Sposobnost sklepanja (sposobnost umetne inteligence, da razume, analizira in sklepa o informacijah)

OpenAI o3-mini: 89,58

DeepSeek-R1: 83,17

Pri nalogah sklepanja očitno zmaga o3-mini, kar pomeni, da je boljši pri izluščitvi ključne vsebine iz kompleksnih informacij in logičnem sklepanju.

Sposobnost programiranja (sposobnost AI za obdelavo kode)

OpenAI o3-mini: 82.74

DeepSeek-R1: 66,74

Če ste razvijalec, je o3-mini morda boljša izbira. Rezultati kažejo veliko razliko, s sposobnostjo kodiranja o3-mini, ki je bistveno pred DeepSeek-R1, in lahko bolje razume in rešuje težave pri programiranju. To je tudi področje, kjer ima o3-mini relativno veliko prednost

Matematične sposobnosti (izračun, izpeljava formul, matematično sklepanje)

OpenAI o3-mini: 65,65

DeepSeek-R1: 79,54

DeepSeek-R1 je močnejši pri matematičnih nalogah, kar kaže, da je boljši pri numeričnih izračunih in matematičnem sklepanju.

Veščine analize podatkov (sposobnost obdelave in razumevanja podatkov)

OpenAI o3-mini: 70.64

DeepSeek-R1: 69,78

o3-mini ima rahlo prednost pri nalogah analize podatkov.

Spretnosti razumevanja jezika

OpenAI o3-mini: 50.68

DeepSeek-R1: 48,53

Čeprav prednost ni velika, o3-mini vseeno nekoliko prekaša pri jezikovnih nalogah.

NYT Connections (uganka)

o3-mini: 72,4 točke (odlična zmogljivost)

DeepSeek-R1: 54,4 točke

Človeški zaključni izpit (kompleksna naloga)

o3-mini: 13.0% natančnost

DeepSeek-R1: 9,4% natančnost

Codeforces (preizkus sposobnosti programiranja)

o3-mini > DeepSeek-R1 AIME 2024 (kompleksno razumevanje navodil)

o3-mini > DeepSeek-R1 Če povzamemo, o3-mini je močnejši pri sklepanju, programiranju in jezikih, medtem ko je DeepSeek-R1 ugodnejši pri matematičnih sposobnostih.

Primerjava cen API: kdo je stroškovno učinkovitejši?

DeepSeek-R1 je cenejši glede na cene API-ja, medtem ko je o3-mini še vedno relativno drag:

DeepSeek-R1 je cenejši in zato primeren za razvijalce z omejenim proračunom.

Odprtokodni v primerjavi z zaprtokodnim: OpenAI je še vedno zaprt

Če vas skrbi odprta koda, je DeepSeek-R1 boljša izbira. Je popolnoma odprtokoden, o3-mini pa še vedno sledi tradiciji OpenAI in ostaja zaprt. To lahko vpliva na svobodo razvijalcev v smislu optimizacije in prilagajanja modela.

Končni zaključek: kdo je bolj vreden izbire?

Dimenzijao3-mini (OpenAI)DeepSeek-R1
Skupna ocena73.9471.38
Sklepanje89,58 (močnejši)83.17
Programiranje82,74 (močnejši)66.74
Matematika65.6579.54
Analiza podatkov70.6469.78
Razumevanje jezika50.6848.53
API cenaDražjecenejši
Odprta kodablizuPopolnoma odprtokodni

Komu je namenjen?

  • Če ste a razvijalec ali inženir in potrebujejo močne zmožnosti programiranja in sklepanja, je o3-mini boljša izbira. Menimo, da imata open in O3mini zelo dobre rezultate na tem področju identifikacije in sklepanja. Hkrati vam lahko zmogljivejše zmožnosti programiranja in sklepanja pomagajo napisati boljšo kodo in programe ter skrajšajo čas za spreminjanje in pregledovanje
  • Če ste a matematični raziskovalec ali občutljiv na stroške API-ja, je DeepSeek-R1 bolj ekonomična izbira. Ta model ima boljšo podporo in pomoč matematičnim raziskovalcem in ima primernejše stroške uporabe
  • Če potrebujete odprtokodni model, DeepSeek-R1 je zmagovalec. Očitno meta, ki se osredotoča na odprto kodo, v nekaterih zmogljivostih ni primerljiva z DeepSeek. Vendar pa je primerljiv veliki model openAI dražji in je komercialni zaprtokodni model. DeepSeek bo vodil raziskave in razvoj umetne inteligence, obenem pa bo več podjetjem in posameznim uporabnikom omogočil uvedbo velikih modelov umetne inteligence lokalno ali na strežnikih v oblaku, s čimer bo zaščitil varnost in zasebnost svojih podatkov

Prihodnji obeti: konkurenca za modele AI se stopnjuje

Tako OpenAI kot DeepSeek poganjata razvoj tehnologije umetne inteligence. Čeprav je o3-mini trenutno nekoliko boljši pri večini nalog, ima DeepSeek-R1 še vedno svoje edinstvene prednosti.

Odprtokodna narava DeepSeek je pritegnila pozornost številnih razvijalcev in uporabnikov. Nižja cena je tudi dobra podlaga za razvoj aplikacij AI.

Nasprotno pa ima OpenAI kot vodilni v industriji umetne inteligence veliko inovacij in razvoja, vendar so neodprt komercialni model in visoki stroški uporabe zvišali prag za uporabo, kar ni naklonjeno promociji umetne inteligence.

Menimo, da je deepseek opravil odlično delo za industrijo umetne inteligence. Odprta koda bo razvijalcem dala več možnosti, da izvedo več o naprednem modelu Ai.

V prihodnosti bomo morda videli nastanek še zmogljivejših modelov, kot sta OpenAI GPT-5 ali DeepSeek-R2. Za navadne uporabnike najboljši AI ni "najmočnejši" AI, ampak tisti, ki najbolje ustreza njihovim potrebam. Ko izbirate model AI, ki vam ustreza, morate upoštevati lastne scenarije uporabe in proračun.

Podobne objave

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja