Obsežna primerjava na novo izdanih OpenAI o3-mini in DeepSeek R1

OpenAI je izdal svoj najnovejši model sklepanja, o3-mini, ki je optimiziran za področja, kot so znanost, matematika in programiranje, ter zagotavlja hitrejši odziv, večjo natančnost in nižje stroške.

V primerjavi s svojim predhodnikom o1-mini je o3-mini bistveno izboljšal svoje sposobnosti sklepanja, predvsem pri reševanju kompleksnih problemov. Preizkuševalci imajo raje odgovore o3-mini s 56%, stopnja napak pa se je zmanjšala za 39%. od danes naprej ChatGPT Plus, ekipa in Pro uporabniki lahko uporabljajo o3-mini in brezplačni uporabniki lahko izkusijo tudi nekatere njegove lastnosti.

V primerjavi z modelom sklepanja DeepSeek-R1, koliko bolje je OpenAI o3-mini kot R1?

Ta članek bo najprej podal pregled vrhuncev o3-mini, nato pa bomo izluščili podatke z obeh strani za vsako merilo uspešnosti in naredili graf za vizualno primerjavo. Poleg tega bomo primerjali tudi ceno o3-mini.

Kazalo

Osnovni poudarki

1.STEM optimizacija: odlikuje se na področjih matematike, programiranja, znanosti itd., še posebej prekaša o1-mini v načinu visokega sklepanja.

2.Funkcije razvijalca: podpira funkcije, kot so funkcijski klici, strukturirani izhodi in sporočila razvijalcev za izpolnjevanje potreb produkcijskega okolja.

3.Hitra odzivnost: 24% hitrejši od o1-mini, z odzivnim časom 7,7 sekunde na zahtevo.

4.Izboljšanje varnosti: zagotavlja varen in zanesljiv izpis s tehnologijo globoke poravnave.

5.Stroškovno učinkovito: zmožnosti sklepanja in optimizacija stroškov gredo z roko v roki, kar močno zmanjša prag za uporabo umetne inteligence.

Primerjaj

Open AI Da bi poudaril svoj razred, je uradni blog le primerja s svojimi modeli. Zato je ta članek tabela, pridobljena iz papirja DeepSeek R1 in podatkov iz uradnega bloga OpenAI.

OpenAI uradno primerja o3-mini na seznamu različic in ga razdeli na tri različice: nizko, srednjo in visoko, ki označujejo moč sklepanja. Ker DeepSeek uporablja Math-500, OpenAI pa nabor podatkov Math, je bila ta primerjava tu odstranjena.

Grafikon je bolj intuitiven, Codeforces pa je bil odstranjen, ker so vrednosti prevelike, da bi jih lahko prikazali intuitivno. Vendar pa primerjava na Codeforces kaže, da visoka moč sklepanja o3-mini ni velika prednost.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-preverjeno

Iz lestvice so skupaj 4 primerjave in O3-mini (visoko) na splošno vodi, vendar je prednost zelo majhna.

Cena

model	Vhodna cena	Zadetek predpomnilnika	Izhodna cena
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Povzetek

Z DeepSeek R1, ki je v ZDA sprožil paniko DeepSeek, se je prvi počutil ogroženega OpenAI, kar je še posebej očitno pri cenah njegovega novega modela o3-mini.

Ko je bil Openai o1 prvič izdan, je njegova visoka cena pritiskala na številne razvijalce in uporabnike. Videz DeepSeek R1 je vsem dal več izbire.Od 30-kratne razlike v ceni med o1 in R1 do dvakratne končne cene o3-mini cena DeepSeek R1,

prikazuje vpliv DeepSeek R1 na openai.Vendar lahko brezplačni uporabniki ChatGPT izkusijo o3-mini le na omejen način, medtem ko je Deep Thinking DeepSeek trenutno na voljo vsem uporabnikom.Veselim se tudi, da bo openai prinesel več vodilnih modelov AI in hkrati znižal stroške uporabe za uporabnike.

Z vidika blogerjeve osebne izkušnje z uporabo R1 bi rad rekel, da mi globoko razmišljanje R1 vedno odpre misli. Priporočam, da ga vsi uporabljajo več za razmišljanje o težavah~

Nekategorizirano

Paper-DeepSeek-R1: Spodbujanje zmožnosti sklepanja v LLM-jih s krepitvenim učenjem

Avtor:deepseeker 29. januar 202529. januar 2025

Povzetek Ta članek predstavlja modele sklepanja prve generacije DeepSeek: DeepSeek-R1-Zero in DeepSeek-R1. DeepSeek-R1-Zero, usposobljen z obsežnim okrepitvenim učenjem (RL) brez nadzorovane natančne nastavitve (SFT), dokazuje izjemne zmožnosti sklepanja. Skozi RL naravno razvija močna razmišljanja. Vendar pa se sooča z izzivi, kot sta slaba berljivost in mešanje jezikov. Za reševanje teh težav in izboljšanje zmogljivosti razmišljanja je bil razvit DeepSeek-R1,…

Nekategorizirano

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

Avtor:zddeepseeker 8. februar 20258. februar 2025

Poudarki AI Agent preoblikuje uporabniško izkušnjo Jesse Zhang: Kako je agent pravzaprav sestavljen? Naše mnenje je, da bo sčasoma vse bolj podoben agentu, ki temelji na naravnem jeziku, ker se tako usposabljajo veliki jezikovni modeli (LLM). Dolgoročno, če imate super inteligentnega agenta, ki ...

Nekategorizirano

DeepSeek je izdal svojo izvorno kodo, podrobno razlago FlashMLA

Avtor:zddeepseeker 24. februar 202524. februar 2025

Prejšnji teden je DeepSeek napovedal, da bo naslednji teden odprtokodno pet projektov: uporabniki interneta so rekli: "Tokrat je OpenAI res tukaj." Pravkar je prišel prvi odprtokodni projekt, povezan s pospeševanjem sklepanja, FlashMLA: naslov odprtokodnega projekta: DeepSeek FlashMLA Odprtokodni je že dve uri, Github pa ima že 2,7k+ zvezdic: The…

Nekategorizirano

DeepSeek TOP17 najboljših alternativ: celovita analiza (2025)

Avtor:deepseeker 6. februar 20256. februar 2025

Uvod V hitro razvijajočem se okolju umetne inteligence se je DeepSeek izkazal kot močan jezikovni model. Ta celovita analiza raziskuje 17 najboljših alternativ za DeepSeek, preučuje njihove edinstvene lastnosti, zmogljivosti in primere uporabe. Naše raziskave se osredotočajo na mednarodne in kitajske platforme, ki ponujajo integracijo DeepSeek ali podobne zmogljivosti. Analiza najboljših alternativ 1….

Nekategorizirano

Glavni izdelki umetne inteligence na svetu se osredotočajo na analizo in celovite smernice za uporabniško izkušnjo (vključno z DeepSeek in GPT)

Avtor:zddeepseeker 10. februar 202510. februar 2025

Postavitev funkcij in analiza osnovnih prednosti ChatGPT (OpenAI) – globalno merilo uspešnosti za vsestranske ChatGPT Tehnični geni: generativni AI, ki temelji na seriji velikih modelov GPT, s splošnimi pogovornimi veščinami in logičnim sklepanjem kot glavnima prednostma. Večjezična obdelava: najbolje deluje v angleščini, z nenehnim izboljševanjem v kitajščini; vendar priporočamo uporabo angleščine za ...

Nekategorizirano

Kaj lahko doseže Deepseek? Tudi OpenAI tega ne zmore?

Avtor:zddeepseeker 10. februar 202510. februar 2025

Prava vrednost DeepSeek je podcenjena! DeepSeek-R1 je nedvomno prinesel nov val navdušenja na trg. Ne samo, da so relevantni tako imenovani cilji upravičencev strmo naraščali, ampak so nekateri ljudje celo razvili tečaje in programsko opremo, povezane z DeepSeek, da bi z njim zaslužili. Verjamemo, da čeprav imajo ti pojavi …

Obsežna primerjava na novo izdanega OpenAI o3-mini in DeepSeek R1

Osnovni poudarki

Primerjaj

Cena

Povzetek

Paper-DeepSeek-R1: Spodbujanje zmožnosti sklepanja v LLM-jih s krepitvenim učenjem

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

DeepSeek je izdal svojo izvorno kodo, podrobno razlago FlashMLA

DeepSeek TOP17 najboljših alternativ: celovita analiza (2025)

Glavni izdelki umetne inteligence na svetu se osredotočajo na analizo in celovite smernice za uporabniško izkušnjo (vključno z DeepSeek in GPT)

Kaj lahko doseže Deepseek? Tudi OpenAI tega ne zmore?

Dodaj odgovor Prekliči odgovor

Osnovni poudarki

Primerjaj

Cena

Povzetek

Podobne objave

Dodaj odgovor Prekliči odgovor