Sveobuhvatna usporedba OpenAI-jevih novoobjavljenih o3-mini i DeepSeek R1

OpenAI je objavio svoj najnoviji model zaključivanja, o3-mini, koji je optimiziran za područja kao što su znanost, matematika i programiranje, pružajući brži odgovor, veću točnost i nižu cijenu.

U usporedbi sa svojim prethodnikom o1-mini, o3-mini je značajno poboljšao svoje mogućnosti zaključivanja, posebno u rješavanju složenih problema. Testeri preferiraju o3-mini odgovore od 56%, a stopa pogrešaka je smanjena za 39%. od danas, ChatGPT Plus, tim i profesionalac korisnici mogu koristiti o3-mini i besplatni korisnici također može doživjeti neke od njegovih značajki.

U usporedbi s modelom zaključivanja DeepSeek-R1, koliko je bolje OpenAI o3-mini nego R1?

Ovaj članak prvo će dati pregled najvažnijih značajki o3-mini, a zatim ćemo izdvojiti podatke s obje strane za svaku referentnu vrijednost i napraviti grafikon za njihovu vizualnu usporedbu. Osim toga, usporedit ćemo i cijenu o3-minija.

Sadržaj

Glavni naglasci

1.STEM optimizacija: ističe se u područjima matematike, programiranja, znanosti itd., posebno nadmašujući o1-mini u načinu rada s velikim naporom zaključivanja.

2.Funkcije programera: podržava funkcije kao što su pozivi funkcija, strukturirani izlaz i poruke programera kako bi se zadovoljile potrebe proizvodnog okruženja.

3.Brz odgovor: 24% brži od o1-mini, s vremenom odgovora od 7,7 sekundi po zahtjevu.

4.Poboljšanje sigurnosti: osigurava siguran i pouzdan izlaz kroz tehnologiju dubokog poravnanja.

5.Isplativo: mogućnosti zaključivanja i optimizacija troškova idu ruku pod ruku, uvelike smanjujući prag za korištenje umjetne inteligencije.

Usporedi

Open AI Kako bi istaknuo svoju klasu, svoj službeni blog samo ga uspoređuje sa svojim modelima. Stoga je ovaj članak tablica izvađena iz DeepSeek R1 papira i podataka sa službenog OpenAI bloga.

OpenAI službeno uspoređuje o3-mini na popisu verzija, razlažući ga na tri verzije: nisku, srednju i visoku, koje označavaju snagu zaključivanja. Budući da DeepSeek koristi Math-500, a OpenAI koristi skup podataka Math, ova je usporedba ovdje uklonjena.

Grafikon je intuitivniji, a Codeforces je uklonjen jer su vrijednosti prevelike da bi se intuitivno prikazale. Međutim, usporedba na Codeforcesu pokazuje da visoka snaga zaključivanja o3-minija nije velika prednost.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Iz grafikona ima ukupno 4 usporedbe, a O3-mini (visoka) uglavnom vodi, ali prednost je vrlo mala.

Cijena

model	Ulazna cijena	Pogodak predmemorije	Izlazna cijena
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Sažetak

Uz DeepSeek R1 koji je pokrenuo DeepSeek Panic u Sjedinjenim Državama, prvi se osjetio ugroženim OpenAI, što je posebno vidljivo u cijenama njegovog novog modela o3-mini.

Kada je Openai o1 prvi put objavljen, njegova visoka cijena izvršila je pritisak na mnoge programere i korisnike. Pojava DeepSeek R1 svima je dala više izbora.Od 30-struke razlike u cijeni između o1 i R1 do toga da je konačna cijena o3-mini dvostruko veća cijena DeepSeek R1,

pokazuje utjecaj DeepSeek R1 na openai.Međutim, besplatni korisnici ChatGPT-a mogu iskusiti o3-mini samo na ograničen način, dok je Deep Thinking DeepSeek trenutno dostupan svim korisnicima.Također se radujem što će openai donijeti više vodećih AI modela uz smanjenje troškova korištenja za korisnike.

Iz perspektive osobnog iskustva blogera u korištenju R1, želio bih reći da R1-ovo duboko razmišljanje uvijek otvori moj um. Preporučam da ga svi više koriste za razmišljanje o problemima~

Nekategorizirano

a16z dijalog s 27-godišnjim izvršnim direktorom: AI Agent ima ogroman učinak poluge, a dugoročne cijene bit će povezane s troškovima rada

Pozddeepseeker 8. veljače 20258. veljače 2025

Istaknuto AI Agent preoblikuje korisničko iskustvo Jesse Zhang: Kako je agent zapravo konstruiran? Naše je mišljenje da će s vremenom sve više nalikovati agentu temeljenom na prirodnom jeziku jer se tako obučavaju veliki jezični modeli (LLM). Dugoročno gledano, ako imate super inteligentnog agenta koji...

Nekategorizirano

DeepSeek R1 je bio prvi u testu kreativnog pisanja, a o3 mini bio je još lošiji od o1 mini!

Pozddeepseeker 3. veljače 20253. veljače 2025

DeepSeek R1 osvojio je prvenstvo u referentnom testu kreativnog pisanja kratkih priča, uspješno nadmašivši prethodnog dominantnog igrača Claude 3.5 Sonnet! Benchmark test Benchmark test koji je osmislio istraživač Lech Mazur nije vaše prosječno natjecanje u pisanju. Svaki model umjetne inteligencije trebao je dovršiti 500 kratkih priča, a svaka je priča morala pametno uključiti...

Nekategorizirano

Le Chat je na vrhu ljestvice s ulaganjem od stotinu milijardi dolara. Nakon SAD-a i Kine, je li treća AI sila?

Pozddeepseeker 11. veljače 202511. veljače 2025

Dana 9. veljače francuski predsjednik Emmanuel Macron najavio je da će Francuska uložiti 109 milijardi eura (113 milijardi američkih dolara) u područje umjetne inteligencije u sljedećih nekoliko godina. Ovo će se ulaganje iskoristiti za izgradnju AI parka u Francuskoj, poboljšanje infrastrukture i ulaganje u lokalne novonastale tvrtke AI. U međuvremenu, Mistral, francuski startup,…

Nekategorizirano

Udarne vijesti! Istraživač DeepSeek otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika

Pozddeepseeker 4. veljače 20254. veljače 2025

Udarne vijesti! DeepSeek istraživač otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika Upravo smo primijetili da je DeepSeek istraživač Daya Guo odgovorio na pitanja korisnika interneta o DeepSeek R1 i planovima tvrtke ide naprijed. Možemo samo reći…

Nekategorizirano

Qwen2.5-max protiv DeepSeek R1: Duboka usporedba modela: potpuna analiza scenarija primjene

Pozddeepseeker 14. veljače 202514. veljače 2025

Uvod Danas veliki jezični modeli (LLM) igraju presudnu ulogu. Početkom 2025. godine, kako se konkurencija za AI zaoštravala, Alibaba je lansirala novi Qwen2.5-max AI model, a DeepSeek, tvrtka iz Hangzhoua u Kini, lansirala je model R1, koji predstavlja vrhunac LLM tehnologije. Deepseek R1 je AI model otvorenog koda koji je privukao…

Nekategorizirano

DeepSeek R1 tumačenje papira i ključne tehničke točke

Pozddeepseeker 9. veljače 20259. veljače 2025

1 Pozadina Tijekom Proljetnog festivala, DeepSeek R1 je još jednom privukao široku pozornost, a čak je i članak o tumačenju DeepSeek V3 koji smo prethodno napisali također ponovno prenošen io njemu se mnogo raspravljalo. Iako je bilo mnogo analiza i reprodukcija DeepSeek R1, ovdje smo odlučili sastaviti neke odgovarajuće bilješke za čitanje. Koristit ćemo tri…

Sveobuhvatna usporedba novoobjavljenih OpenAI-jevih o3-mini i DeepSeek R1

Glavni naglasci

Usporedi

Cijena

Sažetak

a16z dijalog s 27-godišnjim izvršnim direktorom: AI Agent ima ogroman učinak poluge, a dugoročne cijene bit će povezane s troškovima rada

DeepSeek R1 je bio prvi u testu kreativnog pisanja, a o3 mini bio je još lošiji od o1 mini!

Le Chat je na vrhu ljestvice s ulaganjem od stotinu milijardi dolara. Nakon SAD-a i Kine, je li treća AI sila?

Udarne vijesti! Istraživač DeepSeek otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika

Qwen2.5-max protiv DeepSeek R1: Duboka usporedba modela: potpuna analiza scenarija primjene

DeepSeek R1 tumačenje papira i ključne tehničke točke

Odgovori Otkaži odgovor

Glavni naglasci

Usporedi

Cijena

Sažetak

Slični postovi

Odgovori Otkaži odgovor