o3-mini je ovdje, sa zamahom izazivača

OpenAI je 31. siječnja izdao potpuno novi veliki model o3-mini i svim korisnicima ChatGPT-a dao neke od njegovih funkcija besplatno. Iako postoji ograničenje broja upita, ono omogućuje korisnicima da iskuse najnoviji komercijalni model OpenAI-ja što je prije moguće.

Prije samo nekoliko dana, DeepSeek, velika modelska tvrtka iz Kine, objavila je svoj najnoviji model otvorenog koda, DeepSeek-R1, koji je također uspostavio vlastiti utjecaj u AI zajednici.

Model DeepSeek-R1 ima mogućnost pariranja open ai o1 modelu, ali je jeftiniji. Što je još važnije, DeepSeek R1 je open source model, što je najveća razlika u odnosu na openai.

Pitanje je: je li o3-mini stvarno bolje od DeepSeek-R1?

U službenoj usporedbi podataka koju je pružio OpenAI, uspoređuju se samo neki od modela koje je objavio OpenAI, a rezultati nisu izravno uspoređeni s onima velikih DeepSeek R1 model. Međutim, neki nedavno objavljeni podaci o benchmark testu pokazuju da je o3-mini malo bolji na mnogo načina. Ovu situaciju možemo razumjeti gledajući rezultate različitih testova.

Pustimo podatke da govore sami za sebe i dubinski analizirajmo pravu snagu ova dva modela umjetne inteligencije. Ponekad su podaci jedna stvar, ali češće ovise o stvarnom iskustvu i korištenju korisnika.

Usporedba podataka: o3-mini je pametniji, ali DeepSeek-R1 je "matematičniji"

Ukupna prosječna ocjena

OpenAI o3-mini: 73.94

DeepSeek-R1: 71.38

Jasno je da je ukupna ocjena o3-minija nešto viša, što ukazuje na stabilniju izvedbu u opsežnim zadacima. Može stabilnije izvršavati zadatke, ali nema veliki odmak od modela otvorenog koda DeepSeek.

Sposobnost rasuđivanja (sposobnost umjetne inteligencije da razumije, analizira i razmišlja o informacijama)

OpenAI o3-mini: 89,58

DeepSeek-R1: 83.17

U zadacima zaključivanja, o3-mini jasno pobjeđuje, što znači da je bolji u izdvajanju ključnog sadržaja iz složenih informacija i donošenju logičkih zaključaka.

Sposobnost programiranja (sposobnost umjetne inteligencije da obradi kod)

OpenAI o3-mini: 82.74

DeepSeek-R1: 66.74

Ako ste programer, o3-mini bi mogao biti bolji izbor. Rezultati pokazuju veliku razliku, pri čemu je sposobnost kodiranja o3-mini znatno ispred DeepSeek-R1, te je u mogućnosti bolje razumjeti i riješiti probleme programiranja. Ovo je također područje gdje o3-mini ima relativno veliku prednost

Matematičke sposobnosti (izračun, izvođenje formula, matematičko zaključivanje)

OpenAI o3-mini: 65,65

DeepSeek-R1: 79.54

DeepSeek-R1 je jači u matematičkim zadacima, što ukazuje da je bolji u numeričkim izračunima i matematičkom zaključivanju.

Vještine analize podataka (sposobnost obrade i razumijevanja podataka)

OpenAI o3-mini: 70.64

DeepSeek-R1: 69.78

o3-mini ima blago vodstvo u zadacima analize podataka.

Vještine razumijevanja jezika

OpenAI o3-mini: 50.68

DeepSeek-R1: 48.53

Iako prednost nije velika, o3-mini ipak malo nadmašuje u jezičnim zadacima.

NYT veze (slagalica)

o3-mini: 72,4 boda (izvrsne performanse)

DeepSeek-R1: 54,4 boda

Ljudski završni ispit (složeni zadatak)

o3-mini: 13.0% točnost

DeepSeek-R1: 9,4% točnost

Codeforces (test programerskih sposobnosti)

o3-mini > DeepSeek-R1 AIME 2024 (složeno razumijevanje uputa)

o3-mini > DeepSeek-R1 Ukratko, o3-mini je jači u razmišljanju, programiranju i jezicima, dok je DeepSeek-R1 bolji u matematičkim sposobnostima.

Usporedba API cijena: tko je isplativiji?

DeepSeek-R1 je jeftiniji što se tiče API cijena, dok je o3-mini još uvijek relativno skup:

DeepSeek-R1 je jeftiniji i stoga je prikladan za programere s ograničenim proračunom.

Otvoreni kod naspram zatvorenog koda: OpenAI je još uvijek zatvoren

Ako ste zabrinuti zbog otvorenog koda, DeepSeek-R1 je bolji izbor. Potpuno je otvorenog koda, dok o3-mini i dalje slijedi tradiciju OpenAI-ja i ostaje zatvoren. To može utjecati na slobodu programera u pogledu optimizacije i prilagodbe modela.

Konačni zaključak: tko je vrijedniji izbora?

Dimenzijao3-mini (OpenAI)DeepSeek-R1
Ukupna ocjena73.9471.38
Zaključivanje89.58 (jače)83.17
Programiranje82.74 (jači)66.74
Matematika65.6579.54
Analiza podataka70.6469.78
Razumijevanje jezika50.6848.53
API cijenaSkupljijeftinije
Otvoreni kodzatvoritiPotpuno otvoreni kod

Za koga je to?

  • Ako ste a programer ili inženjer i trebati jake mogućnosti programiranja i zaključivanja, o3-mini je bolji izbor. Vjerujemo da open i O3mini imaju vrlo dobre rezultate u ovom području identifikacije i zaključivanja. U isto vrijeme, snažnije mogućnosti programiranja i zaključivanja također vam mogu pomoći da napišete bolji kod i programe, smanjujući vaše vrijeme za izmjene i pregled
  • Ako ste a matematički istraživač ili osjetljiv na API troškove, DeepSeek-R1 je ekonomičniji izbor. Ovaj model ima bolju podršku i pomoć za matematičke istraživače i ima prikladniju cijenu korištenja
  • Ako trebate model otvorenog koda, DeepSeek-R1 je pobjednik. Očito, meta, koja se fokusira na otvoreni kod, nije usporediva s DeepSeek u nekim mogućnostima. Međutim, usporedivi openAI veliki model je skuplji i komercijalni je model zatvorenog koda. DeepSeek će voditi istraživanje i razvoj umjetne inteligencije, istovremeno dopuštajući većem broju tvrtki i pojedinačnih korisnika da implementiraju velike modele umjetne inteligencije lokalno ili na poslužiteljima u oblaku, štiteći sigurnost i privatnost svojih podataka

Izgledi za budućnost: konkurencija za AI modele se pojačava

I OpenAI i DeepSeek pokreću razvoj AI tehnologije. Iako je o3-mini trenutno malo bolji u većini zadataka, DeepSeek-R1 još uvijek ima svoje jedinstvene prednosti.

Priroda otvorenog koda DeepSeek privukla je pozornost mnogih programera i korisnika. Niža cijena također postavlja dobre temelje za razvoj AI aplikacija.

Nasuprot tome, OpenAI, kao lider u industriji umjetne inteligencije, ima mnogo inovacija i razvoja, no neotvoreni komercijalni model i visoka cijena korištenja podigli su prag za korištenje, što ne ide u prilog promicanju umjetne inteligencije.

Mislimo da je deepseek napravio sjajan posao za AI industriju. Otvoreni izvor će programerima dati više šanse da saznaju više o naprednom Ai modelu.

U budućnosti bismo mogli vidjeti pojavu još snažnijih modela, kao što su OpenAI GPT-5 ili DeepSeek-R2. Za obične korisnike, najbolja umjetna inteligencija nije "najjača" umjetna inteligencija, već ona umjetna inteligencija koja najbolje odgovara njihovim potrebama. Prilikom odabira AI modela koji vam odgovara, morate uzeti u obzir vlastite scenarije primjene i proračun.

Slični postovi

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)