o3-mini je ovdje, sa zamahom izazivača
OpenAI je 31. siječnja izdao potpuno novi veliki model o3-mini i svim korisnicima ChatGPT-a dao neke od njegovih funkcija besplatno. Iako postoji ograničenje broja upita, ono omogućuje korisnicima da iskuse najnoviji komercijalni model OpenAI-ja što je prije moguće.
Prije samo nekoliko dana, DeepSeek, velika modelska tvrtka iz Kine, objavila je svoj najnoviji model otvorenog koda, DeepSeek-R1, koji je također uspostavio vlastiti utjecaj u AI zajednici.
Model DeepSeek-R1 ima mogućnost pariranja open ai o1 modelu, ali je jeftiniji. Što je još važnije, DeepSeek R1 je open source model, što je najveća razlika u odnosu na openai.
Pitanje je: je li o3-mini stvarno bolje od DeepSeek-R1?
U službenoj usporedbi podataka koju je pružio OpenAI, uspoređuju se samo neki od modela koje je objavio OpenAI, a rezultati nisu izravno uspoređeni s onima velikih DeepSeek R1 model. Međutim, neki nedavno objavljeni podaci o benchmark testu pokazuju da je o3-mini malo bolji na mnogo načina. Ovu situaciju možemo razumjeti gledajući rezultate različitih testova.
Pustimo podatke da govore sami za sebe i dubinski analizirajmo pravu snagu ova dva modela umjetne inteligencije. Ponekad su podaci jedna stvar, ali češće ovise o stvarnom iskustvu i korištenju korisnika.
Usporedba podataka: o3-mini je pametniji, ali DeepSeek-R1 je "matematičniji"
Ukupna prosječna ocjena
OpenAI o3-mini: 73.94
DeepSeek-R1: 71.38
Jasno je da je ukupna ocjena o3-minija nešto viša, što ukazuje na stabilniju izvedbu u opsežnim zadacima. Može stabilnije izvršavati zadatke, ali nema veliki odmak od modela otvorenog koda DeepSeek.
Sposobnost rasuđivanja (sposobnost umjetne inteligencije da razumije, analizira i razmišlja o informacijama)
OpenAI o3-mini: 89,58
DeepSeek-R1: 83.17
U zadacima zaključivanja, o3-mini jasno pobjeđuje, što znači da je bolji u izdvajanju ključnog sadržaja iz složenih informacija i donošenju logičkih zaključaka.
Sposobnost programiranja (sposobnost umjetne inteligencije da obradi kod)
OpenAI o3-mini: 82.74
DeepSeek-R1: 66.74
Ako ste programer, o3-mini bi mogao biti bolji izbor. Rezultati pokazuju veliku razliku, pri čemu je sposobnost kodiranja o3-mini znatno ispred DeepSeek-R1, te je u mogućnosti bolje razumjeti i riješiti probleme programiranja. Ovo je također područje gdje o3-mini ima relativno veliku prednost
Matematičke sposobnosti (izračun, izvođenje formula, matematičko zaključivanje)
OpenAI o3-mini: 65,65
DeepSeek-R1: 79.54
DeepSeek-R1 je jači u matematičkim zadacima, što ukazuje da je bolji u numeričkim izračunima i matematičkom zaključivanju.
Vještine analize podataka (sposobnost obrade i razumijevanja podataka)
OpenAI o3-mini: 70.64
DeepSeek-R1: 69.78
o3-mini ima blago vodstvo u zadacima analize podataka.
Vještine razumijevanja jezika
OpenAI o3-mini: 50.68
DeepSeek-R1: 48.53
Iako prednost nije velika, o3-mini ipak malo nadmašuje u jezičnim zadacima.
NYT veze (slagalica)
o3-mini: 72,4 boda (izvrsne performanse)
DeepSeek-R1: 54,4 boda
Ljudski završni ispit (složeni zadatak)
o3-mini: 13.0% točnost
DeepSeek-R1: 9,4% točnost
Codeforces (test programerskih sposobnosti)
o3-mini > DeepSeek-R1 AIME 2024 (složeno razumijevanje uputa)
o3-mini > DeepSeek-R1 Ukratko, o3-mini je jači u razmišljanju, programiranju i jezicima, dok je DeepSeek-R1 bolji u matematičkim sposobnostima.
Usporedba API cijena: tko je isplativiji?
DeepSeek-R1 je jeftiniji što se tiče API cijena, dok je o3-mini još uvijek relativno skup:
DeepSeek-R1 je jeftiniji i stoga je prikladan za programere s ograničenim proračunom.
Otvoreni kod naspram zatvorenog koda: OpenAI je još uvijek zatvoren
Ako ste zabrinuti zbog otvorenog koda, DeepSeek-R1 je bolji izbor. Potpuno je otvorenog koda, dok o3-mini i dalje slijedi tradiciju OpenAI-ja i ostaje zatvoren. To može utjecati na slobodu programera u pogledu optimizacije i prilagodbe modela.
Konačni zaključak: tko je vrijedniji izbora?
Dimenzija | o3-mini (OpenAI) | DeepSeek-R1 |
Ukupna ocjena | 73.94 | 71.38 |
Zaključivanje | 89.58 (jače) | 83.17 |
Programiranje | 82.74 (jači) | 66.74 |
Matematika | 65.65 | 79.54 |
Analiza podataka | 70.64 | 69.78 |
Razumijevanje jezika | 50.68 | 48.53 |
API cijena | Skuplji | jeftinije |
Otvoreni kod | zatvoriti | Potpuno otvoreni kod |
Za koga je to?
- Ako ste a programer ili inženjer i trebati jake mogućnosti programiranja i zaključivanja, o3-mini je bolji izbor. Vjerujemo da open i O3mini imaju vrlo dobre rezultate u ovom području identifikacije i zaključivanja. U isto vrijeme, snažnije mogućnosti programiranja i zaključivanja također vam mogu pomoći da napišete bolji kod i programe, smanjujući vaše vrijeme za izmjene i pregled
- Ako ste a matematički istraživač ili osjetljiv na API troškove, DeepSeek-R1 je ekonomičniji izbor. Ovaj model ima bolju podršku i pomoć za matematičke istraživače i ima prikladniju cijenu korištenja
- Ako trebate model otvorenog koda, DeepSeek-R1 je pobjednik. Očito, meta, koja se fokusira na otvoreni kod, nije usporediva s DeepSeek u nekim mogućnostima. Međutim, usporedivi openAI veliki model je skuplji i komercijalni je model zatvorenog koda. DeepSeek će voditi istraživanje i razvoj umjetne inteligencije, istovremeno dopuštajući većem broju tvrtki i pojedinačnih korisnika da implementiraju velike modele umjetne inteligencije lokalno ili na poslužiteljima u oblaku, štiteći sigurnost i privatnost svojih podataka
Izgledi za budućnost: konkurencija za AI modele se pojačava
I OpenAI i DeepSeek pokreću razvoj AI tehnologije. Iako je o3-mini trenutno malo bolji u većini zadataka, DeepSeek-R1 još uvijek ima svoje jedinstvene prednosti.
Priroda otvorenog koda DeepSeek privukla je pozornost mnogih programera i korisnika. Niža cijena također postavlja dobre temelje za razvoj AI aplikacija.
Nasuprot tome, OpenAI, kao lider u industriji umjetne inteligencije, ima mnogo inovacija i razvoja, no neotvoreni komercijalni model i visoka cijena korištenja podigli su prag za korištenje, što ne ide u prilog promicanju umjetne inteligencije.
Mislimo da je deepseek napravio sjajan posao za AI industriju. Otvoreni izvor će programerima dati više šanse da saznaju više o naprednom Ai modelu.
U budućnosti bismo mogli vidjeti pojavu još snažnijih modela, kao što su OpenAI GPT-5 ili DeepSeek-R2. Za obične korisnike, najbolja umjetna inteligencija nije "najjača" umjetna inteligencija, već ona umjetna inteligencija koja najbolje odgovara njihovim potrebama. Prilikom odabira AI modela koji vam odgovara, morate uzeti u obzir vlastite scenarije primjene i proračun.