"OpenAI" o3-mini vs. DeepSeek-R1: kas yra naujos kartos dirbtinio intelekto modelių karalius?

Turinys

o3-mini yra čia, turėdamas pretendento pagreitį

Sausio 31 d. "OpenAI" išleido visiškai naują o3-mini didelį modelį ir kai kurias jo funkcijas nemokamai suteikė visiems "ChatGPT" naudotojams. Nors užklausų skaičius yra ribotas, tai leidžia naudotojams kuo greičiau išbandyti naujausią komercinį OpenAI modelį.

Vos prieš kelias dienas didelė Kinijos modelių bendrovė "DeepSeek" išleido naujausią atvirojo kodo modelį "DeepSeek-R1", kuris taip pat padarė įtaką dirbtinio intelekto bendruomenei.

DeepSeek-R1 modelis gali prilygti "open ai o1" modeliui, tačiau yra pigesnis. Dar svarbiau, kad DeepSeek R1 yra atvirojo kodo modelis, o tai yra didžiausias skirtumas, palyginti su openai.

Klausimas yra toks: ar o3-mini tikrai geriau nei DeepSeek-R1?

Oficialiame "OpenAI" pateiktame duomenų palyginime lyginami tik kai kurie "OpenAI" paskelbti modeliai, o rezultatai tiesiogiai nelyginami su didelių DeepSeek R1 modelis. Tačiau kai kurie naujai paskelbti lyginamųjų testų duomenys rodo, kad "o3-mini" daugeliu atžvilgių yra šiek tiek geresnė. Šią situaciją galime suprasti pažvelgę į skirtingų testų rezultatus.

Leiskime duomenims kalbėti patiems už save ir išsamiai išanalizuokime tikrąją šių dviejų dirbtinio intelekto modelių stiprybę. Kartais duomenys yra vienas dalykas, tačiau dažniau tai priklauso ir nuo realios naudotojo patirties ir naudojimo.

Duomenų palyginimas: "o3-mini" yra protingesnis, bet "DeepSeek-R1" yra labiau "matematiškas"

Bendras balų vidurkis

OpenAI o3-mini: 73,94

DeepSeek-R1: 71.38

Akivaizdu, kad bendras "o3-mini" rezultatas yra šiek tiek aukštesnis, o tai rodo, kad jis stabiliau atlieka išsamias užduotis. Jis gali stabiliau atlikti užduotis, tačiau jo atotrūkis nuo DeepSeek atvirojo kodo modelio nėra didelis.

Gebėjimas mąstyti (dirbtinio intelekto gebėjimas suprasti, analizuoti ir pagrįsti informaciją).

OpenAI o3-mini: 89,58

DeepSeek-R1: 83.17

Atliekant samprotavimo užduotis aiškiai laimi "o3-mini", o tai reiškia, kad jai geriau sekasi iš sudėtingos informacijos išskirti pagrindinį turinį ir daryti logines išvadas.

Programavimo gebėjimai (dirbtinio intelekto gebėjimas apdoroti kodą)

OpenAI o3-mini: 82,74

DeepSeek-R1: 66.74

Jei esate kūrėjas, o3-mini gali būti geresnis pasirinkimas. Rezultatai rodo didelį skirtumą: o3-mini programavimo gebėjimai gerokai lenkia DeepSeek-R1, jis geriau supranta ir sprendžia programavimo problemas. Šioje srityje o3-mini taip pat turi gana didelį pranašumą

Matematiniai gebėjimai (skaičiavimas, formulių išvedimas, matematinis mąstymas)

OpenAI o3-mini: 65,65

DeepSeek-R1: 79.54

DeepSeek-R1 geriau sprendžia matematines užduotis, o tai reiškia, kad jam geriau sekasi atlikti skaitinius skaičiavimus ir matematiškai mąstyti.

Duomenų analizės įgūdžiai (gebėjimas apdoroti ir suprasti duomenis)

OpenAI o3-mini: 70,64

DeepSeek-R1: 69.78

o3-mini šiek tiek pirmauja duomenų analizės užduočių srityje.

Kalbos supratimo įgūdžiai

OpenAI o3-mini: 50,68

DeepSeek-R1: 48.53

Nors pranašumas nėra didelis, o3-mini vis tiek šiek tiek lenkia kalbos užduotis.

NYT jungtys (dėlionė)

o3-mini: 72,4 taško (puikus rezultatas)

DeepSeek-R1: 54,4 taško

Žmogaus baigiamasis egzaminas (sudėtinga užduotis)

o3-mini: 13.0% tikslumas

DeepSeek-R1: 9.4% tikslumas

Codeforces (programavimo gebėjimų testas)

o3-mini > DeepSeek-R1 AIME 2024 (sudėtingų instrukcijų supratimas)

o3-mini > DeepSeek-R1 Apibendrinant galima teigti, kad o3-mini yra stipresnis mąstymo, programavimo ir kalbų srityje, o DeepSeek-R1 yra pranašesnis matematinių gebėjimų srityje.

API kainų palyginimas: kas yra ekonomiškesnis?

DeepSeek-R1 yra pigesnis pagal API kainas, o o3-mini vis dar yra gana brangus:

DeepSeek-R1 yra pigesnis, todėl tinka biudžetą turintiems kūrėjams.

Atviras ir uždaras šaltinis: "OpenAI" vis dar yra uždaras

Jei nerimaujate dėl atvirojo kodo, DeepSeek-R1 yra geresnis pasirinkimas. Jis yra visiškai atviro kodo, o o3-mini vis dar laikosi "OpenAI" tradicijų ir išlieka uždaras. Tai gali turėti įtakos kūrėjų laisvei optimizuojant ir pritaikant modelį.

Galutinė išvada: kas labiau vertas pasirinkimo?

Matmenys	o3-mini (OpenAI)	DeepSeek-R1
Bendras įvertinimas	73.94	71.38
Išvadų darymas	89,58 (stipresnis)	83.17
Programavimas	82,74 (stipresnis)	66.74
Matematika	65.65	79.54
Duomenų analizė	70.64	69.78
Kalbos supratimas	50.68	48.53
API kaina	Brangiau	pigiau
Atviras šaltinis	uždaryti	Visiškai atviras šaltinis

Kam ji skirta?

Jei esate kūrėjas arba inžinierius ir reikia geri programavimo ir išvadų darymo gebėjimai., o3-mini yra geresnis pasirinkimas. Manome, kad open ir o3mini pasižymi labai gerais rezultatais šioje identifikavimo ir išvadų darymo srityje. Kartu galingesnės programavimo ir išvadų darymo galimybės gali padėti jums parašyti geresnį kodą ir programas, taip sumažinant laiko, skirto jų modifikavimui ir tikrinimui
Jei esate matematikos tyrėjas arba jautrūs API sąnaudoms, DeepSeek-R1 yra ekonomiškesnis pasirinkimas. Šis modelis turi geresnę paramą ir pagalbą matematikos tyrėjams, o jo naudojimo sąnaudos yra tinkamesnės
Jei jums reikia atvirojo kodo modelis, DeepSeek-R1 yra nugalėtojas. Akivaizdu, kad meta, kurioje daugiausia dėmesio skiriama atvirajam kodui, kai kuriomis galimybėmis negali prilygti DeepSeek. Tačiau palyginamas didelis modelis openAI yra brangesnis ir yra komercinis uždarojo kodo modelis. DeepSeek taps AI mokslinių tyrimų ir plėtros lyderiu, o daugiau įmonių ir pavienių naudotojų galės diegti AI didelius modelius vietoje arba debesų serveriuose, saugodami savo duomenų saugumą ir privatumą

Ateities perspektyvos: konkurencija dėl dirbtinio intelekto modelių stiprėja

Tiek "OpenAI", tiek "DeepSeek" skatina dirbtinio intelekto technologijų plėtrą. Nors o3-mini šiuo metu šiek tiek geriau atlieka daugumą užduočių, DeepSeek-R1 vis dar turi savų unikalių pranašumų.

DeepSeek atvirojo kodo pobūdis patraukė daugelio kūrėjų ir naudotojų dėmesį. Mažesnė kaina taip pat yra geras pagrindas dirbtinio intelekto programoms kurti.

Priešingai, "OpenAI", kaip dirbtinio intelekto pramonės lyderė, turi daug inovacijų ir plėtros, tačiau dėl neatviro komercinio modelio ir didelės naudojimo kainos padidėjo naudojimo slenkstis, o tai nėra palanku dirbtinio intelekto skatinimui.

Manome, kad "deepseek" atliko puikų darbą dirbtinio intelekto pramonei. Atviras kodas suteiks kūrėjams daugiau galimybių sužinoti daugiau apie pažangų Ai modelį.

Ateityje gali atsirasti dar galingesnių modelių, pavyzdžiui, "OpenAI" GPT-5 arba DeepSeek-R2. Paprastiems naudotojams geriausias dirbtinis intelektas yra ne "stipriausias" dirbtinis intelektas, o geriausiai jų poreikius atitinkantis dirbtinis intelektas. Rinkdamiesi jums tinkantį AI modelį, turite atsižvelgti į savo taikomųjų programų scenarijus ir biudžetą.

"OpenAI" o3-mini vs. DeepSeek-R1: kas yra naujos kartos dirbtinio intelekto modelių karalius?

o3-mini yra čia, turėdamas pretendento pagreitį

Duomenų palyginimas: "o3-mini" yra protingesnis, bet "DeepSeek-R1" yra labiau "matematiškas"

API kainų palyginimas: kas yra ekonomiškesnis?

Atviras ir uždaras šaltinis: "OpenAI" vis dar yra uždaras

Galutinė išvada: kas labiau vertas pasirinkimo?

Ateities perspektyvos: konkurencija dėl dirbtinio intelekto modelių stiprėja

Karščiausios naujienos! DeepSeek tyrėjas internete atskleidžia: R1 mokymas truko tik dvi ar tris savaites, o per kinų Naujųjų metų šventę buvo pastebėta galinga R1 nulio raida.

Išsamus "OpenAI" naujai išleistų "o3-mini" ir DeepSeek R1 palyginimas

Atskleista DeepSeek-R1 technologija: išardomi pagrindiniai popieriaus principai ir atskleistas raktas į proveržio modelio veikimą

AI srityje DeepSeek R1 fiziniuose testuose nuolat lenkia o1 ir Claude, ir mes įžengėme į RL aukso amžių.

Altmanas: klydome dėl atvirojo kodo dirbtinio intelekto! DeepSeek padarė OpenAI mažiau naudingą, o kitas yra GPT-5

Keturių geriausių modelių akistata! Apžvalga parodo, koks galingas yra „Deepseek R1“

Parašykite komentarą Atšaukti atsakymą

o3-mini yra čia, turėdamas pretendento pagreitį

Duomenų palyginimas: "o3-mini" yra protingesnis, bet "DeepSeek-R1" yra labiau "matematiškas"

API kainų palyginimas: kas yra ekonomiškesnis?

Atviras ir uždaras šaltinis: "OpenAI" vis dar yra uždaras

Galutinė išvada: kas labiau vertas pasirinkimo?

Ateities perspektyvos: konkurencija dėl dirbtinio intelekto modelių stiprėja

Panašios žinutės

Parašykite komentarą Atšaukti atsakymą