o3-mini yra čia, turėdamas pretendento pagreitį
Sausio 31 d. "OpenAI" išleido visiškai naują o3-mini didelį modelį ir kai kurias jo funkcijas nemokamai suteikė visiems "ChatGPT" naudotojams. Nors užklausų skaičius yra ribotas, tai leidžia naudotojams kuo greičiau išbandyti naujausią komercinį OpenAI modelį.
Vos prieš kelias dienas didelė Kinijos modelių bendrovė "DeepSeek" išleido naujausią atvirojo kodo modelį "DeepSeek-R1", kuris taip pat padarė įtaką dirbtinio intelekto bendruomenei.
DeepSeek-R1 modelis gali prilygti "open ai o1" modeliui, tačiau yra pigesnis. Dar svarbiau, kad DeepSeek R1 yra atvirojo kodo modelis, o tai yra didžiausias skirtumas, palyginti su openai.
Klausimas yra toks: ar o3-mini tikrai geriau nei DeepSeek-R1?
Oficialiame "OpenAI" pateiktame duomenų palyginime lyginami tik kai kurie "OpenAI" paskelbti modeliai, o rezultatai tiesiogiai nelyginami su didelių DeepSeek R1 modelis. Tačiau kai kurie naujai paskelbti lyginamųjų testų duomenys rodo, kad "o3-mini" daugeliu atžvilgių yra šiek tiek geresnė. Šią situaciją galime suprasti pažvelgę į skirtingų testų rezultatus.
Leiskime duomenims kalbėti patiems už save ir išsamiai išanalizuokime tikrąją šių dviejų dirbtinio intelekto modelių stiprybę. Kartais duomenys yra vienas dalykas, tačiau dažniau tai priklauso ir nuo realios naudotojo patirties ir naudojimo.
Duomenų palyginimas: "o3-mini" yra protingesnis, bet "DeepSeek-R1" yra labiau "matematiškas"
Bendras balų vidurkis
OpenAI o3-mini: 73,94
DeepSeek-R1: 71.38
Akivaizdu, kad bendras "o3-mini" rezultatas yra šiek tiek aukštesnis, o tai rodo, kad jis stabiliau atlieka išsamias užduotis. Jis gali stabiliau atlikti užduotis, tačiau jo atotrūkis nuo DeepSeek atvirojo kodo modelio nėra didelis.
Gebėjimas mąstyti (dirbtinio intelekto gebėjimas suprasti, analizuoti ir pagrįsti informaciją).
OpenAI o3-mini: 89,58
DeepSeek-R1: 83.17
Atliekant samprotavimo užduotis aiškiai laimi "o3-mini", o tai reiškia, kad jai geriau sekasi iš sudėtingos informacijos išskirti pagrindinį turinį ir daryti logines išvadas.
Programavimo gebėjimai (dirbtinio intelekto gebėjimas apdoroti kodą)
OpenAI o3-mini: 82,74
DeepSeek-R1: 66.74
Jei esate kūrėjas, o3-mini gali būti geresnis pasirinkimas. Rezultatai rodo didelį skirtumą: o3-mini programavimo gebėjimai gerokai lenkia DeepSeek-R1, jis geriau supranta ir sprendžia programavimo problemas. Šioje srityje o3-mini taip pat turi gana didelį pranašumą
Matematiniai gebėjimai (skaičiavimas, formulių išvedimas, matematinis mąstymas)
OpenAI o3-mini: 65,65
DeepSeek-R1: 79.54
DeepSeek-R1 geriau sprendžia matematines užduotis, o tai reiškia, kad jam geriau sekasi atlikti skaitinius skaičiavimus ir matematiškai mąstyti.
Duomenų analizės įgūdžiai (gebėjimas apdoroti ir suprasti duomenis)
OpenAI o3-mini: 70,64
DeepSeek-R1: 69.78
o3-mini šiek tiek pirmauja duomenų analizės užduočių srityje.
Kalbos supratimo įgūdžiai
OpenAI o3-mini: 50,68
DeepSeek-R1: 48.53
Nors pranašumas nėra didelis, o3-mini vis tiek šiek tiek lenkia kalbos užduotis.
NYT jungtys (dėlionė)
o3-mini: 72,4 taško (puikus rezultatas)
DeepSeek-R1: 54,4 taško
Žmogaus baigiamasis egzaminas (sudėtinga užduotis)
o3-mini: 13.0% tikslumas
DeepSeek-R1: 9.4% tikslumas
Codeforces (programavimo gebėjimų testas)
o3-mini > DeepSeek-R1 AIME 2024 (sudėtingų instrukcijų supratimas)
o3-mini > DeepSeek-R1 Apibendrinant galima teigti, kad o3-mini yra stipresnis mąstymo, programavimo ir kalbų srityje, o DeepSeek-R1 yra pranašesnis matematinių gebėjimų srityje.
API kainų palyginimas: kas yra ekonomiškesnis?
DeepSeek-R1 yra pigesnis pagal API kainas, o o3-mini vis dar yra gana brangus:
DeepSeek-R1 yra pigesnis, todėl tinka biudžetą turintiems kūrėjams.
Atviras ir uždaras šaltinis: "OpenAI" vis dar yra uždaras
Jei nerimaujate dėl atvirojo kodo, DeepSeek-R1 yra geresnis pasirinkimas. Jis yra visiškai atviro kodo, o o3-mini vis dar laikosi "OpenAI" tradicijų ir išlieka uždaras. Tai gali turėti įtakos kūrėjų laisvei optimizuojant ir pritaikant modelį.
Galutinė išvada: kas labiau vertas pasirinkimo?
Matmenys | o3-mini (OpenAI) | DeepSeek-R1 |
Bendras įvertinimas | 73.94 | 71.38 |
Išvadų darymas | 89,58 (stipresnis) | 83.17 |
Programavimas | 82,74 (stipresnis) | 66.74 |
Matematika | 65.65 | 79.54 |
Duomenų analizė | 70.64 | 69.78 |
Kalbos supratimas | 50.68 | 48.53 |
API kaina | Brangiau | pigiau |
Atviras šaltinis | uždaryti | Visiškai atviras šaltinis |
Kam ji skirta?
- Jei esate kūrėjas arba inžinierius ir reikia geri programavimo ir išvadų darymo gebėjimai., o3-mini yra geresnis pasirinkimas. Manome, kad open ir o3mini pasižymi labai gerais rezultatais šioje identifikavimo ir išvadų darymo srityje. Kartu galingesnės programavimo ir išvadų darymo galimybės gali padėti jums parašyti geresnį kodą ir programas, taip sumažinant laiko, skirto jų modifikavimui ir tikrinimui
- Jei esate matematikos tyrėjas arba jautrūs API sąnaudoms, DeepSeek-R1 yra ekonomiškesnis pasirinkimas. Šis modelis turi geresnę paramą ir pagalbą matematikos tyrėjams, o jo naudojimo sąnaudos yra tinkamesnės
- Jei jums reikia atvirojo kodo modelis, DeepSeek-R1 yra nugalėtojas. Akivaizdu, kad meta, kurioje daugiausia dėmesio skiriama atvirajam kodui, kai kuriomis galimybėmis negali prilygti DeepSeek. Tačiau palyginamas didelis modelis openAI yra brangesnis ir yra komercinis uždarojo kodo modelis. DeepSeek taps AI mokslinių tyrimų ir plėtros lyderiu, o daugiau įmonių ir pavienių naudotojų galės diegti AI didelius modelius vietoje arba debesų serveriuose, saugodami savo duomenų saugumą ir privatumą
Ateities perspektyvos: konkurencija dėl dirbtinio intelekto modelių stiprėja
Tiek "OpenAI", tiek "DeepSeek" skatina dirbtinio intelekto technologijų plėtrą. Nors o3-mini šiuo metu šiek tiek geriau atlieka daugumą užduočių, DeepSeek-R1 vis dar turi savų unikalių pranašumų.
DeepSeek atvirojo kodo pobūdis patraukė daugelio kūrėjų ir naudotojų dėmesį. Mažesnė kaina taip pat yra geras pagrindas dirbtinio intelekto programoms kurti.
Priešingai, "OpenAI", kaip dirbtinio intelekto pramonės lyderė, turi daug inovacijų ir plėtros, tačiau dėl neatviro komercinio modelio ir didelės naudojimo kainos padidėjo naudojimo slenkstis, o tai nėra palanku dirbtinio intelekto skatinimui.
Manome, kad "deepseek" atliko puikų darbą dirbtinio intelekto pramonei. Atviras kodas suteiks kūrėjams daugiau galimybių sužinoti daugiau apie pažangų Ai modelį.
Ateityje gali atsirasti dar galingesnių modelių, pavyzdžiui, "OpenAI" GPT-5 arba DeepSeek-R2. Paprastiems naudotojams geriausias dirbtinis intelektas yra ne "stipriausias" dirbtinis intelektas, o geriausiai jų poreikius atitinkantis dirbtinis intelektas. Rinkdamiesi jums tinkantį AI modelį, turite atsižvelgti į savo taikomųjų programų scenarijus ir biudžetą.