"OpenAI" išleido naujausią išvadų modelį, o3-mini, kuris optimizuotas tokioms sritims kaip gamtos mokslai, matematika ir programavimas, užtikrina greitesnį atsaką, didesnį tikslumą ir mažesnes sąnaudas.
Palyginti su savo pirmtaku o1-mini, o3-mini gerokai patobulino savo išvadų darymo galimybes, ypač sprendžiant sudėtingus uždavinius. Testuotojai pirmenybę teikia o3-mini atsakymams 56%, o klaidų skaičius sumažėjo 39%. Nuo šiandien, ChatGPT Plus, Komanda ir Pro naudotojai gali naudoti o3-mini, o nemokami naudotojai taip pat galite išbandyti kai kurias jo funkcijas.

Palyginti su išvados modeliu DeepSeek-R1, kiek geriau yra "OpenAI" o3-mini nei R1?
Šiame straipsnyje pirmiausia apžvelgsime svarbiausius "o3-mini" aspektus, tada iš abiejų pusių ištrauksime duomenis apie kiekvieną lyginamąjį indeksą ir sudarysime grafiką, kad juos vizualiai palygintume. Be to, palyginsime ir "o3-mini" kainą.
Pagrindiniai akcentai
1.STEM optimizavimas: išsiskiria matematikos, programavimo, gamtos mokslų ir kt. srityse, ypač pranokdamas o1-mini didelės išvados pastangų režimu.
2.Kūrėjo funkcijos: palaiko tokias funkcijas kaip funkcijų iškvietimai, struktūrizuota išvestis ir kūrėjų pranešimai, kad atitiktų gamybinės aplinkos poreikius.
3.Greitas atsakas: 24% greitesnis nei o1-mini, o vienos užklausos atsakymo laikas - 7,7 sekundės.
4.Saugumo gerinimas: užtikrina saugią ir patikimą išvestį, naudodamas gilaus išlyginimo technologiją.
5.Ekonomiškas: išvadų darymo galimybės ir sąnaudų optimizavimas neatsiejami, todėl labai sumažėja dirbtinio intelekto naudojimo slenkstis.
Palyginkite
Atviras dirbtinis intelektas Siekiant pabrėžti jo klasę, jo oficialus tinklaraštis lygina tik su savo modeliais. Todėl šiame straipsnyje pateikiama lentelė, ištraukta iš DeepSeek R1 dokumento ir duomenų iš oficialaus "OpenAI" tinklaraščio.
"OpenAI" oficialiai lygina o3-mini versijų sąraše, suskirstant jį į tris versijas: žemą, vidutinę ir aukštą, kurios nurodo išvados stiprumą. Kadangi DeepSeek naudoja "Math-500", o "OpenAI" - "Math" duomenų rinkinį, šis palyginimas čia pašalintas.

Diagrama yra intuityvesnė, o "Codeforces" buvo pašalinta, nes reikšmės yra per didelės, kad jas būtų galima rodyti intuityviai. Tačiau palyginimas pagal Codeforces rodo, kad o3-mini didelis išvadų stiprumas nėra didelis pranašumas.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified
Iš diagramos matyti, kad iš viso yra 4 palyginimai, o O3-mini (didelis) paprastai pirmauja, tačiau pranašumas yra labai nedidelis.
Kaina
modelis | Gamybos sąnaudų kaina | Buferinės atminties pataikymas | Produkcijos kaina |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
"Deepseek R1 | $0.55 | $0.14 | $2.19 |
Santrauka
DeepSeek R1 sukėlus DeepSeek paniką Jungtinėse Valstijose, pirmoji grėsmę pajuto "OpenAI", o tai ypač akivaizdu nustatant naujojo modelio o3-mini kainą.
Kai "Openai o1" buvo išleista pirmą kartą, didelė jos kaina darė spaudimą daugeliui kūrėjų ir naudotojų. Atsiradus DeepSeek R1, visiems atsirado daugiau pasirinkimo galimybių.Nuo 30 kartų didesnio o1 ir R1 kainų skirtumo iki dvigubai didesnės galutinės o3-mini kainos DeepSeek R1 kaina,
rodo DeepSeek R1 poveikį openai.Tačiau "ChatGPT" nemokami naudotojai gali tik ribotai išbandyti "o3-mini", o "DeepSeek" "Deep Thinking" šiuo metu prieinamas visiems naudotojams.Taip pat tikiuosi, kad "openai" pateiks daugiau pirmaujančių ai modelių, kartu sumažindama naudotojų naudojimo išlaidas.
Iš asmeninės tinklaraštininko patirties naudojant "R1" perspektyvos norėčiau pasakyti, kad "R1" "Gilus mąstymas" visada atveria mano protą. Rekomenduoju visiems daugiau ja naudotis ir mąstyti apie problemas~