Společnost OpenAI vydala svůj nejnovější inferenční model, o3-mini, který je optimalizován pro obory, jako je věda, matematika a programování, a poskytuje rychlejší odezvu, vyšší přesnost a nižší náklady.
V porovnání se svým předchůdcem o1-mini má o3-mini výrazně lepší inferenční schopnosti, zejména při řešení složitých problémů. Testující dávají přednost odpovědím o3-mini o 56% a chybovost se snížila o 39%. Ode dneška, ChatGPT Plus, Tým a Pro uživatelé mohou používat o3-mini a bezplatní uživatelé si také můžete vyzkoušet některé z jeho funkcí.

V porovnání s inferenčním modelem DeepSeek-R1, o kolik lepší je OpenAI o3-mini než R1?
V tomto článku nejprve uvedeme přehled nejdůležitějších funkcí o3-mini a poté získáme data z obou stran jednotlivých benchmarků a vytvoříme graf pro jejich vizuální porovnání. Kromě toho porovnáme také cenu o3-mini.
Hlavní body
1.Optimalizace STEM: vyniká v oblasti matematiky, programování, přírodních věd atd., zejména překonává o1-mini v režimu vysoké náročnosti odvozování.
2.Funkce vývojáře: podporuje funkce, jako jsou volání funkcí, strukturovaný výstup a zprávy pro vývojáře, aby vyhovoval potřebám produkčního prostředí.
3.Rychlá reakce: 24% rychlejší než o1-mini, s dobou odezvy 7,7 sekundy na jeden požadavek.
4.Zlepšení zabezpečení: zajišťuje bezpečný a spolehlivý výstup díky technologii hlubokého zarovnání.
5.Nákladově efektivní: možnosti odvozování a optimalizace nákladů jdou ruku v ruce, což výrazně snižuje práh pro použití umělé inteligence.
Porovnat
Otevřená umělá inteligence Aby se zvýraznila její třída, její oficiální blog porovnává pouze se svými vlastními modely. Proto je v tomto článku tabulka převzata z článku DeepSeek R1 a údajů z oficiálního blogu OpenAI.
OpenAI oficiálně porovnává o3-mini v seznamu verzí a rozdělí je na tři verze: nízkou, střední a vysokou, které označují sílu odvození. Vzhledem k tomu, že DeepSeek používá Math-500 a OpenAI používá datovou sadu Math, bylo zde toto srovnání odstraněno.

Graf je intuitivnější a Codeforces byl odstraněn, protože hodnoty jsou příliš velké na to, aby se daly intuitivně zobrazit. Srovnání na Codeforces však ukazuje, že vysoká inferenční síla o3-mini nemá velký náskok.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified
Z grafu vyplývá, že existují celkem 4 srovnání a O3-mini (high) obecně vede, ale náskok je velmi malý.
Cena
model | Vstupní cena | Zásah do mezipaměti | Výstupní cena |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Deepseek R1 | $0.55 | $0.14 | $2.19 |
Souhrn
Poté, co DeepSeek R1 vyvolal ve Spojených státech paniku DeepSeek, se jako první cítila ohrožena společnost OpenAI, což je patrné zejména na ceně jejího nového modelu o3-mini.
Když byl Openai o1 poprvé vydán, jeho vysoká cena tlačila na mnoho vývojářů a uživatelů. S příchodem DeepSeek R1 měl každý větší výběr.Od třicetinásobného cenového rozdílu mezi o1 a R1 až po dvojnásobek konečné ceny o3-mini. cena DeepSeek R1,
ukazuje vliv DeepSeek R1 na openai.Bezplatní uživatelé ChatGPT si však mohou o3-mini vyzkoušet pouze omezeně, zatímco Deep Thinking od DeepSeek je v současné době k dispozici všem uživatelům.Těším se také na to, že openai přinese více špičkových modelů ai a zároveň sníží náklady na používání pro uživatele.
Z pohledu osobní zkušenosti blogera s používáním R1 bych chtěl říct, že mi R1 Deep Thinking vždy otevře mysl. Všem doporučuji, aby ji více používali k přemýšlení o problémech~.