Společnost OpenAI vydala svůj nejnovější inferenční model, o3-mini, který je optimalizován pro obory, jako je věda, matematika a programování, a poskytuje rychlejší odezvu, vyšší přesnost a nižší náklady.

V porovnání se svým předchůdcem o1-mini má o3-mini výrazně lepší inferenční schopnosti, zejména při řešení složitých problémů. Testující dávají přednost odpovědím o3-mini o 56% a chybovost se snížila o 39%. Ode dneška, ChatGPT Plus, Tým a Pro uživatelé mohou používat o3-mini a bezplatní uživatelé si také můžete vyzkoušet některé z jeho funkcí.

V porovnání s inferenčním modelem DeepSeek-R1, o kolik lepší je OpenAI o3-mini než R1?

V tomto článku nejprve uvedeme přehled nejdůležitějších funkcí o3-mini a poté získáme data z obou stran jednotlivých benchmarků a vytvoříme graf pro jejich vizuální porovnání. Kromě toho porovnáme také cenu o3-mini.

Hlavní body

1.Optimalizace STEM: vyniká v oblasti matematiky, programování, přírodních věd atd., zejména překonává o1-mini v režimu vysoké náročnosti odvozování.

2.Funkce vývojáře: podporuje funkce, jako jsou volání funkcí, strukturovaný výstup a zprávy pro vývojáře, aby vyhovoval potřebám produkčního prostředí.

3.Rychlá reakce: 24% rychlejší než o1-mini, s dobou odezvy 7,7 sekundy na jeden požadavek.

4.Zlepšení zabezpečení: zajišťuje bezpečný a spolehlivý výstup díky technologii hlubokého zarovnání.

5.Nákladově efektivní: možnosti odvozování a optimalizace nákladů jdou ruku v ruce, což výrazně snižuje práh pro použití umělé inteligence.

Porovnat

Otevřená umělá inteligence Aby se zvýraznila její třída, její oficiální blog porovnává pouze se svými vlastními modely. Proto je v tomto článku tabulka převzata z článku DeepSeek R1 a údajů z oficiálního blogu OpenAI.

OpenAI oficiálně porovnává o3-mini v seznamu verzí a rozdělí je na tři verze: nízkou, střední a vysokou, které označují sílu odvození. Vzhledem k tomu, že DeepSeek používá Math-500 a OpenAI používá datovou sadu Math, bylo zde toto srovnání odstraněno.

Graf je intuitivnější a Codeforces byl odstraněn, protože hodnoty jsou příliš velké na to, aby se daly intuitivně zobrazit. Srovnání na Codeforces však ukazuje, že vysoká inferenční síla o3-mini nemá velký náskok.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Z grafu vyplývá, že existují celkem 4 srovnání a O3-mini (high) obecně vede, ale náskok je velmi malý.

Cena

modelVstupní cenaZásah do mezipamětiVýstupní cena
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

Souhrn

Poté, co DeepSeek R1 vyvolal ve Spojených státech paniku DeepSeek, se jako první cítila ohrožena společnost OpenAI, což je patrné zejména na ceně jejího nového modelu o3-mini.

Když byl Openai o1 poprvé vydán, jeho vysoká cena tlačila na mnoho vývojářů a uživatelů. S příchodem DeepSeek R1 měl každý větší výběr.Od třicetinásobného cenového rozdílu mezi o1 a R1 až po dvojnásobek konečné ceny o3-mini. cena DeepSeek R1,

ukazuje vliv DeepSeek R1 na openai.Bezplatní uživatelé ChatGPT si však mohou o3-mini vyzkoušet pouze omezeně, zatímco Deep Thinking od DeepSeek je v současné době k dispozici všem uživatelům.Těším se také na to, že openai přinese více špičkových modelů ai a zároveň sníží náklady na používání pro uživatele.

Z pohledu osobní zkušenosti blogera s používáním R1 bych chtěl říct, že mi R1 Deep Thinking vždy otevře mysl. Všem doporučuji, aby ji více používali k přemýšlení o problémech~.

Podobné příspěvky

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *