Komplexní porovnání nově vydaného systému OpenAI o3-mini a DeepSeek R1

Společnost OpenAI vydala svůj nejnovější inferenční model, o3-mini, který je optimalizován pro obory, jako je věda, matematika a programování, a poskytuje rychlejší odezvu, vyšší přesnost a nižší náklady.

V porovnání se svým předchůdcem o1-mini má o3-mini výrazně lepší inferenční schopnosti, zejména při řešení složitých problémů. Testující dávají přednost odpovědím o3-mini o 56% a chybovost se snížila o 39%. Ode dneška, ChatGPT Plus, Tým a Pro uživatelé mohou používat o3-mini a bezplatní uživatelé si také můžete vyzkoušet některé z jeho funkcí.

V porovnání s inferenčním modelem DeepSeek-R1, o kolik lepší je OpenAI o3-mini než R1?

V tomto článku nejprve uvedeme přehled nejdůležitějších funkcí o3-mini a poté získáme data z obou stran jednotlivých benchmarků a vytvoříme graf pro jejich vizuální porovnání. Kromě toho porovnáme také cenu o3-mini.

Obsah

Hlavní body

1.Optimalizace STEM: vyniká v oblasti matematiky, programování, přírodních věd atd., zejména překonává o1-mini v režimu vysoké náročnosti odvozování.

2.Funkce vývojáře: podporuje funkce, jako jsou volání funkcí, strukturovaný výstup a zprávy pro vývojáře, aby vyhovoval potřebám produkčního prostředí.

3.Rychlá reakce: 24% rychlejší než o1-mini, s dobou odezvy 7,7 sekundy na jeden požadavek.

4.Zlepšení zabezpečení: zajišťuje bezpečný a spolehlivý výstup díky technologii hlubokého zarovnání.

5.Nákladově efektivní: možnosti odvozování a optimalizace nákladů jdou ruku v ruce, což výrazně snižuje práh pro použití umělé inteligence.

Porovnat

Otevřená umělá inteligence Aby se zvýraznila její třída, její oficiální blog porovnává pouze se svými vlastními modely. Proto je v tomto článku tabulka převzata z článku DeepSeek R1 a údajů z oficiálního blogu OpenAI.

OpenAI oficiálně porovnává o3-mini v seznamu verzí a rozdělí je na tři verze: nízkou, střední a vysokou, které označují sílu odvození. Vzhledem k tomu, že DeepSeek používá Math-500 a OpenAI používá datovou sadu Math, bylo zde toto srovnání odstraněno.

Graf je intuitivnější a Codeforces byl odstraněn, protože hodnoty jsou příliš velké na to, aby se daly intuitivně zobrazit. Srovnání na Codeforces však ukazuje, že vysoká inferenční síla o3-mini nemá velký náskok.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Z grafu vyplývá, že existují celkem 4 srovnání a O3-mini (high) obecně vede, ale náskok je velmi malý.

Cena

model	Vstupní cena	Zásah do mezipaměti	Výstupní cena
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Souhrn

Poté, co DeepSeek R1 vyvolal ve Spojených státech paniku DeepSeek, se jako první cítila ohrožena společnost OpenAI, což je patrné zejména na ceně jejího nového modelu o3-mini.

Když byl Openai o1 poprvé vydán, jeho vysoká cena tlačila na mnoho vývojářů a uživatelů. S příchodem DeepSeek R1 měl každý větší výběr.Od třicetinásobného cenového rozdílu mezi o1 a R1 až po dvojnásobek konečné ceny o3-mini. cena DeepSeek R1,

ukazuje vliv DeepSeek R1 na openai.Bezplatní uživatelé ChatGPT si však mohou o3-mini vyzkoušet pouze omezeně, zatímco Deep Thinking od DeepSeek je v současné době k dispozici všem uživatelům.Těším se také na to, že openai přinese více špičkových modelů ai a zároveň sníží náklady na používání pro uživatele.

Z pohledu osobní zkušenosti blogera s používáním R1 bych chtěl říct, že mi R1 Deep Thinking vždy otevře mysl. Všem doporučuji, aby ji více používali k přemýšlení o problémech~.

Nezařazené

Souboj čtyř nejlepších modelů! Recenze ukazuje, jak výkonný je Deepseek R1

Podlezddeepseeker 1. července 20251. července 2025

Během posledních několika dnů byl Deepseek-R1 0528 oficiálně open-source. Na LiveCodeBench je jeho výkon téměř srovnatelný s OpenAI o3 (vysoký); v Aiderově vícejazyčném benchmarkovém testu si vede i s Claude Opus. Když byl spuštěn na oficiálních webových stránkách, rychle jsme otestovali jeho front-endové schopnosti a zjistili jsme, že jsou výjimečně…

Nezařazené

Paper-DeepSeek-R1: Motivace schopnosti uvažování v LLM prostřednictvím učení s posilováním (Reinforcement Learning)

Podledeepseeker Leden 29, 2025Leden 29, 2025

Abstrakt Tento článek představuje první generaci argumentačních modelů DeepSeek: DeepSeek-R1-Zero a DeepSeek-R1. Model DeepSeek-R1-Zero, vycvičený pomocí rozsáhlého posilovacího učení (RL) bez dolaďování pod dohledem (SFT), vykazuje pozoruhodné schopnosti uvažování. Prostřednictvím RL přirozeně rozvíjí výkonné rozumové chování. Potýká se však s problémy, jako je špatná čitelnost a míchání jazyků. Pro řešení těchto problémů a zvýšení výkonnosti uvažování byl vyvinut DeepSeek-R1,...

Nezařazené

Cathie Wood: DeepSeek jen urychluje proces snižování nákladů; extrémně koncentrovaná tržní struktura srovnatelná s Velkou hospodářskou krizí se změní

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Hlavní body Konkurence s DeepSeek je dobrá pro americkou Cathie Wood: Myslím, že ukazuje, že náklady na inovace dramaticky klesají a že tento trend již začal. Například před DeepSeek náklady na výcvik umělé inteligence klesly o 75% ročně a náklady na odvození dokonce o 85% na…

Nezařazené

Velké artefakty správy jazykového modelu, jako je DeepSeek: Cherry Studio, Chatbox, AnythingLLM, kdo je vaším akcelerátorem efektivity?

Podlezddeepseeker Únor 11, 2025Únor 11, 2025

Mnoho lidí již začalo nasazovat a používat velké jazykové modely Deepseek lokálně pomocí Chatboxu jako vizualizačního nástroje Tento článek bude pokračovat v představení dvou dalších artefaktů správy a vizualizace velkých jazykových modelů AI a podrobně porovná tyto tři, aby vám pomohl efektivněji používat velké jazykové modely AI. V roce 2025,…

Nezařazené

Qwen2.5-max vs DeepSeek R1: Hluboké srovnání modelů: úplná analýza scénářů aplikací

Podlezddeepseeker Únor 14, 2025Únor 14, 2025

Úvod Dnes hrají zásadní roli velké jazykové modely (LLM). Začátkem roku 2025, kdy konkurence o AI zesílila, uvedla Alibaba na trh nový model AI Qwen2.5-max a společnost DeepSeek z Hangzhou v Číně uvedla na trh model R1, který představuje vrchol technologie LLM. Deepseek R1 je open source model umělé inteligence, který přitahuje…

Nezařazené

Aktualizace DeepSeek-R1-0528: Hlubší myšlení, silnější uvažování

Podlezddeepseeker 29. května 202529. května 2025

Model DeepSeek R1 prošel drobnou aktualizací verze, aktuální verze je DeepSeek-R1-0528. Po vstupu na webovou stránku nebo do aplikace DeepSeek povolte v dialogovém okně funkci „Hluboké myšlení“ a vyzkoušejte nejnovější verzi. Závaží modelu DeepSeek-R1-0528 byla nahrána na HuggingFace. Během posledních čtyř měsíců prošel model DeepSeek-R1…

Hlavní body

Porovnat

Cena

Souhrn

Podobné příspěvky

Napsat komentář Zrušit odpověď na komentář