Ein umfassender Vergleich von OpenAIs neu veröffentlichtem o3-mini und DeepSeek R1

OpenAI hat sein neuestes Inferenzmodell veröffentlicht, o3-minidie für Bereiche wie Wissenschaft, Mathematik und Programmierung optimiert ist und schnellere Reaktionen, höhere Genauigkeit und geringere Kosten bietet.

Im Vergleich zu seinem Vorgänger o1-mini hat o3-mini seine Inferenzfähigkeiten deutlich verbessert, insbesondere bei der Lösung komplexer Probleme. Die Tester bevorzugen die Antworten von o3-mini um 56%, und die Fehlerquote wurde um 39% reduziert. Seit heute, ChatGPT Plus, Team und Pro Benutzer können o3-mini verwenden, und freie Benutzer können auch einige seiner Funktionen erleben.

Verglichen mit dem Inferenzmodell DeepSeek-R1wie viel besser ist OpenAI o3-mini als R1?

In diesem Artikel geben wir zunächst einen Überblick über die Highlights von o3-mini, dann extrahieren wir die Daten beider Seiten zu jedem Benchmark und erstellen eine Grafik, um sie visuell zu vergleichen. Darüber hinaus werden wir auch den Preis von o3-mini vergleichen.

Inhaltsübersicht

Wichtigste Highlights

1.STEM-Optimierungo1-mini: übertrifft o1-mini in den Bereichen Mathematik, Programmierung, Naturwissenschaften usw., insbesondere im Modus "hoher Schlussfolgerungsaufwand".

2.Funktionen für Entwickler: unterstützt Funktionen wie Funktionsaufrufe, strukturierte Ausgaben und Entwicklermeldungen, um den Anforderungen der Produktionsumgebung gerecht zu werden.

3.Schnelle Reaktion24% schneller als o1-mini, mit einer Antwortzeit von 7,7 Sekunden pro Anfrage.

4.Verbesserung der Sicherheit: gewährleistet eine sichere und zuverlässige Ausgabe durch die Deep Alignment Technologie.

5.KostengünstigDie Schwelle für den Einsatz von KI wird dadurch deutlich gesenkt, denn Inferenzfähigkeit und Kostenoptimierung gehen Hand in Hand.

Vergleichen Sie

Open AI Um seine Klasse hervorzuheben, ist seine offizieller Blog vergleicht sie nur mit ihren eigenen Modellen. Daher ist dieser Artikel eine Tabelle, die aus dem DeepSeek R1-Papier und den Daten aus dem offiziellen OpenAI-Blog extrahiert wurde.

OpenAI vergleicht offiziell o3-mini in der Versionsliste und unterteilt sie in drei Versionen: niedrig, mittel und hoch, die die Stärke der Inferenz angeben. Da DeepSeek Math-500 verwendet und OpenAI den Math-Datensatz, wurde dieser Vergleich hier entfernt.

Ein Diagramm ist intuitiver, und Codeforces wurde entfernt, da die Werte zu groß sind, um intuitiv angezeigt zu werden. Der Vergleich auf Codeforces zeigt jedoch, dass die hohe Inferenzstärke von o3-mini kein großer Vorsprung ist.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-geprüft

Aus dem Diagramm geht hervor, dass es insgesamt 4 Vergleiche gibt und der O3-mini (hoch) im Allgemeinen führt, aber der Vorsprung ist sehr gering.

Preis

Modell	Eingangspreis	Cache-Treffer	Erzeugerpreis
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Tiefensuche R1	$0.55	$0.14	$2.19

Zusammenfassung

Nachdem DeepSeek R1 die DeepSeek-Panik in den Vereinigten Staaten ausgelöst hatte, fühlte sich OpenAI als erstes bedroht, was sich insbesondere in der Preisgestaltung seines neuen Modells o3-mini widerspiegelt.

Als Openai o1 zum ersten Mal veröffentlicht wurde, setzte der hohe Preis viele Entwickler und Benutzer unter Druck. Das Erscheinen von DeepSeek R1 gab jedem mehr Auswahlmöglichkeiten.Vom 30-fachen Preisunterschied zwischen o1 und R1 bis zum doppelten Endpreis von o3-mini den Preis von DeepSeek R1,

zeigt die Auswirkungen von DeepSeek R1 auf openai.Allerdings können die kostenlosen Nutzer von ChatGPT o3-mini nur eingeschränkt erleben, während Deep Thinking von DeepSeek derzeit allen Nutzern zur Verfügung steht.Ich freue mich auch darauf, dass openai weitere führende KI-Modelle einführt und gleichzeitig die Nutzungskosten für die Nutzer senkt.

Aus der Perspektive eines Bloggers, der persönliche Erfahrungen mit R1 gemacht hat, möchte ich sagen, dass R1's Deep Thinking immer meinen Geist öffnet. Ich empfehle jedem, es mehr zu nutzen, um über Probleme nachzudenken~.

Uncategorized

Paper-DeepSeek-R1: Anreize für logisches Denken in LLMs durch Reinforcement Learning

Vondeepseeker Januar 29, 2025Januar 29, 2025

Zusammenfassung In diesem Beitrag werden die DeepSeek-Schlussfolgermodelle der ersten Generation vorgestellt: DeepSeek-R1-Zero und DeepSeek-R1. DeepSeek-R1-Zero, trainiert durch großangelegtes Reinforcement Learning (RL) ohne überwachte Feinabstimmung (SFT), zeigt bemerkenswerte Argumentationsfähigkeiten. Durch RL entwickelt es auf natürliche Weise ein leistungsfähiges Denkverhalten. Allerdings steht es vor Herausforderungen wie schlechter Lesbarkeit und Sprachmischung. Um diese Probleme zu lösen und die Argumentationsleistung zu verbessern, wurde DeepSeek-R1 entwickelt,...

Uncategorized

Gemini 2.0 dominiert die Charts, während der Preis des DeepSeek V3 sinkt. Ein neuer Champion in Sachen Kosteneffizienz ist geboren!

Vonzddeepseeker 8. Februar 20258. Februar 2025

Die Google Gemini 2.0-Familie ist endlich komplett! Sie dominiert die Charts, sobald sie veröffentlicht wird. Inmitten der Verfolgung und Blockaden von Deepseek, Qwen und o3 hat Google heute früh drei Modelle auf einmal veröffentlicht: Gemini 2.0 Pro, Gemini 2.0 Flash und Gemini 2.0 Flash-Lite. In der Rangliste der großen Modelle LMSYS ist Gemini…

Uncategorized

Ali Qwen2.5-Max überholt DeepSeek-V3! Netizen: Chinas KI schließt schnell die Lücke

Vonzddeepseeker 5. Februar 20255. Februar 2025

Gerade wurde ein weiteres inländisches Modell von Ali zur Big Model Arena-Liste hinzugefügt: Qwen2.5-Max, das DeepSeek-V3 übertraf und mit einer Gesamtpunktzahl von 1332 den siebten Platz in der Gesamtwertung belegte. Es übertraf auch Modelle wie Claude 3.5 Sonnet und Llama 3.1 405B auf einen Schlag. Insbesondere zeichnet es sich durch seine Programmierfähigkeiten aus …

Uncategorized

Was kann Deepseek? Das schafft nicht einmal OpenAI?

Vonzddeepseeker 10. Februar 202510. Februar 2025

Der wahre Wert von DeepSeek wird unterschätzt! DeepSeek-R1 hat zweifellos eine neue Welle der Begeisterung auf den Markt gebracht. Nicht nur steigen die relevanten sogenannten Begünstigtenziele stark an, sondern einige Leute haben sogar DeepSeek-bezogene Kurse und Software entwickelt, um damit Geld zu verdienen. Wir glauben, dass diese Phänomene zwar einen …

Uncategorized

Erster Start! SiliconFlow und Huawei Cloud starten gemeinsam DeepSeek R1- und V3-Inferenzdienste auf Basis der Ascend Cloud!

Vonzddeepseeker 1. Februar 20251. Februar 2025

DeepSeek-R1 und DeepSeek-V3 haben seit ihrer Open-Source-Einführung weltweit für Aufsehen gesorgt. Sie sind ein Geschenk des DeepSeek-Teams an die gesamte Menschheit, und wir freuen uns aufrichtig über ihren Erfolg. Nach tagelanger harter Arbeit der Silicon Mobility- und Huawei Cloud-Teams schenken wir heute auch chinesischen Nutzern eine chinesische...

Uncategorized

Cathie Wood: DeepSeek beschleunigt lediglich den Kostensenkungsprozess; die extrem konzentrierte Marktstruktur, vergleichbar mit der Großen Depression, wird sich ändern

Vonzddeepseeker 8. Februar 20258. Februar 2025

Highlights Der Wettbewerb mit DeepSeek ist gut für die USA Cathie Wood: Ich denke, es zeigt, dass die Kosten für Innovationen dramatisch sinken und dass dieser Trend bereits begonnen hat. Beispielsweise sanken vor DeepSeek die Kosten für das Training künstlicher Intelligenz um 75% pro Jahr und die Kosten für Inferenz sanken sogar um 85% auf…

Wichtigste Highlights

Vergleichen Sie

Preis

Zusammenfassung

Ähnliche Beiträge

Schreibe einen Kommentar Antworten abbrechen