OpenAI hat sein neuestes Inferenzmodell veröffentlicht, o3-minidie für Bereiche wie Wissenschaft, Mathematik und Programmierung optimiert ist und schnellere Reaktionen, höhere Genauigkeit und geringere Kosten bietet.
Im Vergleich zu seinem Vorgänger o1-mini hat o3-mini seine Inferenzfähigkeiten deutlich verbessert, insbesondere bei der Lösung komplexer Probleme. Die Tester bevorzugen die Antworten von o3-mini um 56%, und die Fehlerquote wurde um 39% reduziert. Seit heute, ChatGPT Plus, Team und Pro Benutzer können o3-mini verwenden, und freie Benutzer können auch einige seiner Funktionen erleben.

Verglichen mit dem Inferenzmodell DeepSeek-R1wie viel besser ist OpenAI o3-mini als R1?
In diesem Artikel geben wir zunächst einen Überblick über die Highlights von o3-mini, dann extrahieren wir die Daten beider Seiten zu jedem Benchmark und erstellen eine Grafik, um sie visuell zu vergleichen. Darüber hinaus werden wir auch den Preis von o3-mini vergleichen.
Wichtigste Highlights
1.STEM-Optimierungo1-mini: übertrifft o1-mini in den Bereichen Mathematik, Programmierung, Naturwissenschaften usw., insbesondere im Modus "hoher Schlussfolgerungsaufwand".
2.Funktionen für Entwickler: unterstützt Funktionen wie Funktionsaufrufe, strukturierte Ausgaben und Entwicklermeldungen, um den Anforderungen der Produktionsumgebung gerecht zu werden.
3.Schnelle Reaktion24% schneller als o1-mini, mit einer Antwortzeit von 7,7 Sekunden pro Anfrage.
4.Verbesserung der Sicherheit: gewährleistet eine sichere und zuverlässige Ausgabe durch die Deep Alignment Technologie.
5.KostengünstigDie Schwelle für den Einsatz von KI wird dadurch deutlich gesenkt, denn Inferenzfähigkeit und Kostenoptimierung gehen Hand in Hand.
Vergleichen Sie
Open AI Um seine Klasse hervorzuheben, ist seine offizieller Blog vergleicht sie nur mit ihren eigenen Modellen. Daher ist dieser Artikel eine Tabelle, die aus dem DeepSeek R1-Papier und den Daten aus dem offiziellen OpenAI-Blog extrahiert wurde.
OpenAI vergleicht offiziell o3-mini in der Versionsliste und unterteilt sie in drei Versionen: niedrig, mittel und hoch, die die Stärke der Inferenz angeben. Da DeepSeek Math-500 verwendet und OpenAI den Math-Datensatz, wurde dieser Vergleich hier entfernt.

Ein Diagramm ist intuitiver, und Codeforces wurde entfernt, da die Werte zu groß sind, um intuitiv angezeigt zu werden. Der Vergleich auf Codeforces zeigt jedoch, dass die hohe Inferenzstärke von o3-mini kein großer Vorsprung ist.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-geprüft
Aus dem Diagramm geht hervor, dass es insgesamt 4 Vergleiche gibt und der O3-mini (hoch) im Allgemeinen führt, aber der Vorsprung ist sehr gering.
Preis
Modell | Eingangspreis | Cache-Treffer | Erzeugerpreis |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Tiefensuche R1 | $0.55 | $0.14 | $2.19 |
Zusammenfassung
Nachdem DeepSeek R1 die DeepSeek-Panik in den Vereinigten Staaten ausgelöst hatte, fühlte sich OpenAI als erstes bedroht, was sich insbesondere in der Preisgestaltung seines neuen Modells o3-mini widerspiegelt.
Als Openai o1 zum ersten Mal veröffentlicht wurde, setzte der hohe Preis viele Entwickler und Benutzer unter Druck. Das Erscheinen von DeepSeek R1 gab jedem mehr Auswahlmöglichkeiten.Vom 30-fachen Preisunterschied zwischen o1 und R1 bis zum doppelten Endpreis von o3-mini den Preis von DeepSeek R1,
zeigt die Auswirkungen von DeepSeek R1 auf openai.Allerdings können die kostenlosen Nutzer von ChatGPT o3-mini nur eingeschränkt erleben, während Deep Thinking von DeepSeek derzeit allen Nutzern zur Verfügung steht.Ich freue mich auch darauf, dass openai weitere führende KI-Modelle einführt und gleichzeitig die Nutzungskosten für die Nutzer senkt.
Aus der Perspektive eines Bloggers, der persönliche Erfahrungen mit R1 gemacht hat, möchte ich sagen, dass R1's Deep Thinking immer meinen Geist öffnet. Ich empfehle jedem, es mehr zu nutzen, um über Probleme nachzudenken~.