o3-mini und o3-mini (hoch) werden heute veröffentlicht.

Regelmäßige Nutzer erhalten außerdem o3-miniund Plus-Nutzer können o3-mini (hoch) verwenden.

o3-mini (hoch) liegt bei Codeforce etwa 200 Punkte über o1, ist schneller als o1 und zeigt bessere Leistungen in Kodierung und Mathematik, aber die Kosten liegen immer noch auf dem Niveau von o1-mini.

Plus-Nutzer können o3-mini 100 Mal pro Tag nutzen. Die Nutzungsgrenze von o3-mini (hoch) muss jedoch noch bestätigt werden.

Einige Netizens sagten, ja, R1 ist so beliebt, dass Openai sich nicht zurückhalten kann:

Und zuvor hat das Alibaba Qwen-Team qwen2.5-max an Silvester veröffentlicht. Während des Frühlingsfestes muss jeder noch rollen, hahaha...

Und zwar schon in der Live-Sendung zu Weihnachten, Openai kündigt an, dass der o3 mini Anfang 2025 verfügbar sein wird:

Müssen wir noch darüber reden, was o3 und o3-mini sind?

o3: Ein hochmodernes Inferenzmodell, das in Codierung, Mathematik und sogar AGI-orientierten Benchmark-Tests brilliert. Es setzt neue Maßstäbe für Intelligenz und Problemlösung.

o3-mini: Eine kosteneffiziente Version von o3, die eine hervorragende Leistung zu sehr niedrigen Kosten und mit geringer Geschwindigkeit bietet.

Diese Modelle haben die Inferenz auf eine völlig neue Ebene gehoben und ermöglichen einen Durchbruch bei komplexen Aufgaben, die ein tiefes Verständnis und Logik erfordern.

o3 bringt drei große Durchbrüche.

Programmierfähigkeit: 71,7% Genauigkeit bei der praktischen Programmierung, 20% höher als o1. 2727 Punkte bei Codeforces, übertrifft bereits das menschliche Niveau.

Mathematikniveau: fast 97% Genauigkeit in der Qualifikationsrunde der US-Mathematikolympiade. Selbst bei den schwierigsten mathematischen Problemen der Epic-KI-Grenze können 25% erzielt werden.

Das Erstaunlichste ist der Arc AGI-Test: 87,5%, womit er zum ersten Mal den Menschen bei diesem extrem schwierigen Benchmark-Test übertrifft.

Warum ist der o3-mini eine bahnbrechende Innovation? Der o3-mini bringt zwei Veränderungen mit sich.

Adaptives Denken: Die Tiefe des Denkens kann je nach Schwierigkeitsgrad der Aufgabe angepasst werden, wobei drei Modi zur Auswahl stehen: niedrig, mittel und hoch.

Dadurch wird die KI stärker an reale Nutzungsszenarien angepasst.

Durchbruch beim Kosten-Nutzen-Verhältnis: geringere Kosten als beim o1-mini, schnellere Reaktion und bessere Ergebnisse.

Netizens beklagen jedoch, dass o3 high $1.000 pro Aufgabe verbraucht:

Außerdem gibt es tatsächlich zu viele Modelle, und wir müssen noch bestätigen, wie man zwischen ihnen wechseln kann.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert