
o3-迷你 和o3-mini(高端)將於今天發布。

常規用戶還將獲得 o3-迷你,並且plus用戶將能夠使用o3-mini(high)。
o3-mini(high)在Codeforce上比o1高出200分左右,速度比o1快,編碼和數學方面的表現也更出色,但成本還是在o1-mini的水平。

此外,使用者每天可以使用 o3-mini 100 次。但o3-mini(high)的使用限制仍有待進一步確認。
還有網友表示,是啊,R1這麼火,Openai按捺不住了:


而此前,阿里巴巴Qwen團隊在除夕夜發布了qwen2.5-max。春節期間大家還是要滾啊,哈哈哈…
其實早在聖誕節直播的時候, Openai 宣布 o3 mini 將於 2025 年初上市:


我們還要說一下o3和o3-mini是什麼?
o3:在編碼、數學甚至面向 AGI 的基準測試中表現出色的尖端推理模型。它為智慧和解決問題設立了新的基準。
o3-迷你:o3 的經濟高效版本,以極低的成本和速度提供卓越的效能。
這些模型將推理提升到了一個全新的水平,使得需要深入理解和邏輯的複雜任務的突破成為可能。
o3帶來三大突破。
編程能力:實際編程準確率71.7±%,比o1高20±%。 Codeforces上得分2727,已經超越人類水準。
數學程度:美國數學奧林匹克資格賽中準確率接近97%。即使是最困難的Epic AI前沿數學問題也可以得到25%的結果。
最驚人的是ArcAGI測試:87.5%,在這個難度極高的基準測試上首次超越人類。

為什麼說o3-mini是顛覆性創新? o3-mini 帶來了兩點變化。
自適應思考:可依任務難度調整推理深度,有低、中、高三種模式可供選擇。
這使得人工智慧更加貼近現實世界的使用場景。
性價比突破:比o1-mini成本更低,反應更快,效果更好。
不過網友們感嘆,o3 high每個任務消耗$1000:

另外,可用的模型確實太多了,我們還沒有確認如何在它們之間切換。
