o3-迷你 和o3-mini(高端)將於今天發布。

常規用戶還將獲得 o3-迷你,並且plus用戶將能夠使用o3-mini(high)。

o3-mini(high)在Codeforce上比o1高出200分左右,速度比o1快,編碼和數學方面的表現也更出色,但成本還是在o1-mini的水平。

此外,使用者每天可以使用 o3-mini 100 次。但o3-mini(high)的使用限制仍有待進一步確認。

還有網友表示,是啊,R1這麼火,Openai按捺不住了:

而此前,阿里巴巴Qwen團隊在除夕夜發布了qwen2.5-max。春節期間大家還是要滾啊,哈哈哈…

其實早在聖誕節直播的時候, Openai 宣布 o3 mini 將於 2025 年初上市:

我們還要說一下o3和o3-mini是什麼?

o3:在編碼、數學甚至面向 AGI 的基準測試中表現出色的尖端推理模型。它為智慧和解決問題設立了新的基準。

o3-迷你:o3 的經濟高效版本,以極低的成本和速度提供卓越的效能。

這些模型將推理提升到了一個全新的水平,使得需要深入理解和邏輯的複雜任務的突破成為可能。

o3帶來三大突破。

編程能力:實際編程準確率71.7±%,比o1高20±%。 Codeforces上得分2727,已經超越人類水準。

數學程度:美國數學奧林匹克資格賽中準確率接近97%。即使是最困難的Epic AI前沿數學問題也可以得到25%的結果。

最驚人的是ArcAGI測試:87.5%,在這個難度極高的基準測試上首次超越人類。

為什麼說o3-mini是顛覆性創新? o3-mini 帶來了兩點變化。

自適應思考:可依任務難度調整推理深度,有低、中、高三種模式可供選擇。

這使得人工智慧更加貼近現實世界的使用場景。

性價比突破:比o1-mini成本更低,反應更快,效果更好。

不過網友們感嘆,o3 high每個任務消耗$1000:

另外,可用的模型確實太多了,我們還沒有確認如何在它們之間切換。

類似文章

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *