突發新聞！ OpenAI 今天發布了 2 個新的推理模型：o3-mini 和 o3-mini-high。深度探索 R1

o3-迷你和o3-mini（高端）將於今天發布。

常規用戶還將獲得 o3-迷你，並且plus用戶將能夠使用o3-mini（high）。

o3-mini（high）在Codeforce上比o1高出200分左右，速度比o1快，編碼和數學方面的表現也更出色，但成本還是在o1-mini的水平。

此外，使用者每天可以使用 o3-mini 100 次。但o3-mini（high）的使用限制仍有待進一步確認。

還有網友表示，是啊，R1這麼火，Openai按捺不住了：

而此前，阿里巴巴Qwen團隊在除夕夜發布了qwen2.5-max。春節期間大家還是要滾啊，哈哈哈…

其實早在聖誕節直播的時候， Openai 宣布 o3 mini 將於 2025 年初上市:

我們還要說一下o3和o3-mini是什麼？

o3：在編碼、數學甚至面向 AGI 的基準測試中表現出色的尖端推理模型。它為智慧和解決問題設立了新的基準。

o3-迷你：o3 的經濟高效版本，以極低的成本和速度提供卓越的效能。

這些模型將推理提升到了一個全新的水平，使得需要深入理解和邏輯的複雜任務的突破成為可能。

o3帶來三大突破。

編程能力：實際編程準確率71.7±%，比o1高20±%。 Codeforces上得分2727，已經超越人類水準。

數學程度：美國數學奧林匹克資格賽中準確率接近97%。即使是最困難的Epic AI前沿數學問題也可以得到25%的結果。

最驚人的是ArcAGI測試：87.5%，在這個難度極高的基準測試上首次超越人類。

為什麼說o3-mini是顛覆性創新？ o3-mini 帶來了兩點變化。

自適應思考：可依任務難度調整推理深度，有低、中、高三種模式可供選擇。

這使得人工智慧更加貼近現實世界的使用場景。

性價比突破：比o1-mini成本更低，反應更快，效果更好。

不過網友們感嘆，o3 high每個任務消耗$1000：

另外，可用的模型確實太多了，我們還沒有確認如何在它們之間切換。

未分類

DeepSeek已發布其原始碼，FlashMLA詳解

經過雙ddeepseeker 2025年2月24日2025年2月24日

上週，DeepSeek宣布將於下週開源五個項目：網友表示「這次，OpenAI真的來了」。剛剛，第一個開源專案來了，與推理加速相關，FlashMLA：開源專案位址：DeepSeek FlashMLA 開源兩個小時，Github已經有2.7k+顆星星： The…

未分類

論文-DeepSeek-R1：透過強化學習激勵法學碩士中的推理能力

經過deepseeker 2025年1月29日2025年1月29日

摘要本文介紹了DeepSeek的第一代推理模型：DeepSeek-R1-Zero和DeepSeek-R1。 DeepSeek-R1-Zero 透過大規模強化學習（RL）訓練，無需監督微調（SFT），展現出卓越的推理能力。透過 RL，它自然而然地發展出強大的推理行為。但它面臨可讀性差、語言混合等挑戰。為了解決這些問題並提高推理性能，我們開發了DeepSeek-R1，…