
o3-迷你 到了深夜,OpenAI終於亮出了最新王牌。在一次 Reddit AMA 問答中,Altman 深深坦白自己站在了開源 AI 的錯誤一邊。
他表示,內部正在考慮開源策略,模型還會繼續開發,但OpenAI的領先優勢不會像以前那麼大。
就在大家還在驚嘆DeepSeek的驚人威力的時候,OpenAI終於坐不住了。
昨日凌晨,o3-mini緊急上線,在數學代碼等基準測試中創下新SOTA,重返王位。
最重要的是免費用戶也可以體驗! o3-mini 不是開玩笑的。在「人類的最後一次考試」中,o3-mini(high)直接取得了最佳的準確度和校準誤差。

幾個小時後 o3-mini 上線之後,OpenAI官方開啟了一個約一小時的Reddit AMA。
奧特曼本人也上線了,一一解答了網友們的疑問。

主要亮點如下:
- DeepSeek確實很好,我們也會繼續開發更好的車型,但領先優勢不會像以前那麼大
- 與幾年前相比,我現在更傾向於相信人工智慧可能會實現快速飛躍
- 我們在開源加權 AI 模型問題上站錯了隊
- 高級語音模式的更新即將推出,我們將直接稱之為 GPT-5,而不是 GPT-5o。目前還沒有具體的時間表。
除了Altman本人之外,首席研究官Mark Chen、首席產品長Kevin Weil、工程副總裁Srinivas Narayanan、API研究負責人Michelle Pokrass、研究主管Hongyu Ren也親自到現場,細心解答了網友們的提問。
接下來我們來看看他們都說了什麼。
奧特曼深感悔恨,在開源 AI 之戰中站錯了隊
DeepSeek的突然回歸或許是出乎所有人的意料。
在AMA問答環節,Altman本人也對自己在開源AI之爭中站錯了隊伍深感後悔,並不得不承認DeepSeek的強大優勢。
讓很多人驚訝的是,奧特曼甚至表示,OpenAI 的領先優勢已經不像以前那麼強了。
以下是我們整理出來的奧特曼的經典答案。
Q:我們來談談本週的熱門話題:Deepseek。這顯然是一個非常令人印象深刻的模型,我知道它可能是在其它 LLM 的輸出基礎上進行訓練的。這將如何改變您對未來模型的計劃?
奧特曼:這確實是一個非常令人印象深刻的模型!我們會研發出更好的車型,但是我們不可能再像前幾年那樣保持那麼大的領先優勢。
Q:您認為遞歸式的自我完善是漸進的過程還是突然的起飛?
奧爾特曼:就我個人而言,我認為與幾年前相比,我更傾向於認為人工智慧可能會取得快速進步。也許是時候就這個話題寫點東西了…
Q:我們可以看到模型思考的所有標記嗎?
奧特曼:是的,我們很快就會展示一個更有用、更詳細的版本。感謝 R1 的更新。
首席產品長凱文威爾 (Kevin Weil):我們正在努力展示比現在更多的內容——這將很快實現。我們是否展示所有內容還有待確定。展示所有的思維鏈(CoT)會導致競爭對手模型的提煉,但我們也知道用戶(至少是高級用戶)希望看到這一點,所以我們會找到一個很好的平衡點。
Q:o3 的完整版本什麼時候推出?
奧特曼:我估計會持續數週以上,但不會超過幾個月。
Q:語音模式會有更新嗎?這可能是 GPT-5o 的重點嗎? GPT-5o 的大致時間表是怎樣的?
奧特曼:是的,高級語音模式即將更新!我認為我們會稱之為 GPT-5,而不是 GPT-5o。目前還沒有具體的時間表。
Q:您會考慮發布一些模型權重並發表一些研究嗎?
奧特曼:是的,我們正在討論。我個人認為我們在這個問題上站錯了隊,需要提出不同的開源策略; OpenAI 內部並非所有人都認同這個觀點,而且這也不是我們目前的首要任務。
再問一個問題:
- 我們距離在常規 Plus 計劃中提供 Operator 服務還有多遠?
- 機器人部門的首要任務是什麼?
- OpenAI 對 Trillium、Cerebras 等更專業的晶片/TPU 有何看法? OpenAI 關注到這一點了嗎?
- 為了對沖 AGI 和 ASI 的未來風險,正在進行哪些投資?
- 您最難忘的假期是什麼?
奧特曼:
- 幾個月
- 小規模生產出真正優秀的機器人,並從中學到經驗教訓
- GB200 目前很難被擊敗!
- 一個好的選擇是改善你的內在狀態-韌性、適應性、平靜、快樂等等。
- 很難選擇!但首先想到的是:東南亞背包旅行或非洲狩獵旅行
Q:你們打算提高 Plus 系列的價格嗎?
奧特曼:實際上,我想逐漸減少它。
Q:假設現在是 2030 年,你剛剛創建了一個大多數人稱之為 AGI 的系統。它在所有基準測試中表現出色,在速度和性能方面超越了您最好的工程師和研究人員。下一步是什麼?除了「放到網站上提供服務」以外,還有其他方案嗎?
奧特曼:我認為,最重要的影響就是加速科學發現,我認為這是對改善生活品質貢獻最大的因素。
4o 影像生成,即將推出
接下來,加入了其他 OpenAI 成員的回應。
Q:你們還計劃推出 4o 影像產生器嗎?
首席產品長 Kevin Weil:是的!我認為等待是值得的。
問:太棒了!有大概的時間表嗎?
首席產品長凱文威爾 (Kevin Weil):你這是在給我惹麻煩。或許幾個月吧。
還有另一個類似的問題。
Q:我們什麼時候可以看到 ChatGPT-5?
首席產品長 Kevin Weil:o-17 micro 和 GPT-(π+1) 之後不久。
然後又出現了另一個問題:
- 我們還能期待什麼其他類型的代理商?
- 並且還為免費用戶提供代理,這可以加速採用…
- DALL·E 新版有什麼更新嗎?
- 最後一個問題,也是每個人都會問的問題......AGI 何時能夠實現?
首席產品長 Kevin Weil:
- 將會有更多代理商:很快。我想你會很高興的。
- 基於4o的圖像生成:再過幾個月就等不及你們用了。這很棒。
- AGI:是的
Q:您是否計劃在推理模型中新增文件附件功能?
Srinivas Narayanan,工程副總裁:它正在開發中。未來,推理模型將能夠使用不同的工具,包括搜尋功能。
首席產品長 Kevin Weil:我迫不及待想看到推理模型能夠使用工具
問:真的嗎?當你解決了這個問題之後,一些非常有用的AI應用場景就會被打開。想像一下它能夠理解你的 500GB 工作文檔的內容。
當你準備回覆一封電子郵件時,你的電子郵件應用程式旁邊會打開一個面板,它會不斷分析與此人相關的所有信息,包括你們的關係、討論的話題、過去的工作等等。正在編輯的文檔中的一些內容'早已忘記將被標記,因為它與當前討論高度相關。我非常想要這個功能。
Srinivas Narayanan,工程副總裁:我們正在致力於增加上下文的長度。目前尚未確定日期/公告。
Q:星際之門計畫對於 OpenAI 的未來有多重要? 首席產品長凱文威爾 (Kevin Weil):非常重要。我們所看到的一切都表明,我們擁有的運算能力越強,我們就能建立更好的模型,就能創造出更有價值的產品。
我們現在在兩個維度上擴展模型——更大規模的預訓練和更多的強化學習 (RL)/「草莓」訓練——這兩者都需要計算資源。
服務數億用戶也需要運算資源!隨著我們轉向能夠持續為您工作的更聰明的代理產品,這也需要運算資源。所以你可以把星際之門想像成我們的工廠,電力/GPU 在這裡被轉化為令人驚嘆的產品。
Q:在內部,你們現在採用的是哪一種模型? o4、o5 還是 o6?與 o3 相比,這些內部模型有多聰明?
API 研究主管 Michelle Pokrass:我們已經數不清了。
Q:請允許我們在使用進階語音功能時與文字/畫布進行互動。我希望能夠與它對話並讓它迭代地修改文件。
首席產品長 Kevin Weil:是的!我們有許多相對獨立開發的優秀工具—我們的目標是盡快將這些工具交到您手中。
下一步是整合所有這些功能,以便您可以與一個模型對話,該模型同時進行搜尋和推理,並產生一個可以運行 Python 的畫布。所有工具都需要更好地協同工作。順便說一句,所有型號都需要完整的工具存取權限(O 系列型號目前無法使用所有工具),這也將實現。
Q:O系列什麼時候會支持ChatGPT的記憶功能?
API 研究主管 Michelle Pokrass:正在開發中!將我們的所有功能與 O 系列型號統一起來是我們的首要任務。
Q:4o 會有重大改進嗎?我非常喜歡自訂 GPT,如果它可以升級,或者我們可以選擇在自訂 GPT 中使用哪種型號(例如 o3 mini),那就太好了。
API 研究主管 Michelle Pokrass:是的,我們還沒完成 4o 系列!