o3-迷你 到了深夜,OpenAI終於亮出了最新王牌。在一次 Reddit AMA 問答中,Altman 深深坦白自己站在了開源 AI 的錯誤一邊。

他表示,內部正在考慮開源策略,模型還會繼續開發,但OpenAI的領先優勢不會像以前那麼大。

就在大家還在驚嘆DeepSeek的驚人威力的時候,OpenAI終於坐不住了。

昨日凌晨,o3-mini緊急上線,在數學代碼等基準測試中創下新SOTA,重返王位。

最重要的是免費用戶也可以體驗! o3-mini 不是開玩笑的。在「人類的最後一次考試」中,o3-mini(high)直接取得了最佳的準確度和校準誤差。

幾個小時後 o3-mini 上線之後,OpenAI官方開啟了一個約一小時的Reddit AMA。

奧特曼本人也上線了,一一解答了網友們的疑問。

主要亮點如下:

  • DeepSeek確實很好,我們也會繼續開發更好的車型,但領先優勢不會像以前那麼大
  • 與幾年前相比,我現在更傾向於相信人工智慧可能會實現快速飛躍
  • 我們在開源加權 AI 模型問題上站錯了隊
  • 高級語音模式的更新即將推出,我們將直接稱之為 GPT-5,而不是 GPT-5o。目前還沒有具體的時間表。

除了Altman本人之外,首席研究官Mark Chen、首席產品長Kevin Weil、工程副總裁Srinivas Narayanan、API研究負責人Michelle Pokrass、研究主管Hongyu Ren也親自到現場,細心解答了網友們的提問。

接下來我們來看看他們都說了什麼。

奧特曼深感悔恨,在開源 AI 之戰中站錯了隊

DeepSeek的突然回歸或許是出乎所有人的意料。

在AMA問答環節,Altman本人也對自己在開源AI之爭中站錯了隊伍深感後悔,並不得不承認DeepSeek的強大優勢。

讓很多人驚訝的是,奧特曼甚至表示,OpenAI 的領先優勢已經不像以前那麼強了。

以下是我們整理出來的奧特曼的經典答案。

Q:我們來談談本週的熱門話題:Deepseek。這顯然是一個非常令人印象深刻的模型,我知道它可能是在其它 LLM 的輸出基礎上進行訓練的。這將如何改變您對未來模型的計劃?

奧特曼:這確實是一個非常令人印象深刻的模型!我們會研發出更好的車型,但是我們不可能再像前幾年那樣保持那麼大的領先優勢。

Q:您認為遞歸式的自我完善是漸進的過程還是突然的起飛?

奧爾特曼:就我個人而言,我認為與幾年前相比,我更傾向於認為人工智慧可能會取得快速進步。也許是時候就這個話題寫點東西了…

Q:我們可以看到模型思考的所有標記嗎?

奧特曼:是的,我們很快就會展示一個更有用、更詳細的版本。感謝 R1 的更新。

首席產品長凱文威爾 (Kevin Weil):我們正在努力展示比現在更多的內容——這將很快實現。我們是否展示所有內容還有待確定。展示所有的思維鏈(CoT)會導致競爭對手模型的提煉,但我們也知道用戶(至少是高級用戶)希望看到這一點,所以我們會找到一個很好的平衡點。

Q:o3 的完整版本什麼時候推出?

奧特曼:我估計會持續數週以上,但不會超過幾個月。

Q:語音模式會有更新嗎?這可能是 GPT-5o 的重點嗎? GPT-5o 的大致時間表是怎樣的?

奧特曼:是的,高級語音模式即將更新!我認為我們會稱之為 GPT-5,而不是 GPT-5o。目前還沒有具體的時間表。

Q:您會考慮發布一些模型權重並發表一些研究嗎?

奧特曼:是的,我們正在討論。我個人認為我們在這個問題上站錯了隊,需要提出不同的開源策略; OpenAI 內部並非所有人都認同這個觀點,而且這也不是我們目前的首要任務。

再問一個問題:

  • 我們距離在常規 Plus 計劃中提供 Operator 服務還有多遠?
  • 機器人部門的首要任務是什麼?
  • OpenAI 對 Trillium、Cerebras 等更專業的晶片/TPU 有何看法? OpenAI 關注到這一點了嗎?
  • 為了對沖 AGI 和 ASI 的未來風險,正在進行哪些投資?
  • 您最難忘的假期是什麼?

奧特曼:

  • 幾個月
  • 小規模生產出真正優秀的機器人,並從中學到經驗教訓
  • GB200 目前很難被擊敗!
  • 一個好的選擇是改善你的內在狀態-韌性、適應性、平靜、快樂等等。
  • 很難選擇!但首先想到的是:東南亞背包旅行或非洲狩獵旅行

Q:你們打算提高 Plus 系列的價格嗎?

奧特曼:實際上,我想逐漸減少它。

Q:假設現在是 2030 年,你剛剛創建了一個大多數人稱之為 AGI 的系統。它在所有基準測試中表現出色,在速度和性能方面超越了您最好的工程師和研究人員。下一步是什麼?除了「放到網站上提供服務」以外,還有其他方案嗎?

奧特曼:我認為,最重要的影響就是加速科學發現,我認為這是對改善生活品質貢獻最大的因素。

4o 影像生成,即將推出

接下來,加入了其他 OpenAI 成員的回應。

Q:你們還計劃推出 4o 影像產生器嗎?

首席產品長 Kevin Weil:是的!我認為等待是值得的。

問:太棒了!有大概的時間表嗎?

首席產品長凱文威爾 (Kevin Weil):你這是在給我惹麻煩。或許幾個月吧。

還有另一個類似的問題。

Q:我們什麼時候可以看到 ChatGPT-5?

首席產品長 Kevin Weil:o-17 micro 和 GPT-(π+1) 之後不久。

然後又出現了另一個問題:

  • 我們還能期待什麼其他類型的代理商?
  • 並且還為免費用戶提供代理,這可以加速採用…
  • DALL·E 新版有什麼更新嗎?
  • 最後一個問題,也是每個人都會問的問題......AGI 何時能夠實現?

首席產品長 Kevin Weil:

  • 將會有更多代理商:很快。我想你會很高興的。
  • 基於4o的圖像生成:再過幾個月就等不及你們用了。這很棒。
  • AGI:是的

Q:您是否計劃在推理模型中新增文件附件功能?

Srinivas Narayanan,工程副總裁:它正在開發中。未來,推理模型將能夠使用不同的工具,包括搜尋功能。

首席產品長 Kevin Weil:我迫不及待想看到推理模型能夠使用工具

問:真的嗎?當你解決了這個問題之後,一些非常有用的AI應用場景就會被打開。想像一下它能夠理解你的 500GB 工作文檔的內容。

當你準備回覆一封電子郵件時,你的電子郵件應用程式旁邊會打開一個面板,它會不斷分析與此人相關的所有信息,包括你們的關係、討論的話題、過去的工作等等。正在編輯的文檔中的一些內容'早已忘記將被標記,因為它與當前討論高度相關。我非常想要這個功能。

Srinivas Narayanan,工程副總裁:我們正在致力於增加上下文的長度。目前尚未確定日期/公告。

Q:星際之門計畫對於 OpenAI 的未來有多重要? 首席產品長凱文威爾 (Kevin Weil):非常重要。我們所看到的一切都表明,我們擁有的運算能力越強,我們就能建立更好的模型,就能創造出更有價值的產品。

我們現在在兩個維度上擴展模型——更大規模的預訓練和更多的強化學習 (RL)/「草莓」訓練——這兩者都需要計算資源。

服務數億用戶也需要運算資源!隨著我們轉向能夠持續為您工作的更聰明的代理產品,這也需要運算資源。所以你可以把星際之門想像成我們的工廠,電力/GPU 在這裡被轉化為令人驚嘆的產品。

Q:在內部,你們現在採用的是哪一種模型? o4、o5 還是 o6?與 o3 相比,這些內部模型有多聰明?

API 研究主管 Michelle Pokrass:我們已經數不清了。

Q:請允許我們在使用進階語音功能時與文字/畫布進行互動。我希望能夠與它對話並讓它迭代地修改文件。

首席產品長 Kevin Weil:是的!我們有許多相對獨立開發的優秀工具—我們的目標是盡快將這些工具交到您手中。

下一步是整合所有這些功能,以便您可以與一個模型對話,該模型同時進行搜尋和推理,並產生一個可以運行 Python 的畫布。所有工具都需要更好地協同工作。順便說一句,所有型號都需要完整的工具存取權限(O 系列型號目前無法使用所有工具),這也將實現。

Q:O系列什麼時候會支持ChatGPT的記憶功能?

API 研究主管 Michelle Pokrass:正在開發中!將我們的所有功能與 O 系列型號統一起來是我們的首要任務。

Q:4o 會有重大改進嗎?我非常喜歡自訂 GPT,如果它可以升級,或者我們可以選擇在自訂 GPT 中使用哪種型號(例如 o3 mini),那就太好了。

API 研究主管 Michelle Pokrass:是的,我們還沒完成 4o 系列!

類似文章

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *