zddeepseeker - Deepseek R1 - 第 2 頁，共 3 頁

未分類

DeepSeek-R1技術揭秘：論文核心原理解析，揭秘模型效能突破關鍵

經過雙ddeepseeker 2025年2月9日2025年2月9日

今天我們來分享DeepSeek R1，標題：DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning：透過強化學習激勵LLM的推理能力。本文介紹了DeepSeek的第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。 DeepSeek-R1-Zero 模型透過大規模強化學習 (RL) 進行訓練，無需監督微調 (SFT) 作為初始步驟，…

未分類

DeepSeek R1論文解讀&關鍵技術點

經過雙ddeepseeker 2025年2月9日2025年2月9日

1 背景春節期間，DeepSeek R1再次引發了廣泛關注，就連我們先前撰寫的DeepSeek V3解讀文章也被重新轉發並引發了大量討論。雖然對DeepSeek R1已經有了很多的分析和重述，但我們還是決定在這裡寫一些對應的閱讀筆記。我們將使用三個…

Google低價機型Gemini 2.0系列來襲：大機型性價比之爭愈演愈烈

未分類

Google低價機型Gemini 2.0系列來襲：大機型性價比之爭愈演愈烈

經過雙ddeepseeker 2025年2月8日2025年2月8日

使用大型AI模型的成本過高，是許多AI應用尚未實現和推廣的一個重要原因。選擇極限效能意味著巨大的算力成本，這導致高昂的使用成本是一般使用者無法接受的。大型AI模型的競爭就像一場沒有硝煙的戰爭。後…

雙子座2.0霸榜，DeepSeek V3降價驚艷，新性價比冠軍誕生！

未分類

雙子座2.0霸榜，DeepSeek V3降價驚艷，新性價比冠軍誕生！

經過雙ddeepseeker 2025年2月8日2025年2月8日

Google Gemini 2.0 家族終於完整了！一推出便霸佔各大排行榜。在Deepseek、Qwen、o3的追擊和封鎖中，Google今天凌晨一口氣發布了三款機型：Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite。在大型模型 LMSYS 排名中，Gemini…

a16z對話27歲CEO：AI Agent槓桿效應巨大，長期定價將與人力成本掛鉤

未分類

a16z對話27歲CEO：AI Agent槓桿效應巨大，長期定價將與人力成本掛鉤

經過雙ddeepseeker 2025年2月8日2025年2月8日

亮點 AI Agent 重塑客戶體驗 Jesse Zhang：Agent 究竟是如何建構的？我們認為，隨著時間的推移，它將變得越來越像一個基於自然語言的代理，因為這就是大型語言模型 (LLM) 的訓練方式。從長遠來看，如果你有一個超級智慧代理...

未分類

Cathie Wood：DeepSeek只是加速了降低成本的進程；堪比大蕭條時期的極度集中的市場結構將會改變

經過雙ddeepseeker 2025年2月8日2025年2月8日

亮點與 DeepSeek 的競爭對美國有利 Cathie Wood：我認為這表明創新成本正在大幅下降，而且這種趨勢已經開始。例如，在DeepSeek之前，訓練人工智慧的成本每年下降了75%，推理的成本甚至下降了85%至......

未分類

Google一次發布三個新模型：Gemini-2.0-Pro免費，成績優異排名第一，適合編碼和處理複雜的提示！

經過雙ddeepseeker 2025年2月8日2025年2月8日

雙子座2.0的故事正在加速展開。 12月份的Flash Thinking Experimental版本為開發者帶來了低延遲、高效能的工作模型。今年早些時候，2.0 Flash Thinking Experimental 在 Google AI Studio 中進行了更新，透過結合 Flash 的速度和增強的推理能力，進一步提高效能。上個星期，…

未分類

阿里Qwen2.5-Max超越DeepSeek-V3！網友：中國人工智慧正快速縮小差距

經過雙ddeepseeker 2025年2月5日2025年2月5日

剛剛，阿里大模型競技場榜單中又新增一款國產機型Qwen2.5-Max，以總成績1332分超越DeepSeek-V3，位居綜合排名第七，還一舉超越了Claude 3.5 Sonnet、Llama 3.1 405B等機型。尤其是在程式設計方面它表現出色…

突發新聞！ DeepSeek研究人員線上揭露：R1訓練僅需兩至三週，春節期間觀察到R1零度強勢進化

未分類

突發新聞！ DeepSeek研究人員線上揭露：R1訓練僅需兩至三週，春節期間觀察到R1零度強勢進化

經過雙ddeepseeker 2025年2月4日2025年2月4日

突發新聞！ DeepSeek研究員在線透露：R1訓練僅需兩到三週，春節期間觀察到R1 zero的強大進化剛剛，我們注意到DeepSeek研究員Daya Guo回應了網友關於DeepSeek R1以及公司計劃的問題繼續前進。我們只能說…

DeepSeek R1在創意寫作測驗中獲得了第一名，而o3 mini甚至比o1 mini還差！

未分類

DeepSeek R1在創意寫作測驗中獲得了第一名，而o3 mini甚至比o1 mini還差！

經過雙ddeepseeker 2025年2月3日2025年2月3日

DeepSeek R1在創意短篇小說寫作基準測試中奪冠，成功超越上屆霸主Claude 3.5 Sonnet！基準測試研究員 Lech Mazur 設計的基準測試不是一般的寫作比賽。每個 AI 模型都需要完成 500 個短篇故事，並且每個故事都必須巧妙地融入…