DeepSeek R1 線上(免費|無需登入)
革命性的高階推理開源人工智慧模型超越 Openai o1

DeepSeek R1 免費線上聊天
DeepSeek R1 WEBGPU 在線
透過 WebGPU 加速在您的瀏覽器中本地運行的下一代推理模型。
您即將載入 DeepSeek-R1-Distill-Qwen-1.5B,這是針對瀏覽器內推理最佳化的 1.5B 參數推理 LLM。一切都透過 🤗 Transformers.js 和 ONNX Runtime Web 在您的瀏覽器中完全運行,這意味著不會將任何資料發送到伺服器。一旦加載,它甚至可以離線使用。






DeepSeek R1 功能齊全
建築學
建立於 MoE(混合專家) 具有 37B 活動參數/671B 總參數和 128K 上下文長度。實現高階強化學習,實現自我驗證、多步驟反思、人機協同推理的能力。
表現
數學: MATH-500 上的準確率為 97.3%
編碼: 超越 Codeforces 參賽者的 96.3%
一般推理: AIME 2024 (SOTA) 通過率為 79.8%
這些結果定位 DeepSeek R1 躋身全球表現最出色的人工智慧模型之列。
部署
API:與 OpenAI 相容的端點($0.14/百萬個代幣)
開源:MIT 許可的重量,1.5B-70B 精煉變體,用於商業用途。
尋找 GitHub 儲存庫
模型生態系統
變體:基礎版(R1-Zero)、增強版(R1)、6 個輕量級精簡模型
專業化:針對複雜問題解決、多語言理解和生產級程式碼產生進行了最佳化
路線圖
在開源社群協作的推動下,多模式支援、對話增強和分散式推理優化不斷升級。
開源
世界首創 純 RL 發展的推理模型 開源實作的32B輕量級版本在 90% 成本更低
思想鏈 視覺化 能力,解決人工智慧「黑盒子」挑戰

DeepSeek R1 在線是什麼?
DeepSeek R1 代表了人工智慧的突破性進步,在推理、數學和編碼任務中提供了最先進的性能。此創新模型展示了與領先的專有解決方案相當的能力,同時保持了完全的開源可訪問性。
技術架構與能力
模型架構
DeepSeek R1 採用先進的 MoE(專家混合)架構,具有以下特點:
- 37B 激活參數
- 總參數 671B
- 128K 上下文長度支持
DeepSeek R1框架融合了先進的強化學習技術,為AI推理能力樹立了新的標竿。
性能基準
DeepSeek R1在各項基準測試中都取得了令人矚目的成就:
- MATH-500: 97.3% 準確率
- AIME 2024:79.8% 通過率
- Codeforces:96.3% 百分位排名
這些結果定位 DeepSeek R1 躋身全球表現最出色的人工智慧模型之列。


Deepseek 線上模型變體與提煉
可用版本
DeepSeek R1 有多種型號:
- DeepSeek R1-Zero:基本型號
- DeepSeek R1: 增強版
- 多個精簡版本,參數範圍從 1.5B 到 70B
效能最佳化
該模型展現了以下方面的卓越能力:
解決複雜問題
數學推理
程式碼生成
自然語言理解
DeepSeek-R1-Distill 模型(線上下載)
模型 | 基礎模型 | 下載 |
---|---|---|
DeepSeek-R1-蒸餾-Qwen-1.5B | Qwen2.5-數學-1.5B | 🤗 HuggingFace |
DeepSeek-R1-蒸餾-Qwen-7B | Qwen2.5-Math-7B | 🤗 HuggingFace |
DeepSeek-R1-蒸餾-駱駝-8B | 駱駝-3.1-8B | 🤗 HuggingFace |
DeepSeek-R1-蒸餾-Qwen-14B | Qwen2.5-14B | 🤗 HuggingFace |
DeepSeek-R1-蒸餾-Qwen-32B | Qwen2.5-32B | 🤗 HuggingFace |
DeepSeek-R1-蒸餾-駱駝-70B | Llama-3.3-70B-指導 | 🤗 HuggingFace |
您可以找到有關 DeepSeek-R1-Distill 型號的更多信息 這裡
Deepseek R1 的定價
定價詳情號
模型(1) | 上下文長度 | MAX COT 代幣(2) | 最大輸出代幣(3) | 100 萬個代幣 投入價格 (緩存命中) (4) | 100 萬個代幣 投入價格 (緩存未命中) | 100 萬個代幣 產出價格 |
---|---|---|---|---|---|---|
deepseek-聊天 | 64千 | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-推理者 | 64千 | 32千 | 8K | $0.14 | $0.55 | $2.19 (6) |
價格比較:DeepSeek R1 與 OpenAI o1
1. DeepSeek R1 定價
DeepSeek R1 提供了極具競爭力的定價結構,使其比 OpenAI o1 便宜得多:
- 輸入令牌(緩存命中): 每百萬代幣 $0.14
- 輸入令牌(緩存未命中): 每百萬代幣 $0.55
- 輸出標記: 每百萬代幣 $2.19
智慧型快取系統減少重複查詢的成本,提供高達 90% 節省 緩存命中數25。
2. OpenAI o1 定價
相比之下,OpenAI o1 的成本要高得多:
- 輸入標記: 每百萬代幣 $15
- 輸出標記: 每百萬代幣 $60
這使得 OpenAI o1 90-95% 更貴 比DeepSeek R1具有相同的用途112。
3. 成本效益
DeepSeek R1 的定價為 90-95% 下部 比 OpenAI o1 更好,提供了一種不影響效能的經濟高效的替代方案。例如:
- 100 萬個輸入令牌:
- DeepSeek R1: 0.14(快取命中)或0.14(c一個c時長埃你好噸)或者0.55(緩存未命中)
- OpenAI o1:$15
- 100 萬個輸出代幣:
- DeepSeek R1: $2.19
- OpenAI o1:$60
這種經濟實惠的價格使 DeepSeek R1 成為開發人員和企業的理想選擇1512。
4. 額外福利
- 開源存取:DeepSeek R1 在 MIT 許可下可用,允許自由使用、修改和商業化512。
- API 靈活性:DeepSeek R1 的 API 支援諸如思路鏈推理和長上下文處理(最多 128K 個標記)212 等高階功能。


關於 Deepseek R1 和 Deepseek 線上的部落格和新聞
-
DeepSeek已發布其原始碼,FlashMLA詳解
-
什麼是 FlashMLA?對 AI 解碼內核影響的綜合指南
-
Qwen2.5-max vs DeepSeek R1:深度機型對比:全面分析應用場景
-
它接近DeepSeek-R1-32B並粉碎了李飛飛的s1!加州大學柏克萊分校和其他開源新 SOTA 推理模型
1,DeepSeek-R1 的架構有何獨特之處?
- DeepSeek R1 採用 教育部製度 具有 37B 活動參數/671B 總參數和 128K 上下文支持,透過純強化學習進行最佳化,無需監督微調。
2. DeepSeek R1 與 OpenAI o1 的定價相比如何?
- DeepSeek R1 成本 90-95% 更少:0.14/百萬輸入令牌vsOpenAIo1的0.14/米二我o寧頁你特o鉀埃ns五s操作埃n一個我o1′s15、具有等效推理能力。
3. 我可以在本地部署 DeepSeek R1 嗎?
- 是的,DeepSeek R1 支援透過 vLLM/SGLang 進行本地部署,並為資源受限的環境提供 6 個提煉模型(1.5B-70B 參數)。
4. 哪些基準證明了 DeepSeek R1 的效能?
- 在 MATH-500(97.3%)、Codeforces(96.3% 百分位數)和 AIME 2024(79.8%)中取得 SOTA,表現優於大多數商業模型。
5. DeepSeek R1 是開源的嗎?
- 是的,DeepSeek R1 已獲得 MIT 許可,可提供完整模型權重 GitHub,允許商業使用和修改。
6. 哪些認知能力可以區分 DeepSeek R1?
- 特徵 自我驗證 和 多步驟反射,透過可見的思路鏈推理解決複雜問題。
7. 哪些產業從DeepSeek R1中受益最多?
- 非常適合人工智慧研究、企業程式碼生成、數學建模和需要高級推理的多語言 NLP 應用。
8. DeepSeek R1 如何處理 API 整合?
- 提供與 OpenAI 相容的 API 端點,具有 128K 上下文支援和智慧型快取(快取命中率為 $0.14/百萬個令牌)。
9. DeepSeek R1 實施了哪些安全措施?
- 內建重複控制(溫度 0.5-0.7)和對齊機制可防止 RL 訓練模型中常見的無限循環。
10. 在哪裡可以找到 DeepSeek R1 的技術文件?
透過訪問 DeepSeek R1 技術論文 和 API 文件.