DeepSeek已發布其原始程式碼，FlashMLA詳細解釋-Deepseek R1

上週，DeepSeek宣布將於下週開源五個項目：

網友們表示，“這次OpenAI真的來了。”

剛剛，第一個開源專案來了，與推理加速相關的，FlashMLA：

開源專案位址：

DeepSeek FlashMLA

開源兩小時，Github 已經有 2.7k+ star：

專案的核心功能是：

“FlashMLA 是適用於 Hopper GPU 的高效 MLA 解碼內核，針對可變長度序列服務進行了最佳化。”

翻譯過來就是:

“FlashMLA 是針對 NVIDIA Hopper 架構 GPU 優化的高效 MLA 解碼內核，專門針對處理變長序列的服務場景進行了優化。”

簡而言之：

FlashMLA 是 DeepInference 為 Hopper 架構 GPU（如 H800）設計的高效解碼核心。透過優化變長序列的多頭潛在註意力計算，在解碼階段達到了3000GB/s記憶體頻寬和580TFLOPS算力的極致性能，顯著提升大模型長上下文推理的效率。

有網友表示：

有些人已經在使用它了，他們說純工程：

本專案屬於工程優化與 將硬體效能壓縮到 限制。

該項目已準備好投入使用。

環境要求：

料斗 GPU
CUDA 12.3 及更高版本
PyTorch 2.0 以上版本

在計畫最後，官方也表示，受到了FlashAttention 2&3和NVIDIA CUTLASS計畫的啟發。

FlashAttention能夠實現快速、節省記憶體的精準注意力，並被主流大模型採用。最新的第三代版本可以將H100的使用率提高到75%。

訓練速度提升1.5-2倍，FP16下計算吞吐高達740 TFLOPs/s，達到理論最大吞吐率75%，更充分利用運算資源，而先前僅為35%。

FlashMLA 不僅透過硬體級優化實現了效能的飛躍，更為AI推理的工程實踐提供了開箱即用的解決方案，成為加速大模型推理的關鍵技術突破。

第一天就有這麼重大的揭露。

我期待接下來四天的開源內容！

正如網友所說：

鯨魚正在掀起波浪！

DeepSeek 太棒了！

未分類

DeepSeek R1論文解讀&關鍵技術點

經過雙ddeepseeker 2025年2月9日2025年2月9日

1 背景春節期間，DeepSeek R1再次引發了廣泛關注，就連我們先前撰寫的DeepSeek V3解讀文章也被重新轉發並引發了大量討論。雖然對DeepSeek R1已經有了很多的分析和重述，但我們還是決定在這裡寫一些對應的閱讀筆記。我們將使用三個…

未分類

論文-DeepSeek-R1：透過強化學習激勵法學碩士中的推理能力

經過deepseeker 2025年1月29日2025年1月29日

摘要本文介紹了DeepSeek的第一代推理模型：DeepSeek-R1-Zero和DeepSeek-R1。 DeepSeek-R1-Zero 透過大規模強化學習（RL）訓練，無需監督微調（SFT），展現出卓越的推理能力。透過 RL，它自然而然地發展出強大的推理行為。但它面臨可讀性差、語言混合等挑戰。為了解決這些問題並提高推理性能，我們開發了DeepSeek-R1，…

未分類

Deepseek 能實現什麼？連OpenAI都做不到？

經過雙ddeepseeker 2025年2月10日2025年2月10日

DeepSeek的真正價值被低估了！ DeepSeek-R1無疑為市場帶來了新一波的熱情。不僅相關所謂受益對像大幅上升，甚至有人開發DeepSeek相關課程及軟體，企圖從中牟取暴利。我們相信，儘管這些現像有…

未分類

雙子座2.0霸榜，DeepSeek V3降價驚艷，新性價比冠軍誕生！

經過雙ddeepseeker 2025年2月8日2025年2月8日

Google Gemini 2.0 家族終於完整了！一推出便霸佔各大排行榜。在Deepseek、Qwen、o3的追擊和封鎖中，Google今天凌晨一口氣發布了三款機型：Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite。在大型模型 LMSYS 排名中，Gemini…

未分類

全球主流AI產品著重分析和全面的使用者體驗指南（包括DeepSeek和GPT）

經過雙ddeepseeker 2025年2月10日2025年2月10日

功能定位與核心優勢分析 ChatGPT（OpenAI）－全能型人工智慧的全球標竿 ChatGPT 技術基因：基於GPT系列大模型的生成式人工智慧，以通用對話能力與邏輯推理能力為核心優勢。多語言處理：英文表現最佳，中文持續改善；但建議使用英文…

未分類

DeepSeek 已經做到了！ OpenAI承認閉源錯誤，領先優勢變小

經過雙ddeepseeker 2025年2月2日2025年2月2日

OpenAI發布o3-mini模型後，其CEO Sam Altman、首席研究長Mark Chen、首席產品長Kevin Weil；工程副總裁Srinivas Narayanan、API研究主管Michelle Pokrass、研究主管任洪宇在全球最大的綜合論壇之一reddit上進行了線上技術問答。主要議題…

DeepSeek已發布其原始碼，FlashMLA詳解