部落格

  • 四大模特兒的對決!評測展現 Deepseek R1 的強大功能
    這幾天,Deepseek-R1 0528 正式開源。在LiveCodeBench上,它的性能幾乎與OpenAI的o3(高)相當;在 Aider 的多語言基準測試中,它與 Claude Opus 不相上下。當它在官方網站上線時,我們快速測試了它的前端功能,發現它非常…
  • DeepSeek-R1-0528 更新:更深入的思考,更強的推理
    DeepSeek R1型號進行了小版本升級,目前版本為DeepSeek-R1-0528。當您進入DeepSeek網頁或App時,在對話式介面開啟「深度思考」功能即可體驗最新版本。 DeepSeek-R1-0528 模型重量已上傳至 HuggingFace 在過去的四個月中,DeepSeek-R1 經歷了…
  • DeepSeek已發布其原始碼,FlashMLA詳解
    上週,DeepSeek宣布將於下週開源五個項目:網友表示「這次,OpenAI真的來了」。剛剛,第一個開源專案來了,與推理加速相關,FlashMLA: 開源專案位址:DeepSeek FlashMLA 開源兩個小時,Github已經有2.7k+顆星星: The…
  • 什麼是 FlashMLA?對 AI 解碼內核影響的綜合指南
    FlashMLA 迅速引起了人工智慧領域的關注,特別是在大型語言模型(LLM)領域。這款由 DeepSeek 開發的創新工具是專為 Hopper GPU(常用於 AI 運算的高效能晶片)設計的最佳化解碼核心。 FlashMLA 專注於高效處理可變長度序列,使其特別適合…

今天就建立您的免費帳戶!