zddeepseeker - Deepseek R1

未分類

四大模特兒的對決！評測展現 Deepseek R1 的強大功能

經過雙ddeepseeker 2025 年 6 月 1 日2025 年 6 月 1 日

這幾天，Deepseek-R1 0528 正式開源。在LiveCodeBench上，它的性能幾乎與OpenAI的o3（高）相當；在 Aider 的多語言基準測試中，它與 Claude Opus 不相上下。當它在官方網站上線時，我們快速測試了它的前端功能，發現它非常…

未分類

DeepSeek-R1-0528 更新：更深入的思考，更強的推理

經過雙ddeepseeker 2025 年 5 月 29 日2025 年 5 月 29 日

DeepSeek R1型號進行了小版本升級，目前版本為DeepSeek-R1-0528。當您進入DeepSeek網頁或App時，在對話式介面開啟「深度思考」功能即可體驗最新版本。 DeepSeek-R1-0528 模型重量已上傳至 HuggingFace 在過去的四個月中，DeepSeek-R1 經歷了…

未分類

DeepSeek已發布其原始碼，FlashMLA詳解

經過雙ddeepseeker 2025年2月24日2025年2月24日

上週，DeepSeek宣布將於下週開源五個項目：網友表示「這次，OpenAI真的來了」。剛剛，第一個開源專案來了，與推理加速相關，FlashMLA：開源專案位址：DeepSeek FlashMLA 開源兩個小時，Github已經有2.7k+顆星星： The…

未分類

Qwen2.5-max vs DeepSeek R1：深度機型對比：全面分析應用場景

經過雙ddeepseeker 2025年2月14日2025年2月14日

簡介如今，大型語言模型 (LLM) 發揮著至關重要的作用。 2025年初，隨著AI競爭愈演愈烈，阿里巴巴推出了全新的Qwen2.5-max AI模型，來自中國杭州的DeepSeek公司推出了代表LLM技術巔峰的R1模型。 Deepseek R1 是一個開源 AI 模型，吸引了…

未分類

它接近DeepSeek-R1-32B並粉碎了李飛飛的s1！加州大學柏克萊分校和其他開源新 SOTA 推理模型

經過雙ddeepseeker 2025年2月14日2025年2月14日

32B推理模型僅使用1/8的數據，與相同大小的DeepSeek-R1並列！剛剛，史丹佛大學、加州大學柏克萊分校、華盛頓大學等機構聯合發布了SOTA級別推理模型OpenThinker-32B，並且開源了高達114k的訓練資料。 OpenThinker 專案首頁：OpenThinker 擁抱臉：…

未分類

DeepSeek等大型語言模型管理神器：Cherry Studio、Chatbox、AnythingLLM，誰是你的效率加速器？

經過雙ddeepseeker 2025年2月11日2025年2月11日

許多人已經開始在本地部署並使用Deepseek Large Language Models，並使用Chatbox作為視覺化工具，本文將繼續介紹另外兩個AI Large Language Model管理和視覺化神器，並將對三者進行詳細的比較，以幫助您更有效率的使用AI Large Language Models。 2025年…

未分類

Le Chat 位居榜首，投資額達數千億美元。繼美國、中國之後，中國將成為第三個人工智慧強國？

經過雙ddeepseeker 2025年2月11日2025年2月11日

2月9日，法國總統馬克宏宣布，未來幾年法國將向人工智慧領域投資1,090億歐元（1,130億美元）。這項投資將用於在法國建設人工智慧園區，改善基礎設施，並投資當地的人工智慧新創公司。同時，法國新創公司 Mistral…

未分類

Deepseek 能實現什麼？連OpenAI都做不到？

經過雙ddeepseeker 2025年2月10日2025年2月10日

DeepSeek的真正價值被低估了！ DeepSeek-R1無疑為市場帶來了新一波的熱情。不僅相關所謂受益對像大幅上升，甚至有人開發DeepSeek相關課程及軟體，企圖從中牟取暴利。我們相信，儘管這些現像有…

未分類

全球主流AI產品著重分析和全面的使用者體驗指南（包括DeepSeek和GPT）

經過雙ddeepseeker 2025年2月10日2025年2月10日

功能定位與核心優勢分析 ChatGPT（OpenAI）－全能型人工智慧的全球標竿 ChatGPT 技術基因：基於GPT系列大模型的生成式人工智慧，以通用對話能力與邏輯推理能力為核心優勢。多語言處理：英文表現最佳，中文持續改善；但建議使用英文…

未分類

DeepSeek 1 背後的秘密 | DeepSeekMath 和 GRPO 詳細信息

經過雙ddeepseeker 2025年2月9日2025年2月9日

今天，我想分享一篇來自 DeepSeek 的文章，標題為 DeepSeekMath：在開放語言模型中突破數學推理的極限。本文介紹了 DeepSeekMath 7B，它是在 DeepSeek-Coder-Base-v1.5 7B 上基於 120B 個數學相關標記、自然語言和程式碼資料集合進行預訓練的。該模型在競技水平上取得了驚人的51.7%的成績…