zddeepseeker - Tìm kiếm sâu R1

Cuộc so tài của bốn mẫu máy hàng đầu! Đánh giá cho thấy sức mạnh của Deepseek R1

Quazddeepseeker Tháng 6 1, 2025Tháng 6 1, 2025

Trong vài ngày qua, Deepseek-R1 0528 đã chính thức được mã nguồn mở. Trên LiveCodeBench, hiệu suất của nó gần như ngang bằng với o3 của OpenAI (cao); trong bài kiểm tra chuẩn đa ngôn ngữ của Aider, nó ngang bằng với Claude Opus. Khi được ra mắt trên trang web chính thức, chúng tôi đã nhanh chóng kiểm tra khả năng front-end của nó và thấy rằng chúng cực kỳ…

Chưa phân loại

Bản cập nhật DeepSeek-R1-0528: Suy nghĩ sâu sắc hơn, lý luận mạnh mẽ hơn

Quazddeepseeker Tháng 5 29, 2025Tháng 5 29, 2025

Mô hình DeepSeek R1 đã trải qua một bản nâng cấp phiên bản nhỏ, với phiên bản hiện tại là DeepSeek-R1-0528. Khi bạn vào trang web hoặc ứng dụng DeepSeek, hãy bật tính năng “Deep Thinking” trong giao diện đối thoại để trải nghiệm phiên bản mới nhất. Trọng lượng mô hình DeepSeek-R1-0528 đã được tải lên HuggingFace Trong bốn tháng qua, DeepSeek-R1 đã trải qua…

Chưa phân loại

DeepSeek đã phát hành mã nguồn, giải thích chi tiết về FlashMLA

Quazddeepseeker Tháng 2 24, 2025Tháng 2 24, 2025

Tuần trước, DeepSeek đã thông báo rằng họ sẽ mở mã nguồn năm dự án vào tuần tới: Cư dân mạng cho biết, "Lần này, OpenAI thực sự đã ở đây." Vừa rồi, dự án nguồn mở đầu tiên đã ra mắt, liên quan đến khả năng tăng tốc suy luận, FlashMLA: Địa chỉ dự án nguồn mở: DeepSeek FlashMLA Dự án này đã mở mã nguồn trong hai giờ và Github đã có hơn 2,7 nghìn sao: Dự án…

Chưa phân loại

Qwen2.5-max so với DeepSeek R1: So sánh sâu sắc các mô hình: phân tích đầy đủ các tình huống ứng dụng

Quazddeepseeker Tháng 2 14, 2025Tháng 2 14, 2025

Giới thiệu Ngày nay, các mô hình ngôn ngữ lớn (LLM) đóng vai trò quan trọng. Vào đầu năm 2025, khi cuộc cạnh tranh về AI ngày càng gay gắt, Alibaba đã ra mắt mô hình AI Qwen2.5-max mới và DeepSeek, một công ty đến từ Hàng Châu, Trung Quốc, đã ra mắt mô hình R1, đại diện cho đỉnh cao của công nghệ LLM. Deepseek R1 là một mô hình AI nguồn mở đã thu hút…

Chưa phân loại

Nó gần với DeepSeek-R1-32B và đánh bại s1! của Fei-Fei Li UC Berkeley và các mô hình suy luận SOTA mới nguồn mở khác

Quazddeepseeker Tháng 2 14, 2025Tháng 2 14, 2025

Mô hình suy luận 32B chỉ sử dụng 1/8 dữ liệu và được liên kết với DeepSeek-R1 có cùng kích thước! Ngay bây giờ, các tổ chức như Stanford, UC Berkeley và Đại học Washington đã cùng nhau phát hành một mô hình suy luận cấp SOTA, OpenThinker-32B và cũng đã mở nguồn lên đến 114k dữ liệu đào tạo. Trang chủ của Dự án OpenThinker: OpenThinker Hugging Face:…

Chưa phân loại

Các hiện vật quản lý Mô hình ngôn ngữ lớn như DeepSeek: Cherry Studio, Chatbox, AnythingLLM, ai là công cụ tăng tốc hiệu quả của bạn?

Quazddeepseeker Tháng 2 11, 2025Tháng 2 11, 2025

Nhiều người đã bắt đầu triển khai và sử dụng Deepseek Large Language Models cục bộ, sử dụng Chatbox làm công cụ trực quan hóa. Bài viết này sẽ tiếp tục giới thiệu hai hiện vật quản lý và trực quan hóa AI Large Language Model khác và sẽ so sánh chi tiết ba hiện vật này để giúp bạn sử dụng AI Large Language Models hiệu quả hơn. Vào năm 2025,…

Chưa phân loại

Le Chat đứng đầu bảng xếp hạng, với khoản đầu tư lên tới hàng trăm tỷ đô la. Sau Hoa Kỳ và Trung Quốc, liệu đây có phải là cường quốc AI thứ ba không?

Quazddeepseeker Tháng 2 11, 2025Tháng 2 11, 2025

Vào ngày 9 tháng 2, Tổng thống Pháp Emmanuel Macron tuyên bố rằng Pháp sẽ đầu tư 109 tỷ euro (113 tỷ đô la Mỹ) vào lĩnh vực AI trong vài năm tới. Khoản đầu tư này sẽ được sử dụng để xây dựng một công viên AI tại Pháp, cải thiện cơ sở hạ tầng và đầu tư vào các công ty khởi nghiệp AI địa phương. Trong khi đó, Mistral, một công ty khởi nghiệp của Pháp,…

Chưa phân loại

Deepseek có thể đạt được điều gì? Ngay cả OpenAI cũng không làm được?

Quazddeepseeker Tháng 2 10, 2025Tháng 2 10, 2025

Giá trị thực sự của DeepSeek bị đánh giá thấp! DeepSeek-R1 chắc chắn đã mang đến một làn sóng nhiệt tình mới cho thị trường. Không chỉ các mục tiêu được gọi là người thụ hưởng có liên quan đang tăng mạnh, mà một số người thậm chí còn phát triển các khóa học và phần mềm liên quan đến DeepSeek để kiếm tiền từ nó. Chúng tôi tin rằng mặc dù những hiện tượng này có…

Chưa phân loại

Các sản phẩm AI chính thống trên thế giới tập trung vào phân tích và hướng dẫn trải nghiệm người dùng toàn diện (bao gồm DeepSeek và GPT)

Quazddeepseeker Tháng 2 10, 2025Tháng 2 10, 2025

Phân tích vị trí chức năng và lợi thế cốt lõi ChatGPT (OpenAI) – chuẩn mực toàn cầu cho những người toàn diện ChatGPT Các gen kỹ thuật: AI tạo ra dựa trên chuỗi GPT của các mô hình lớn, với các kỹ năng giao tiếp chung và lý luận logic là những lợi thế cốt lõi của nó. Xử lý đa ngôn ngữ: hoạt động tốt nhất bằng tiếng Anh, với sự cải thiện liên tục bằng tiếng Trung; nhưng chúng tôi khuyên bạn nên sử dụng tiếng Anh để…

Chưa phân loại

Bí mật đằng sau DeepSeek 1 | DeepSeekMath và chi tiết GRPO

Quazddeepseeker Tháng 2 9, 2025Tháng 2 9, 2025

Hôm nay tôi muốn chia sẻ một bài viết từ DeepSeek, có tiêu đề DeepSeekMath: Đẩy mạnh giới hạn của lý luận toán học trong các mô hình ngôn ngữ mở. Bài viết này giới thiệu DeepSeekMath 7B, được đào tạo trước trên DeepSeek-Coder-Base-v1.5 7B dựa trên bộ sưu tập 120B mã thông báo liên quan đến toán học, ngôn ngữ tự nhiên và dữ liệu mã. Mô hình đạt được số điểm đáng kinh ngạc là 51,7% ở cấp độ cạnh tranh…