Blog

  • Cuộc so tài của bốn mẫu máy hàng đầu! Đánh giá cho thấy sức mạnh của Deepseek R1
    Trong vài ngày qua, Deepseek-R1 0528 đã chính thức được mã nguồn mở. Trên LiveCodeBench, hiệu suất của nó gần như ngang bằng với o3 của OpenAI (cao); trong bài kiểm tra chuẩn đa ngôn ngữ của Aider, nó ngang bằng với Claude Opus. Khi được ra mắt trên trang web chính thức, chúng tôi đã nhanh chóng kiểm tra khả năng front-end của nó và thấy rằng chúng cực kỳ…
  • Bản cập nhật DeepSeek-R1-0528: Suy nghĩ sâu sắc hơn, lý luận mạnh mẽ hơn
    Mô hình DeepSeek R1 đã trải qua một bản nâng cấp phiên bản nhỏ, với phiên bản hiện tại là DeepSeek-R1-0528. Khi bạn vào trang web hoặc ứng dụng DeepSeek, hãy bật tính năng “Deep Thinking” trong giao diện đối thoại để trải nghiệm phiên bản mới nhất. Trọng lượng mô hình DeepSeek-R1-0528 đã được tải lên HuggingFace Trong bốn tháng qua, DeepSeek-R1 đã trải qua…
  • DeepSeek đã phát hành mã nguồn, giải thích chi tiết về FlashMLA
    Tuần trước, DeepSeek đã thông báo rằng họ sẽ mở mã nguồn năm dự án vào tuần tới: Cư dân mạng cho biết, "Lần này, OpenAI thực sự đã ở đây." Vừa rồi, dự án nguồn mở đầu tiên đã ra mắt, liên quan đến khả năng tăng tốc suy luận, FlashMLA: Địa chỉ dự án nguồn mở: DeepSeek FlashMLA Dự án này đã mở mã nguồn trong hai giờ và Github đã có hơn 2,7 nghìn sao: Dự án…
  • FlashMLA là gì? Hướng dẫn toàn diện về tác động của nó đối với AI Decoding Kernels
    FlashMLA đã nhanh chóng thu hút sự chú ý trong thế giới trí tuệ nhân tạo, đặc biệt là trong lĩnh vực mô hình ngôn ngữ lớn (LLM). Công cụ sáng tạo này, được phát triển bởi DeepSeek, đóng vai trò là hạt nhân giải mã được tối ưu hóa được thiết kế cho GPU Hopper—chip hiệu suất cao thường được sử dụng trong tính toán AI. FlashMLA tập trung vào việc xử lý hiệu quả các chuỗi có độ dài thay đổi, khiến nó đặc biệt phù hợp…

Tạo tài khoản miễn phí của bạn ngay hôm nay!