Trong vài ngày qua, Deepseek-R1 0528 đã chính thức được mã nguồn mở. Trên LiveCodeBench, hiệu suất của nó gần như ngang bằng với o3 của OpenAI (cao); trong bài kiểm tra chuẩn đa ngôn ngữ của Aider, nó ngang bằng với Claude Opus. Khi được ra mắt trên trang web chính thức, chúng tôi đã nhanh chóng kiểm tra khả năng front-end của nó và thấy rằng chúng cực kỳ…
Mô hình DeepSeek R1 đã trải qua một bản nâng cấp phiên bản nhỏ, với phiên bản hiện tại là DeepSeek-R1-0528. Khi bạn vào trang web hoặc ứng dụng DeepSeek, hãy bật tính năng “Deep Thinking” trong giao diện đối thoại để trải nghiệm phiên bản mới nhất. Trọng lượng mô hình DeepSeek-R1-0528 đã được tải lên HuggingFace Trong bốn tháng qua, DeepSeek-R1 đã trải qua…
Tuần trước, DeepSeek đã thông báo rằng họ sẽ mở mã nguồn năm dự án vào tuần tới: Cư dân mạng cho biết, "Lần này, OpenAI thực sự đã ở đây." Vừa rồi, dự án nguồn mở đầu tiên đã ra mắt, liên quan đến khả năng tăng tốc suy luận, FlashMLA: Địa chỉ dự án nguồn mở: DeepSeek FlashMLA Dự án này đã mở mã nguồn trong hai giờ và Github đã có hơn 2,7 nghìn sao: Dự án…
FlashMLA đã nhanh chóng thu hút sự chú ý trong thế giới trí tuệ nhân tạo, đặc biệt là trong lĩnh vực mô hình ngôn ngữ lớn (LLM). Công cụ sáng tạo này, được phát triển bởi DeepSeek, đóng vai trò là hạt nhân giải mã được tối ưu hóa được thiết kế cho GPU Hopper—chip hiệu suất cao thường được sử dụng trong tính toán AI. FlashMLA tập trung vào việc xử lý hiệu quả các chuỗi có độ dài thay đổi, khiến nó đặc biệt phù hợp…