Cuộc so tài của bốn mẫu máy hàng đầu! Đánh giá cho thấy sức mạnh của Deepseek R1
Trong vài ngày qua, Deepseek-R1 0528 đã chính thức được mã nguồn mở. Trên LiveCodeBench, hiệu suất của nó gần như ngang bằng với o3 của OpenAI (cao); trong bài kiểm tra chuẩn đa ngôn ngữ của Aider, nó ngang bằng với Claude Opus. Khi được ra mắt trên trang web chính thức, chúng tôi đã nhanh chóng kiểm tra khả năng front-end của nó và thấy rằng chúng cực kỳ…