Bí mật đằng sau DeepSeek 1 | DeepSeekMath và chi tiết GRPO

Bí mật đằng sau DeepSeek 1 | DeepSeekMath và chi tiết GRPO

Hôm nay tôi muốn chia sẻ một bài viết từ DeepSeek, có tiêu đề DeepSeekMath: Đẩy mạnh giới hạn của lý luận toán học trong các mô hình ngôn ngữ mở. Bài viết này giới thiệu DeepSeekMath 7B, được đào tạo trước trên DeepSeek-Coder-Base-v1.5 7B dựa trên bộ sưu tập 120B mã thông báo liên quan đến toán học, ngôn ngữ tự nhiên và dữ liệu mã. Mô hình đạt được số điểm đáng kinh ngạc là 51,7% ở cấp độ cạnh tranh…

Công nghệ DeepSeek-R1 được tiết lộ: các nguyên tắc cốt lõi của bài báo được phân tích và chìa khóa để đạt được hiệu suất mô hình đột phá được tiết lộ

Hôm nay chúng tôi sẽ chia sẻ DeepSeek R1, Tiêu đề: DeepSeek-R1: Khuyến khích khả năng lý luận trong LLM thông qua Học tăng cường: Khuyến khích khả năng lý luận của LLM thông qua học tăng cường. Bài báo này giới thiệu thế hệ đầu tiên của các mô hình lý luận của DeepSeek, DeepSeek-R1-Zero và DeepSeek-R1. Mô hình DeepSeek-R1-Zero được đào tạo thông qua học tăng cường quy mô lớn (RL) mà không có điều chỉnh tinh chỉnh có giám sát (SFT) như một bước đầu tiên,…

Diễn giải bài báo DeepSeek R1 & các điểm kỹ thuật chính

1 Bối cảnh Vào dịp Tết Nguyên Đán, DeepSeek R1 một lần nữa thu hút sự chú ý rộng rãi, thậm chí bài giải thích DeepSeek V3 mà chúng tôi đã viết trước đó cũng được truyền lại và thảo luận rất nhiều. Mặc dù đã có nhiều phân tích và sao chép DeepSeek R1, nhưng ở đây chúng tôi quyết định biên soạn một số ghi chú đọc tương ứng. Chúng tôi sẽ sử dụng ba…

Mô hình giá rẻ của Google, dòng Gemini 2.0, đang tấn công: cuộc chiến giành hiệu quả về chi phí trong các mô hình lớn đang trở nên gay gắt hơn

Mô hình giá rẻ của Google, dòng Gemini 2.0, đang tấn công: cuộc chiến giành hiệu quả về chi phí trong các mô hình lớn đang trở nên gay gắt hơn

Chi phí cao khi sử dụng các mô hình AI lớn là lý do chính khiến nhiều ứng dụng AI vẫn chưa được triển khai và quảng bá. Việc lựa chọn hiệu suất cực cao có nghĩa là chi phí năng lượng tính toán rất lớn, dẫn đến chi phí sử dụng cao mà người dùng thông thường không thể chấp nhận. Cuộc cạnh tranh cho các mô hình AI lớn giống như một cuộc chiến không khói thuốc. Sau…

Gemini 2.0 thống trị bảng xếp hạng, trong khi DeepSeek V3 có giá rất đắt và một nhà vô địch mới có giá thành hợp lý đã ra đời!

Gemini 2.0 thống trị bảng xếp hạng, trong khi DeepSeek V3 có giá rất đắt và một nhà vô địch mới có giá thành hợp lý đã ra đời!

Gia đình Google Gemini 2.0 cuối cùng đã hoàn thiện! Nó thống trị các bảng xếp hạng ngay khi được phát hành. Giữa sự truy đuổi và phong tỏa của Deepseek, Qwen và o3, Google đã phát hành ba mô hình cùng một lúc vào sáng sớm nay: Gemini 2.0 Pro, Gemini 2.0 Flash và Gemini 2.0 Flash-Lite. Trên bảng xếp hạng mô hình lớn LMSYS, Gemini…

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

Điểm nổi bật AI Agent định hình lại trải nghiệm của khách hàng Jesse Zhang: Một Agent thực sự được xây dựng như thế nào? Quan điểm của chúng tôi là theo thời gian, nó sẽ ngày càng giống với một Agent dựa trên ngôn ngữ tự nhiên vì đó là cách các mô hình ngôn ngữ lớn (LLM) được đào tạo. Về lâu dài, nếu bạn có một agent siêu thông minh…

Cathie Wood: DeepSeek chỉ đang đẩy nhanh quá trình cắt giảm chi phí; cấu trúc thị trường cực kỳ tập trung tương đương với thời kỳ Đại suy thoái sẽ thay đổi

Điểm nổi bật Cạnh tranh với DeepSeek có lợi cho Hoa Kỳ Cathie Wood: Tôi nghĩ điều này cho thấy chi phí đổi mới đang giảm mạnh và xu hướng này đã bắt đầu. Ví dụ, trước DeepSeek, chi phí đào tạo trí tuệ nhân tạo đã giảm 75% mỗi năm và chi phí suy luận thậm chí còn giảm 85% xuống còn…

Google đã phát hành ba mô hình mới cùng lúc: Gemini-2.0-Pro miễn phí, có điểm số cao và xếp hạng đầu tiên, phù hợp để mã hóa và xử lý các lời nhắc phức tạp!

Câu chuyện về Gemini 2.0 đang được đẩy nhanh. Phiên bản Flash Thinking Experimental vào tháng 12 đã mang đến cho các nhà phát triển một mô hình hoạt động với độ trễ thấp và hiệu suất cao. Đầu năm nay, Flash Thinking Experimental 2.0 đã được cập nhật trong Google AI Studio để cải thiện hiệu suất hơn nữa bằng cách kết hợp tốc độ của Flash với khả năng suy luận nâng cao. Tuần trước,…

DeepSeek TOP17 Lựa chọn thay thế tốt nhất: Phân tích toàn diện (2025)

DeepSeek TOP17 Lựa chọn thay thế tốt nhất: Phân tích toàn diện (2025)

Giới thiệu Trong bối cảnh trí tuệ nhân tạo đang phát triển nhanh chóng, DeepSeek đã nổi lên như một mô hình ngôn ngữ mạnh mẽ. Phân tích toàn diện này khám phá 17 giải pháp thay thế hàng đầu cho DeepSeek, xem xét các tính năng, khả năng và trường hợp sử dụng độc đáo của chúng. Nghiên cứu của chúng tôi tập trung vào cả nền tảng quốc tế và Trung Quốc cung cấp tích hợp DeepSeek hoặc các khả năng tương tự. Phân tích các giải pháp thay thế hàng đầu 1….

Ali Qwen2.5-Max vượt qua DeepSeek-V3! Cư dân mạng: AI của Trung Quốc đang nhanh chóng thu hẹp khoảng cách

Vừa rồi, một mẫu xe trong nước khác đã được thêm vào danh sách Big Model Arena từ Ali, Qwen2.5-Max, đã vượt qua DeepSeek-V3 và xếp thứ bảy trong bảng xếp hạng chung với tổng điểm là 1332. Nó cũng đã vượt qua các mẫu xe như Claude 3.5 Sonnet và Llama 3.1 405B chỉ trong một cú đánh. Đặc biệt, nó rất xuất sắc trong việc lập trình…