zddeepseeker - Deepseek R1 - Trang 2 trên 3

Chưa phân loại

Công nghệ DeepSeek-R1 được tiết lộ: các nguyên tắc cốt lõi của bài báo được phân tích và chìa khóa để đạt được hiệu suất mô hình đột phá được tiết lộ

Quazddeepseeker Tháng 2 9, 2025Tháng 2 9, 2025

Hôm nay chúng tôi sẽ chia sẻ DeepSeek R1, Tiêu đề: DeepSeek-R1: Khuyến khích khả năng lý luận trong LLM thông qua Học tăng cường: Khuyến khích khả năng lý luận của LLM thông qua học tăng cường. Bài báo này giới thiệu thế hệ đầu tiên của các mô hình lý luận của DeepSeek, DeepSeek-R1-Zero và DeepSeek-R1. Mô hình DeepSeek-R1-Zero được đào tạo thông qua học tăng cường quy mô lớn (RL) mà không có điều chỉnh tinh chỉnh có giám sát (SFT) như một bước đầu tiên,…

Chưa phân loại

Diễn giải bài báo DeepSeek R1 & các điểm kỹ thuật chính

Quazddeepseeker Tháng 2 9, 2025Tháng 2 9, 2025

1 Bối cảnh Vào dịp Tết Nguyên Đán, DeepSeek R1 một lần nữa thu hút sự chú ý rộng rãi, thậm chí bài giải thích DeepSeek V3 mà chúng tôi đã viết trước đó cũng được truyền lại và thảo luận rất nhiều. Mặc dù đã có nhiều phân tích và sao chép DeepSeek R1, nhưng ở đây chúng tôi quyết định biên soạn một số ghi chú đọc tương ứng. Chúng tôi sẽ sử dụng ba…

Mô hình giá rẻ của Google, dòng Gemini 2.0, đang tấn công: cuộc chiến giành hiệu quả về chi phí trong các mô hình lớn đang trở nên gay gắt hơn

Chưa phân loại

Mô hình giá rẻ của Google, dòng Gemini 2.0, đang tấn công: cuộc chiến giành hiệu quả về chi phí trong các mô hình lớn đang trở nên gay gắt hơn

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Chi phí cao khi sử dụng các mô hình AI lớn là lý do chính khiến nhiều ứng dụng AI vẫn chưa được triển khai và quảng bá. Việc lựa chọn hiệu suất cực cao có nghĩa là chi phí năng lượng tính toán rất lớn, dẫn đến chi phí sử dụng cao mà người dùng thông thường không thể chấp nhận. Cuộc cạnh tranh cho các mô hình AI lớn giống như một cuộc chiến không khói thuốc. Sau…

Gemini 2.0 thống trị bảng xếp hạng, trong khi DeepSeek V3 có giá rất đắt và một nhà vô địch mới có giá thành hợp lý đã ra đời!

Chưa phân loại

Gemini 2.0 thống trị bảng xếp hạng, trong khi DeepSeek V3 có giá rất đắt và một nhà vô địch mới có giá thành hợp lý đã ra đời!

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Gia đình Google Gemini 2.0 cuối cùng đã hoàn thiện! Nó thống trị các bảng xếp hạng ngay khi được phát hành. Giữa sự truy đuổi và phong tỏa của Deepseek, Qwen và o3, Google đã phát hành ba mô hình cùng một lúc vào sáng sớm nay: Gemini 2.0 Pro, Gemini 2.0 Flash và Gemini 2.0 Flash-Lite. Trên bảng xếp hạng mô hình lớn LMSYS, Gemini…

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

Chưa phân loại

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Điểm nổi bật AI Agent định hình lại trải nghiệm của khách hàng Jesse Zhang: Một Agent thực sự được xây dựng như thế nào? Quan điểm của chúng tôi là theo thời gian, nó sẽ ngày càng giống với một Agent dựa trên ngôn ngữ tự nhiên vì đó là cách các mô hình ngôn ngữ lớn (LLM) được đào tạo. Về lâu dài, nếu bạn có một agent siêu thông minh…

Chưa phân loại

Cathie Wood: DeepSeek chỉ đang đẩy nhanh quá trình cắt giảm chi phí; cấu trúc thị trường cực kỳ tập trung tương đương với thời kỳ Đại suy thoái sẽ thay đổi

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Điểm nổi bật Cạnh tranh với DeepSeek có lợi cho Hoa Kỳ Cathie Wood: Tôi nghĩ điều này cho thấy chi phí đổi mới đang giảm mạnh và xu hướng này đã bắt đầu. Ví dụ, trước DeepSeek, chi phí đào tạo trí tuệ nhân tạo đã giảm 75% mỗi năm và chi phí suy luận thậm chí còn giảm 85% xuống còn…

Chưa phân loại

Google đã phát hành ba mô hình mới cùng lúc: Gemini-2.0-Pro miễn phí, có điểm số cao và xếp hạng đầu tiên, phù hợp để mã hóa và xử lý các lời nhắc phức tạp!

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Câu chuyện về Gemini 2.0 đang được đẩy nhanh. Phiên bản Flash Thinking Experimental vào tháng 12 đã mang đến cho các nhà phát triển một mô hình hoạt động với độ trễ thấp và hiệu suất cao. Đầu năm nay, Flash Thinking Experimental 2.0 đã được cập nhật trong Google AI Studio để cải thiện hiệu suất hơn nữa bằng cách kết hợp tốc độ của Flash với khả năng suy luận nâng cao. Tuần trước,…

Chưa phân loại

Ali Qwen2.5-Max vượt qua DeepSeek-V3! Cư dân mạng: AI của Trung Quốc đang nhanh chóng thu hẹp khoảng cách

Quazddeepseeker Tháng 2 5, 2025Tháng 2 5, 2025

Vừa rồi, một mẫu xe trong nước khác đã được thêm vào danh sách Big Model Arena từ Ali, Qwen2.5-Max, đã vượt qua DeepSeek-V3 và xếp thứ bảy trong bảng xếp hạng chung với tổng điểm là 1332. Nó cũng đã vượt qua các mẫu xe như Claude 3.5 Sonnet và Llama 3.1 405B chỉ trong một cú đánh. Đặc biệt, nó rất xuất sắc trong việc lập trình…

Tin tức nóng hổi! Nhà nghiên cứu DeepSeek tiết lộ trực tuyến: Quá trình đào tạo R1 chỉ mất hai đến ba tuần và sự tiến hóa mạnh mẽ của R1 zero đã được quan sát thấy trong kỳ nghỉ Tết Nguyên đán của Trung Quốc

Chưa phân loại

Tin tức nóng hổi! Nhà nghiên cứu DeepSeek tiết lộ trực tuyến: Quá trình đào tạo R1 chỉ mất hai đến ba tuần và sự tiến hóa mạnh mẽ của R1 zero đã được quan sát thấy trong kỳ nghỉ Tết Nguyên đán của Trung Quốc

Quazddeepseeker Tháng 2 4, 2025Tháng 2 4, 2025

Tin tức nóng hổi! Nhà nghiên cứu DeepSeek tiết lộ trực tuyến: Quá trình đào tạo R1 chỉ mất hai đến ba tuần và sự tiến hóa mạnh mẽ của R1 zero đã được quan sát thấy trong kỳ nghỉ Tết Nguyên đán Vừa rồi, chúng tôi nhận thấy rằng nhà nghiên cứu DeepSeek Daya Guo đã trả lời các câu hỏi của cư dân mạng về DeepSeek R1 và các kế hoạch sắp tới của công ty. Chúng tôi chỉ có thể nói rằng…

DeepSeek R1 đứng đầu trong bài kiểm tra viết sáng tạo, và o3 mini thậm chí còn tệ hơn o1 mini!

Chưa phân loại

DeepSeek R1 đứng đầu trong bài kiểm tra viết sáng tạo, và o3 mini thậm chí còn tệ hơn o1 mini!

Quazddeepseeker Tháng 2 3, 2025Tháng 2 3, 2025

DeepSeek R1 đã giành chức vô địch trong bài kiểm tra chuẩn mực viết truyện ngắn sáng tạo, vượt qua thành công đối thủ thống trị trước đó là Claude 3.5 Sonnet! Bài kiểm tra chuẩn mực Bài kiểm tra chuẩn mực do nhà nghiên cứu Lech Mazur thiết kế không phải là cuộc thi viết thông thường của bạn. Mỗi mô hình AI được yêu cầu hoàn thành 500 truyện ngắn và mỗi câu chuyện phải khéo léo kết hợp…