DeepSeek R1 Trực tuyến (Miễn phí|Nologin)
Mô hình AI nguồn mở mang tính cách mạng cho lý luận nâng cao đánh bại Openai o1

DeepSeek R1 Trò chuyện trực tuyến miễn phí
DeepSeek R1 WEBGPU Trực tuyến
Mô hình lý luận thế hệ tiếp theo chạy cục bộ trên trình duyệt của bạn với khả năng tăng tốc WebGPU.
Bạn sắp tải DeepSeek-R1-Distill-Qwen-1.5B, một LLM lý luận tham số 1.5B được tối ưu hóa cho suy luận trong trình duyệt. Mọi thứ chạy hoàn toàn trong trình duyệt của bạn với 🤗 Transformers.js và ONNX Runtime Web, nghĩa là không có dữ liệu nào được gửi đến máy chủ. Sau khi tải, nó thậm chí có thể được sử dụng ngoại tuyến.

AI Coding Agent được hỗ trợ bởi DeepSeek trực tuyến miễn phí ngay bây giờ!
Boltnew.ai được hỗ trợ bởi deepseek V3, là một công cụ tạo mã, hiện miễn phí!






Tính năng đóng gói của DeepSeek R1 trực tuyến
Ngành kiến trúc
Được xây dựng trên MoE (Hỗn hợp các chuyên gia) với 37B tham số hoạt động/671B tổng cộng và độ dài ngữ cảnh 128K. Triển khai học tăng cường nâng cao để đạt được khả năng tự xác minh, phản ánh nhiều bước và khả năng lý luận phù hợp với con người.
Hiệu suất
Toán học: Độ chính xác 97.3% trên MATH-500
Mã hóa: Vượt trội hơn 96,3% của những người tham gia Codeforces
Lý luận chung: Tỷ lệ đỗ 79,8% trong kỳ thi AIME 2024 (SOTA)
Những kết quả này định vị DeepSeek R1 trong số những mô hình AI có hiệu suất cao nhất trên toàn cầu.
Triển khai
Giao diện lập trình ứng dụng (API): Điểm cuối tương thích với OpenAI ($0.14/triệu mã thông báo)
Nguồn mở: Trọng lượng được cấp phép bởi MIT, các biến thể chưng cất 1.5B-70B để sử dụng cho mục đích thương mại.
Tìm nó trong Kho lưu trữ GitHub
Hệ sinh thái mô hình
Các biến thể: Cơ bản (R1-Zero), Nâng cao (R1), 6 mẫu chưng cất nhẹ
Chuyên môn hóa: Được tối ưu hóa để giải quyết các vấn đề phức tạp, hiểu biết đa ngôn ngữ và tạo mã cấp sản xuất
Lộ trình
Liên tục nâng cấp để hỗ trợ đa phương thức, cải thiện khả năng đàm thoại và tối ưu hóa suy luận phân tán, được thúc đẩy bởi sự hợp tác của cộng đồng nguồn mở.
Nguồn mở
Đầu tiên trên thế giới mô hình lý luận được phát triển thuần túy RL với việc triển khai mã nguồn mở, phiên bản nhẹ 32B đạt được hiệu suất toán học cấp độ GPT-4 tại 90% giá thấp hơn
Chuỗi suy nghĩ sự hình dung khả năng, giải quyết các thách thức của “hộp đen” AI

DeepSeek R1 trực tuyến là gì?
DeepSeek R1 đại diện cho sự tiến bộ đột phá trong trí tuệ nhân tạo, cung cấp hiệu suất tiên tiến trong các tác vụ lý luận, toán học và mã hóa. Mô hình sáng tạo này chứng minh khả năng tương đương với các giải pháp độc quyền hàng đầu trong khi vẫn duy trì khả năng truy cập nguồn mở hoàn toàn.
Kiến trúc và khả năng kỹ thuật
Kiến trúc mô hình
DeepSeek R1 sử dụng kiến trúc MoE (Hỗn hợp chuyên gia) tinh vi với:
- 37B tham số kích hoạt
- Tổng cộng 671B tham số
- Hỗ trợ độ dài ngữ cảnh 128K
Khung DeepSeek R1 kết hợp các kỹ thuật học tăng cường tiên tiến, thiết lập chuẩn mực mới về khả năng suy luận của AI.
Tiêu chuẩn hiệu suất
DeepSeek R1 đã đạt được những kết quả đáng chú ý trên nhiều tiêu chuẩn khác nhau:
- MATH-500: Độ chính xác 97.3%
- AIME 2024: Tỷ lệ đậu 79,8%
- Codeforces: Xếp hạng phần trăm 96,3%
Những kết quả này định vị DeepSeek R1 trong số những mô hình AI có hiệu suất cao nhất trên toàn cầu.


Các biến thể mô hình và chưng cất Deepseek trực tuyến
Phiên bản có sẵn
DeepSeek R1 có nhiều biến thể khác nhau:
- DeepSeek R1-Zero: Mô hình cơ sở
- DeepSeek R1: Phiên bản nâng cao
- Nhiều phiên bản chưng cất có thông số từ 1,5B đến 70B
Tối ưu hóa hiệu suất
Mô hình này thể hiện khả năng đặc biệt trong:
Giải quyết vấn đề phức tạp
Lý luận toán học
Tạo mã
Hiểu ngôn ngữ tự nhiên
DeepSeek-R1-Distill Models (tải xuống trực tuyến)
Người mẫu | Mô hình cơ sở | Tải về |
---|---|---|
DeepSeek-R1-Chưng cất-Qwen-1.5B | Qwen2.5-Toán-1.5B | 🤗 Ôm mặt |
DeepSeek-R1-Chưng cất-Qwen-7B | Qwen2.5-Toán-7B | 🤗 Ôm mặt |
DeepSeek-R1-Chưng cất-Llama-8B | Lạc đà không bướu-3.1-8B | 🤗 Ôm mặt |
DeepSeek-R1-Chưng cất-Qwen-14B | Qwen2.5-14B | 🤗 Ôm mặt |
DeepSeek-R1-Chưng cất-Qwen-32B | Qwen2.5-32B | 🤗 Ôm mặt |
DeepSeek-R1-Chưng cất-Llama-70B | Llama-3.3-70B-Hướng dẫn | 🤗 Ôm mặt |
bạn có thể tìm thêm thông tin về DeepSeek-R1-Distill Models đây
Giá của Deepseek R1
Chi tiết giá
NGƯỜI MẪU(1) | ĐỘ DÀI NGỮ CẢNH | TOKEN COT TỐI ĐA(2) | Số lượng token đầu ra tối đa(3) | 1 triệu token GIÁ ĐẦU VÀO (Đánh vào bộ nhớ đệm) (4) | 1 triệu token GIÁ ĐẦU VÀO (BỎ LỠ BỎ QUA) | 1 triệu token GIÁ ĐẦU RA |
---|---|---|---|---|---|---|
deepseek-trò chuyện | 64K | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-người lý luận | 64K | 32K | 8K | $0.14 | $0.55 | $2.19 (6) |
So sánh giá: DeepSeek R1 so với OpenAI o1
1. Giá DeepSeek R1
DeepSeek R1 cung cấp cấu trúc giá cực kỳ cạnh tranh, khiến nó có giá cả phải chăng hơn đáng kể so với OpenAI o1:
- Mã thông báo đầu vào (Cache Hit): $0.14 cho mỗi triệu token
- Mã thông báo đầu vào (Bỏ lỡ bộ nhớ đệm): $0,55 cho mỗi triệu token
- Mã thông báo đầu ra: $2.19 cho mỗi triệu token
Hệ thống lưu trữ đệm thông minh giúp giảm chi phí cho các truy vấn lặp lại, cung cấp tới Tiết kiệm 90% cho số lần truy cập bộ nhớ đệm là 25.
2. Giá OpenAI o1
Ngược lại, OpenAI o1 đắt hơn đáng kể:
- Mã thông báo đầu vào: $15 cho mỗi triệu token
- Mã thông báo đầu ra: $60 cho mỗi triệu token
Điều này làm cho OpenAI o1 90-95% đắt hơn hơn DeepSeek R1 cho mức sử dụng tương đương112.
3. Hiệu quả chi phí
Giá của DeepSeek R1 là 90-95% thấp hơn hơn OpenAI o1, cung cấp giải pháp thay thế tiết kiệm chi phí mà không ảnh hưởng đến hiệu suất. Ví dụ:
- 1 triệu mã thông báo đầu vào:
- DeepSeek R1: 0,14(cachehit)hoặc0,14(cMộtchvàCHÀOt)hoặc0,55 (lỗi bộ nhớ đệm)
- OpenAI o1: $15
- 1 triệu token đầu ra:
- DeepSeek R1: $2.19
- OpenAI o1: $60
Mức giá phải chăng này khiến DeepSeek R1 trở thành lựa chọn hấp dẫn cho các nhà phát triển và doanh nghiệp1512.
4. Lợi ích bổ sung
- Truy cập nguồn mở:DeepSeek R1 được cung cấp theo giấy phép MIT, cho phép sử dụng, sửa đổi và thương mại hóa miễn phí512.
- Tính linh hoạt của API:API của DeepSeek R1 hỗ trợ các tính năng nâng cao như suy luận chuỗi suy nghĩ và xử lý ngữ cảnh dài (tối đa 128K mã thông báo)212.


Blog và tin tức về Deepseek R1 và Deepseek trực tuyến
-
DeepSeek đã phát hành mã nguồn, giải thích chi tiết về FlashMLA
-
FlashMLA là gì? Hướng dẫn toàn diện về tác động của nó đối với AI Decoding Kernels
-
Qwen2.5-max so với DeepSeek R1: So sánh sâu sắc các mô hình: phân tích đầy đủ các tình huống ứng dụng
-
Nó gần với DeepSeek-R1-32B và đánh bại s1! của Fei-Fei Li UC Berkeley và các mô hình suy luận SOTA mới nguồn mở khác
Chọn ngôn ngữ khác về deepseek R1
Những câu hỏi thường gặp về deepseek-r1
1,Điều gì làm cho kiến trúc của DeepSeek-R1 trở nên độc đáo?
- DeepSeek R1 sử dụng một Hệ thống MoE với 37B tham số hoạt động/671B tổng số tham số và 128K hỗ trợ ngữ cảnh, được tối ưu hóa thông qua học tăng cường thuần túy mà không cần điều chỉnh có giám sát.
2. Giá của DeepSeek R1 so với OpenAI o1 như thế nào?
- Chi phí DeepSeek R1 90-95% ít hơn: 0,14/triệuinputtokensvsOpenAIo1′s0,14/tôitôiTôiôichínPbạnttôitôivàNSvSHoạt độngvàNMỘTTÔIôi1′S15, có khả năng suy luận tương đương.
3. Tôi có thể triển khai DeepSeek R1 cục bộ không?
- Có, DeepSeek R1 hỗ trợ triển khai cục bộ thông qua vLLM/SGLang và cung cấp 6 mô hình tinh gọn (tham số 1.5B-70B) cho các môi trường có hạn chế về tài nguyên.
4. Tiêu chuẩn nào chứng minh hiệu suất của DeepSeek R1?
- Đạt được SOTA trong MATH-500 (97,3%), Codeforces (phần trăm 96,3%) và AIME 2024 (79,8%), vượt trội hơn hầu hết các mô hình thương mại.
5. DeepSeek R1 có phải là mã nguồn mở không?
- Có, DeepSeek R1 được cấp phép bởi MIT với đầy đủ trọng lượng mô hình có sẵn trên GitHub, cho phép sử dụng và sửa đổi vì mục đích thương mại.
6. Khả năng nhận thức nào phân biệt DeepSeek R1?
- Đặc trưng tự xác minh Và phản xạ nhiều bước, giải quyết các vấn đề phức tạp thông qua chuỗi suy luận có thể nhìn thấy được.
7. Ngành công nghiệp nào được hưởng lợi nhiều nhất từ DeepSeek R1?
- Lý tưởng cho nghiên cứu AI, tạo mã doanh nghiệp, mô hình toán học và các ứng dụng NLP đa ngôn ngữ đòi hỏi khả năng suy luận nâng cao.
8. DeepSeek R1 xử lý tích hợp API như thế nào?
- Cung cấp các điểm cuối API tương thích với OpenAI với hỗ trợ ngữ cảnh 128K và bộ nhớ đệm thông minh ($0.14/triệu mã thông báo cho các lần truy cập bộ nhớ đệm).
9. DeepSeek R1 thực hiện những biện pháp an toàn nào?
- Kiểm soát lặp lại tích hợp (nhiệt độ 0,5-0,7) và cơ chế căn chỉnh ngăn ngừa các vòng lặp vô tận thường gặp trong các mô hình được đào tạo RL.
10. Tôi có thể tìm tài liệu kỹ thuật cho DeepSeek R1 ở đâu?
Truy cập thông số kỹ thuật đầy đủ thông qua Tài liệu kỹ thuật DeepSeek R1 Và Tài liệu API.