DeepSeek R1 Trực tuyến (Miễn phí|Nologin)

Mô hình AI nguồn mở mang tính cách mạng cho lý luận nâng cao đánh bại Openai o1

DeepSeek R1 Trò chuyện trực tuyến miễn phí

DeepSeek R1 WEBGPU Trực tuyến

AI Coding Agent được hỗ trợ bởi DeepSeek trực tuyến miễn phí ngay bây giờ!

Tính năng đóng gói của DeepSeek R1 trực tuyến

Ngành kiến trúc

Được xây dựng trên MoE (Hỗn hợp các chuyên gia) với 37B tham số hoạt động/671B tổng cộng và độ dài ngữ cảnh 128K. Triển khai học tăng cường nâng cao để đạt được khả năng tự xác minh, phản ánh nhiều bước và khả năng lý luận phù hợp với con người.

Hiệu suất

Toán học: Độ chính xác 97.3% trên MATH-500
Mã hóa: Vượt trội hơn 96,3% của những người tham gia Codeforces
Lý luận chung: Tỷ lệ đỗ 79,8% trong kỳ thi AIME 2024 (SOTA)
Những kết quả này định vị DeepSeek R1 trong số những mô hình AI có hiệu suất cao nhất trên toàn cầu.

Triển khai

Giao diện lập trình ứng dụng (API): Điểm cuối tương thích với OpenAI ($0.14/triệu mã thông báo)
Nguồn mở: Trọng lượng được cấp phép bởi MIT, các biến thể chưng cất 1.5B-70B để sử dụng cho mục đích thương mại.
Tìm nó trong Kho lưu trữ GitHub

Hệ sinh thái mô hình

Các biến thể: Cơ bản (R1-Zero), Nâng cao (R1), 6 mẫu chưng cất nhẹ
Chuyên môn hóa: Được tối ưu hóa để giải quyết các vấn đề phức tạp, hiểu biết đa ngôn ngữ và tạo mã cấp sản xuất

Lộ trình

Liên tục nâng cấp để hỗ trợ đa phương thức, cải thiện khả năng đàm thoại và tối ưu hóa suy luận phân tán, được thúc đẩy bởi sự hợp tác của cộng đồng nguồn mở.

Nguồn mở

Đầu tiên trên thế giới mô hình lý luận được phát triển thuần túy RL với việc triển khai mã nguồn mở, phiên bản nhẹ 32B đạt được hiệu suất toán học cấp độ GPT-4 tại 90% giá thấp hơn
Chuỗi suy nghĩ sự hình dung khả năng, giải quyết các thách thức của “hộp đen” AI

DeepSeek R1 trực tuyến là gì?

DeepSeek R1 đại diện cho sự tiến bộ đột phá trong trí tuệ nhân tạo, cung cấp hiệu suất tiên tiến trong các tác vụ lý luận, toán học và mã hóa. Mô hình sáng tạo này chứng minh khả năng tương đương với các giải pháp độc quyền hàng đầu trong khi vẫn duy trì khả năng truy cập nguồn mở hoàn toàn.

Kiến trúc và khả năng kỹ thuật

Kiến trúc mô hình

DeepSeek R1 sử dụng kiến trúc MoE (Hỗn hợp chuyên gia) tinh vi với:

  • 37B tham số kích hoạt
  • Tổng cộng 671B tham số
  • Hỗ trợ độ dài ngữ cảnh 128K

Khung DeepSeek R1 kết hợp các kỹ thuật học tăng cường tiên tiến, thiết lập chuẩn mực mới về khả năng suy luận của AI.

Tiêu chuẩn hiệu suất

DeepSeek R1 đã đạt được những kết quả đáng chú ý trên nhiều tiêu chuẩn khác nhau:

  • MATH-500: Độ chính xác 97.3%
  • AIME 2024: Tỷ lệ đậu 79,8%
  • Codeforces: Xếp hạng phần trăm 96,3%

Những kết quả này định vị DeepSeek R1 trong số những mô hình AI có hiệu suất cao nhất trên toàn cầu.

Các biến thể mô hình và chưng cất Deepseek trực tuyến

Phiên bản có sẵn

DeepSeek R1 có nhiều biến thể khác nhau:

  • DeepSeek R1-Zero: Mô hình cơ sở
  • DeepSeek R1: Phiên bản nâng cao
  • Nhiều phiên bản chưng cất có thông số từ 1,5B đến 70B

Tối ưu hóa hiệu suất

Mô hình này thể hiện khả năng đặc biệt trong:

Giải quyết vấn đề phức tạp

Lý luận toán học

Tạo mã

Hiểu ngôn ngữ tự nhiên

DeepSeek-R1-Distill Models (tải xuống trực tuyến)

Người mẫuMô hình cơ sởTải về
DeepSeek-R1-Chưng cất-Qwen-1.5BQwen2.5-Toán-1.5B🤗 Ôm mặt
DeepSeek-R1-Chưng cất-Qwen-7BQwen2.5-Toán-7B🤗 Ôm mặt
DeepSeek-R1-Chưng cất-Llama-8BLạc đà không bướu-3.1-8B🤗 Ôm mặt
DeepSeek-R1-Chưng cất-Qwen-14BQwen2.5-14B🤗 Ôm mặt
DeepSeek-R1-Chưng cất-Qwen-32BQwen2.5-32B🤗 Ôm mặt
DeepSeek-R1-Chưng cất-Llama-70BLlama-3.3-70B-Hướng dẫn🤗 Ôm mặt

bạn có thể tìm thêm thông tin về DeepSeek-R1-Distill Models đây

Deepseek R1 trực tuyến thật tuyệt vời!!

R1 sử dụng công nghệ học tăng cường thuần túy để phù hợp với OpenAI o1 — với chi phí thấp hơn 95%. Thật tuyệt vời
Jimmy Smith

Giá của Deepseek R1

Chi tiết giá

NGƯỜI MẪU(1)ĐỘ DÀI NGỮ CẢNHTOKEN COT TỐI ĐA(2)Số lượng token đầu ra tối đa(3)1 triệu token
GIÁ ĐẦU VÀO
(Đánh vào bộ nhớ đệm) (4)
1 triệu token
GIÁ ĐẦU VÀO
(BỎ LỠ BỎ QUA)
1 triệu token
GIÁ ĐẦU RA
deepseek-trò chuyện64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-người lý luận64K32K8K$0.14$0.55$2.19 (6)

So sánh giá: DeepSeek R1 so với OpenAI o1

1. Giá DeepSeek R1

DeepSeek R1 cung cấp cấu trúc giá cực kỳ cạnh tranh, khiến nó có giá cả phải chăng hơn đáng kể so với OpenAI o1:

  • Mã thông báo đầu vào (Cache Hit): $0.14 cho mỗi triệu token
  • Mã thông báo đầu vào (Bỏ lỡ bộ nhớ đệm): $0,55 cho mỗi triệu token
  • Mã thông báo đầu ra: $2.19 cho mỗi triệu token

Hệ thống lưu trữ đệm thông minh giúp giảm chi phí cho các truy vấn lặp lại, cung cấp tới Tiết kiệm 90% cho số lần truy cập bộ nhớ đệm là 25.

2. Giá OpenAI o1

Ngược lại, OpenAI o1 đắt hơn đáng kể:

  • Mã thông báo đầu vào: $15 cho mỗi triệu token
  • Mã thông báo đầu ra: $60 cho mỗi triệu token

Điều này làm cho OpenAI o1 90-95% đắt hơn hơn DeepSeek R1 cho mức sử dụng tương đương112.

3. Hiệu quả chi phí

Giá của DeepSeek R1 là 90-95% thấp hơn hơn OpenAI o1, cung cấp giải pháp thay thế tiết kiệm chi phí mà không ảnh hưởng đến hiệu suất. Ví dụ:

  • 1 triệu mã thông báo đầu vào:
    • DeepSeek R1: 0,14(cachehit)hoặc0,14(cMộtchCHÀOt)hoặc0,55 (lỗi bộ nhớ đệm)
    • OpenAI o1: $15
  • 1 triệu token đầu ra:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Mức giá phải chăng này khiến DeepSeek R1 trở thành lựa chọn hấp dẫn cho các nhà phát triển và doanh nghiệp1512.

4. Lợi ích bổ sung

  • Truy cập nguồn mở:DeepSeek R1 được cung cấp theo giấy phép MIT, cho phép sử dụng, sửa đổi và thương mại hóa miễn phí512.
  • Tính linh hoạt của API:API của DeepSeek R1 hỗ trợ các tính năng nâng cao như suy luận chuỗi suy nghĩ và xử lý ngữ cảnh dài (tối đa 128K mã thông báo)212.

Blog và tin tức về Deepseek R1 và Deepseek trực tuyến

  • DeepSeek đã phát hành mã nguồn, giải thích chi tiết về FlashMLA

  • FlashMLA là gì? Hướng dẫn toàn diện về tác động của nó đối với AI Decoding Kernels

  • Qwen2.5-max so với DeepSeek R1: So sánh sâu sắc các mô hình: phân tích đầy đủ các tình huống ứng dụng

  • Nó gần với DeepSeek-R1-32B và đánh bại s1! của Fei-Fei Li UC Berkeley và các mô hình suy luận SOTA mới nguồn mở khác

Chọn ngôn ngữ khác về deepseek R1

Những câu hỏi thường gặp về deepseek-r1

1,Điều gì làm cho kiến trúc của DeepSeek-R1 trở nên độc đáo?

  • DeepSeek R1 sử dụng một Hệ thống MoE với 37B tham số hoạt động/671B tổng số tham số và 128K hỗ trợ ngữ cảnh, được tối ưu hóa thông qua học tăng cường thuần túy mà không cần điều chỉnh có giám sát.

2. Giá của DeepSeek R1 so với OpenAI o1 như thế nào?

  • Chi phí DeepSeek R1 90-95% ít hơn: 0,14/triệuinputtokensvsOpenAIo1′s0,14/tôitôiTôiôichínPbạnttôitôiNSvSHoạt độngNMỘTTÔIôi1′S15, có khả năng suy luận tương đương.

3. Tôi có thể triển khai DeepSeek R1 cục bộ không?

  • Có, DeepSeek R1 hỗ trợ triển khai cục bộ thông qua vLLM/SGLang và cung cấp 6 mô hình tinh gọn (tham số 1.5B-70B) cho các môi trường có hạn chế về tài nguyên.

4. Tiêu chuẩn nào chứng minh hiệu suất của DeepSeek R1?

  • Đạt được SOTA trong MATH-500 (97,3%), Codeforces (phần trăm 96,3%) và AIME 2024 (79,8%), vượt trội hơn hầu hết các mô hình thương mại.

5. DeepSeek R1 có phải là mã nguồn mở không?

  • Có, DeepSeek R1 được cấp phép bởi MIT với đầy đủ trọng lượng mô hình có sẵn trên GitHub, cho phép sử dụng và sửa đổi vì mục đích thương mại.

6. Khả năng nhận thức nào phân biệt DeepSeek R1?

  • Đặc trưng tự xác minh Và phản xạ nhiều bước, giải quyết các vấn đề phức tạp thông qua chuỗi suy luận có thể nhìn thấy được.

7. Ngành công nghiệp nào được hưởng lợi nhiều nhất từ DeepSeek R1?

  • Lý tưởng cho nghiên cứu AI, tạo mã doanh nghiệp, mô hình toán học và các ứng dụng NLP đa ngôn ngữ đòi hỏi khả năng suy luận nâng cao.

8. DeepSeek R1 xử lý tích hợp API như thế nào?

  • Cung cấp các điểm cuối API tương thích với OpenAI với hỗ trợ ngữ cảnh 128K và bộ nhớ đệm thông minh ($0.14/triệu mã thông báo cho các lần truy cập bộ nhớ đệm).

9. DeepSeek R1 thực hiện những biện pháp an toàn nào?

  • Kiểm soát lặp lại tích hợp (nhiệt độ 0,5-0,7) và cơ chế căn chỉnh ngăn ngừa các vòng lặp vô tận thường gặp trong các mô hình được đào tạo RL.

10. Tôi có thể tìm tài liệu kỹ thuật cho DeepSeek R1 ở đâu?

Truy cập thông số kỹ thuật đầy đủ thông qua Tài liệu kỹ thuật DeepSeek R1 Và Tài liệu API.