DeepSeek R1 Dalam Talian (Percuma|Nologin)
Model AI Sumber Terbuka Revolusi untuk Penaakulan Lanjutan yang mengalahkan Openai o1

Sembang DeepSeek R1 dalam talian percuma
DeepSeek R1 WEBGPU Dalam Talian
Model penaakulan generasi seterusnya yang berjalan secara setempat dalam penyemak imbas anda dengan pecutan WebGPU.
Anda akan memuatkan DeepSeek-R1-Distill-Qwen-1.5B, parameter 1.5B penaakulan LLM yang dioptimumkan untuk inferens dalam penyemak imbas. Semuanya berjalan sepenuhnya dalam penyemak imbas anda dengan 🤗 Transformers.js dan ONNX Runtime Web, bermakna tiada data dihantar ke pelayan. Setelah dimuatkan, ia juga boleh digunakan di luar talian.

Ejen Pengekodan AI Dikuasakan OLEH DeepSeek dalam talian Percuma Sekarang!
Boltnew.ai dikuasakan Oleh deepseek V3 , ialah alat penjanaan kod, percuma sekarang!






Ciri Dikemas Daripada DeepSeek R1 dalam talian
Seni bina
Dibina pada KPM (Campuran Pakar) dengan 37B aktif/671B jumlah parameter dan 128K panjang konteks. Melaksanakan pembelajaran peneguhan lanjutan untuk mencapai pengesahan kendiri, refleksi pelbagai langkah dan keupayaan penaakulan sejajar manusia.
Prestasi
Matematik: 97.3% ketepatan pada MATH-500
Pengekodan: Mengungguli 96.3% peserta Codeforces
Penaakulan Umum: Kadar lulus 79.8% pada AIME 2024 (SOTA)
Kedudukan keputusan ini DeepSeek R1 antara model AI berprestasi tinggi di seluruh dunia.
Kerahan
API: Titik akhir serasi OpenAI ($0.14/juta token)
Sumber Terbuka: Berat berlesen MIT, varian suling 1.5B-70B untuk kegunaan komersial.
Cari dalam Repositori GitHub
Ekosistem Model
Varian: Pangkalan (R1-Sifar), Dipertingkat (R1), 6 model suling ringan
Pengkhususan: Dioptimumkan untuk penyelesaian masalah yang kompleks, pemahaman berbilang bahasa dan penjanaan kod gred pengeluaran
Pelan hala tuju
Peningkatan berterusan untuk sokongan pelbagai mod, peningkatan perbualan dan pengoptimuman inferens teragih, didorong oleh kerjasama komuniti sumber terbuka.
Sumber Terbuka
pertama di dunia model penaakulan yang dibangunkan RL tulen dengan pelaksanaan sumber terbuka 32B versi ringan mencapai prestasi matematik peringkat GPT-4 di 90% kos lebih rendah
Rantaian Pemikiran visualisasi keupayaan, menangani cabaran "kotak hitam" AI

Apakah DeepSeek R1 dalam talian?
DeepSeek R1 mewakili kemajuan terobosan dalam kecerdasan buatan, menawarkan prestasi terkini dalam penaakulan, matematik dan tugas pengekodan. Model inovatif ini menunjukkan keupayaan yang setanding dengan penyelesaian proprietari terkemuka sambil mengekalkan kebolehcapaian sumber terbuka yang lengkap.
Seni Bina Teknikal dan Keupayaan
Seni Bina Model
DeepSeek R1 menggunakan seni bina MoE (Campuran Pakar) yang canggih dengan:
- 37B parameter diaktifkan
- 671B jumlah parameter
- Sokongan panjang konteks 128K
Rangka kerja DeepSeek R1 menggabungkan teknik pembelajaran pengukuhan lanjutan, menetapkan penanda aras baharu dalam keupayaan penaakulan AI.
Penanda Aras Prestasi
DeepSeek R1 telah mencapai keputusan yang luar biasa merentas pelbagai penanda aras:
- MATH-500: 97.3% ketepatan
- AIME 2024: 79.8% kadar lulus
- Codeforces: Kedudukan persentil 96.3%
Kedudukan keputusan ini DeepSeek R1 antara model AI berprestasi tinggi di seluruh dunia.


Varian Model dan Penyulingan Deepseek dalam talian
Versi Tersedia
DeepSeek R1 datang dalam pelbagai varian:
- DeepSeek R1-Zero: Model asas
- DeepSeek R1: Versi dipertingkatkan
- Berbilang versi suling antara 1.5B hingga 70B parameter
Pengoptimuman Prestasi
Model ini menunjukkan keupayaan luar biasa dalam:
Penyelesaian masalah yang kompleks
Penaakulan matematik
Penjanaan kod
Pemahaman bahasa semula jadi
Model DeepSeek-R1-Distill (muat turun dalam talian)
Model | Model Asas | Muat turun |
---|---|---|
DeepSeek-R1-Penyuling-Qwen-1.5B | Qwen2.5-Math-1.5B | 🤗 HuggingFace |
DeepSeek-R1-Penyuling-Qwen-7B | Qwen2.5-Math-7B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-8B | Llama-3.1-8B | 🤗 HuggingFace |
DeepSeek-R1-Penyuling-Qwen-14B | Qwen2.5-14B | 🤗 HuggingFace |
DeepSeek-R1-Penyuling-Qwen-32B | Qwen2.5-32B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Arahan | 🤗 HuggingFace |
anda boleh mendapatkan maklumat lanjut tentang Model DeepSeek-R1-Distill di sini
Harga Deepseek R1
Butiran Harga,
MODEL(1) | PANJANG KONTEKS | TOKEN MAX COT(2) | TOKEN OUTPUT MAKS(3) | 1J TOKEN HARGA INPUT (HIT CACHE) (4) | 1J TOKEN HARGA INPUT (CACHE MISS) | 1J TOKEN HARGA OUTPUT |
---|---|---|---|---|---|---|
deepseek-sembang | 64K | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-penaakul | 64K | 32K | 8K | $0.14 | $0.55 | $2.19 (6) |
Perbandingan Harga: DeepSeek R1 lwn OpenAI o1
1. Harga DeepSeek R1
DeepSeek R1 menawarkan struktur penetapan harga yang sangat kompetitif, menjadikannya jauh lebih berpatutan daripada OpenAI o1:
- Token Input (Cache Hit): $0.14 setiap juta token
- Token Input (Cache Miss): $0.55 setiap juta token
- Token Keluaran: $2.19 setiap juta token
Sistem caching pintar mengurangkan kos untuk pertanyaan berulang, menyediakan sehingga 90% penjimatan untuk cache hits25.
2. Harga OpenAI o1
Sebaliknya, OpenAI o1 jauh lebih mahal:
- Token Input: $15 setiap juta token
- Token Keluaran: $60 setiap juta token
Ini menjadikan OpenAI o1 90-95% lebih mahal daripada DeepSeek R1 untuk kegunaan yang setara112.
3. Kecekapan Kos
Harga DeepSeek R1 ialah 90-95% lebih rendah daripada OpenAI o1, menawarkan alternatif kos efektif tanpa menjejaskan prestasi. Contohnya:
- 1 Juta Input Token:
- DeepSeek R1: 0.14(cachehit)atau0.14(cachehait)atau0.55 (kehilangan cache)
- OpenAI o1: $15
- 1 Juta Token Keluaran:
- DeepSeek R1: $2.19
- OpenAI o1: $60
Keterjangkauan ini menjadikan DeepSeek R1 pilihan yang menarik untuk pembangun dan perusahaan1512.
4. Faedah Tambahan
- Akses Sumber Terbuka: DeepSeek R1 tersedia di bawah lesen MIT, membenarkan penggunaan percuma, pengubahsuaian dan pengkomersilan512.
- Fleksibiliti API: API DeepSeek R1 menyokong ciri lanjutan seperti penaakulan rantaian pemikiran dan pengendalian konteks panjang (sehingga 128K token)212.


Blog Dan Berita tentang Deepseek R1 dan Deepseek dalam talian
-
DeepSeek telah mengeluarkan kod sumbernya, penjelasan terperinci mengenai FlashMLA
-
Apakah FlashMLA? Panduan Komprehensif untuk Kesannya pada Inti Penyahkod AI
-
Qwen2.5-max vs DeepSeek R1: Perbandingan model yang mendalam: analisis penuh senario aplikasi
-
Ia hampir dengan DeepSeek-R1-32B dan menghancurkan s1 Fei-Fei Li! UC Berkeley dan model inferens SOTA baharu sumber terbuka lain
1,Apakah yang menjadikan seni bina DeepSeek-R1 unik?
- DeepSeek R1 menggunakan a sistem KPM dengan 37B aktif/671B jumlah parameter dan 128K sokongan konteks, dioptimumkan melalui pembelajaran tetulang tulen tanpa penyeliaan penalaan halus.
2. Bagaimanakah DeepSeek R1 dibandingkan dengan OpenAI o1 dalam harga?
- Kos DeepSeek R1 90-95% kurang: 0.14/jutainputtokensvsOpenAIo1′s0.14/millioninhlmuttokensvsOpenAsayao1′s15, dengan keupayaan penaakulan yang setara.
3. Bolehkah saya menggunakan DeepSeek R1 secara tempatan?
- Ya, DeepSeek R1 menyokong penggunaan tempatan melalui vLLM/SGLang dan menawarkan 6 model suling (parameter 1.5B-70B) untuk persekitaran terhad sumber.
4. Apakah tanda aras yang membuktikan prestasi DeepSeek R1?
- Mencapai SOTA dalam MATH-500 (97.3%), Codeforces (96.3% persentil) dan AIME 2024 (79.8%), mengatasi kebanyakan model komersial.
5. Adakah DeepSeek R1 sumber terbuka?
- Ya, DeepSeek R1 berlesen MIT dengan berat model penuh tersedia GitHub, membenarkan penggunaan komersial dan pengubahsuaian.
6. Apakah kebolehan kognitif yang membezakan DeepSeek R1?
- Ciri-ciri pengesahan diri dan refleksi pelbagai langkah, menyelesaikan masalah yang kompleks melalui penaakulan rantaian pemikiran yang boleh dilihat.
7. Industri manakah yang paling mendapat manfaat daripada DeepSeek R1?
- Sesuai untuk penyelidikan AI, penjanaan kod perusahaan, pemodelan matematik dan aplikasi NLP berbilang bahasa yang memerlukan penaakulan lanjutan.
8. Bagaimanakah DeepSeek R1 mengendalikan penyepaduan API?
- Menawarkan titik akhir API serasi OpenAI dengan sokongan konteks 128K dan caching pintar ($0.14/juta token untuk capan cache).
9. Apakah langkah keselamatan yang DeepSeek R1 laksanakan?
- Kawalan ulangan terbina dalam (suhu 0.5-0.7) dan mekanisme penjajaran menghalang gelung tidak berkesudahan yang biasa dalam model terlatih RL.
10. Di manakah saya boleh mendapatkan dokumentasi teknikal untuk DeepSeek R1?
Akses spesifikasi penuh melalui Kertas Teknikal DeepSeek R1 dan dokumen API.