DeepSeek R1 Dalam Talian (Percuma|Nologin)

Model AI Sumber Terbuka Revolusi untuk Penaakulan Lanjutan yang mengalahkan Openai o1

Sembang DeepSeek R1 dalam talian percuma

DeepSeek R1 WEBGPU Dalam Talian

Ejen Pengekodan AI Dikuasakan OLEH DeepSeek dalam talian Percuma Sekarang!

Ciri Dikemas Daripada DeepSeek R1 dalam talian

Seni bina

Dibina pada KPM (Campuran Pakar) dengan 37B aktif/671B jumlah parameter dan 128K panjang konteks. Melaksanakan pembelajaran peneguhan lanjutan untuk mencapai pengesahan kendiri, refleksi pelbagai langkah dan keupayaan penaakulan sejajar manusia.

Prestasi

Matematik: 97.3% ketepatan pada MATH-500
Pengekodan: Mengungguli 96.3% peserta Codeforces
Penaakulan Umum: Kadar lulus 79.8% pada AIME 2024 (SOTA)
Kedudukan keputusan ini DeepSeek R1 antara model AI berprestasi tinggi di seluruh dunia.

Kerahan

API: Titik akhir serasi OpenAI ($0.14/juta token)
Sumber Terbuka: Berat berlesen MIT, varian suling 1.5B-70B untuk kegunaan komersial.
Cari dalam Repositori GitHub

Ekosistem Model

Varian: Pangkalan (R1-Sifar), Dipertingkat (R1), 6 model suling ringan
Pengkhususan: Dioptimumkan untuk penyelesaian masalah yang kompleks, pemahaman berbilang bahasa dan penjanaan kod gred pengeluaran

Pelan hala tuju

Peningkatan berterusan untuk sokongan pelbagai mod, peningkatan perbualan dan pengoptimuman inferens teragih, didorong oleh kerjasama komuniti sumber terbuka.

Sumber Terbuka

pertama di dunia model penaakulan yang dibangunkan RL tulen dengan pelaksanaan sumber terbuka 32B versi ringan mencapai prestasi matematik peringkat GPT-4 di 90% kos lebih rendah
Rantaian Pemikiran visualisasi keupayaan, menangani cabaran "kotak hitam" AI

Apakah DeepSeek R1 dalam talian?

DeepSeek R1 mewakili kemajuan terobosan dalam kecerdasan buatan, menawarkan prestasi terkini dalam penaakulan, matematik dan tugas pengekodan. Model inovatif ini menunjukkan keupayaan yang setanding dengan penyelesaian proprietari terkemuka sambil mengekalkan kebolehcapaian sumber terbuka yang lengkap.

Seni Bina Teknikal dan Keupayaan

Seni Bina Model

DeepSeek R1 menggunakan seni bina MoE (Campuran Pakar) yang canggih dengan:

  • 37B parameter diaktifkan
  • 671B jumlah parameter
  • Sokongan panjang konteks 128K

Rangka kerja DeepSeek R1 menggabungkan teknik pembelajaran pengukuhan lanjutan, menetapkan penanda aras baharu dalam keupayaan penaakulan AI.

Penanda Aras Prestasi

DeepSeek R1 telah mencapai keputusan yang luar biasa merentas pelbagai penanda aras:

  • MATH-500: 97.3% ketepatan
  • AIME 2024: 79.8% kadar lulus
  • Codeforces: Kedudukan persentil 96.3%

Kedudukan keputusan ini DeepSeek R1 antara model AI berprestasi tinggi di seluruh dunia.

Varian Model dan Penyulingan Deepseek dalam talian

Versi Tersedia

DeepSeek R1 datang dalam pelbagai varian:

  • DeepSeek R1-Zero: Model asas
  • DeepSeek R1: Versi dipertingkatkan
  • Berbilang versi suling antara 1.5B hingga 70B parameter

Pengoptimuman Prestasi

Model ini menunjukkan keupayaan luar biasa dalam:

Penyelesaian masalah yang kompleks

Penaakulan matematik

Penjanaan kod

Pemahaman bahasa semula jadi

Model DeepSeek-R1-Distill (muat turun dalam talian)

ModelModel AsasMuat turun
DeepSeek-R1-Penyuling-Qwen-1.5BQwen2.5-Math-1.5B🤗 HuggingFace
DeepSeek-R1-Penyuling-Qwen-7BQwen2.5-Math-7B🤗 HuggingFace
DeepSeek-R1-Distill-Llama-8BLlama-3.1-8B🤗 HuggingFace
DeepSeek-R1-Penyuling-Qwen-14BQwen2.5-14B🤗 HuggingFace
DeepSeek-R1-Penyuling-Qwen-32BQwen2.5-32B🤗 HuggingFace
DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Arahan🤗 HuggingFace

anda boleh mendapatkan maklumat lanjut tentang Model DeepSeek-R1-Distill di sini

Deepseek R1 dalam talian adalah. Hebat!!

R1 menggunakan pembelajaran tetulang tulen untuk memadankan OpenAI o1 — pada 95% kurang kos. , menakjubkan
Jimmy Smith

Harga Deepseek R1

Butiran Harga,

MODEL(1)PANJANG KONTEKSTOKEN MAX COT(2)TOKEN OUTPUT MAKS(3)1J TOKEN
HARGA INPUT
(HIT CACHE) (4)
1J TOKEN
HARGA INPUT
(CACHE MISS)
1J TOKEN
HARGA OUTPUT
deepseek-sembang64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-penaakul64K32K8K$0.14$0.55$2.19 (6)

Perbandingan Harga: DeepSeek R1 lwn OpenAI o1

1. Harga DeepSeek R1

DeepSeek R1 menawarkan struktur penetapan harga yang sangat kompetitif, menjadikannya jauh lebih berpatutan daripada OpenAI o1:

  • Token Input (Cache Hit): $0.14 setiap juta token
  • Token Input (Cache Miss): $0.55 setiap juta token
  • Token Keluaran: $2.19 setiap juta token

Sistem caching pintar mengurangkan kos untuk pertanyaan berulang, menyediakan sehingga 90% penjimatan untuk cache hits25.

2. Harga OpenAI o1

Sebaliknya, OpenAI o1 jauh lebih mahal:

  • Token Input: $15 setiap juta token
  • Token Keluaran: $60 setiap juta token

Ini menjadikan OpenAI o1 90-95% lebih mahal daripada DeepSeek R1 untuk kegunaan yang setara112.

3. Kecekapan Kos

Harga DeepSeek R1 ialah 90-95% lebih rendah daripada OpenAI o1, menawarkan alternatif kos efektif tanpa menjejaskan prestasi. Contohnya:

  • 1 Juta Input Token:
    • DeepSeek R1: 0.14(cachehit)atau0.14(cachehait)atau0.55 (kehilangan cache)
    • OpenAI o1: $15
  • 1 Juta Token Keluaran:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Keterjangkauan ini menjadikan DeepSeek R1 pilihan yang menarik untuk pembangun dan perusahaan1512.

4. Faedah Tambahan

  • Akses Sumber Terbuka: DeepSeek R1 tersedia di bawah lesen MIT, membenarkan penggunaan percuma, pengubahsuaian dan pengkomersilan512.
  • Fleksibiliti API: API DeepSeek R1 menyokong ciri lanjutan seperti penaakulan rantaian pemikiran dan pengendalian konteks panjang (sehingga 128K token)212.

Blog Dan Berita tentang Deepseek R1 dan Deepseek dalam talian

  • DeepSeek telah mengeluarkan kod sumbernya, penjelasan terperinci mengenai FlashMLA

  • Apakah FlashMLA? Panduan Komprehensif untuk Kesannya pada Inti Penyahkod AI

  • Qwen2.5-max vs DeepSeek R1: Perbandingan model yang mendalam: analisis penuh senario aplikasi

  • Ia hampir dengan DeepSeek-R1-32B dan menghancurkan s1 Fei-Fei Li! UC Berkeley dan model inferens SOTA baharu sumber terbuka lain

Pilih Bahasa lain tentang deepseek R1

Soalan Lazim tentang deepseek-r1

1,Apakah yang menjadikan seni bina DeepSeek-R1 unik?

  • DeepSeek R1 menggunakan a sistem KPM dengan 37B aktif/671B jumlah parameter dan 128K sokongan konteks, dioptimumkan melalui pembelajaran tetulang tulen tanpa penyeliaan penalaan halus.

2. Bagaimanakah DeepSeek R1 dibandingkan dengan OpenAI o1 dalam harga?

  • Kos DeepSeek R1 90-95% kurang: 0.14/jutainputtokensvsOpenAIo1′s0.14/millioninhlmuttokensvsOpenAsayao1′s15, dengan keupayaan penaakulan yang setara.

3. Bolehkah saya menggunakan DeepSeek R1 secara tempatan?

  • Ya, DeepSeek R1 menyokong penggunaan tempatan melalui vLLM/SGLang dan menawarkan 6 model suling (parameter 1.5B-70B) untuk persekitaran terhad sumber.

4. Apakah tanda aras yang membuktikan prestasi DeepSeek R1?

  • Mencapai SOTA dalam MATH-500 (97.3%), Codeforces (96.3% persentil) dan AIME 2024 (79.8%), mengatasi kebanyakan model komersial.

5. Adakah DeepSeek R1 sumber terbuka?

  • Ya, DeepSeek R1 berlesen MIT dengan berat model penuh tersedia GitHub, membenarkan penggunaan komersial dan pengubahsuaian.

6. Apakah kebolehan kognitif yang membezakan DeepSeek R1?

  • Ciri-ciri pengesahan diri dan refleksi pelbagai langkah, menyelesaikan masalah yang kompleks melalui penaakulan rantaian pemikiran yang boleh dilihat.

7. Industri manakah yang paling mendapat manfaat daripada DeepSeek R1?

  • Sesuai untuk penyelidikan AI, penjanaan kod perusahaan, pemodelan matematik dan aplikasi NLP berbilang bahasa yang memerlukan penaakulan lanjutan.

8. Bagaimanakah DeepSeek R1 mengendalikan penyepaduan API?

  • Menawarkan titik akhir API serasi OpenAI dengan sokongan konteks 128K dan caching pintar ($0.14/juta token untuk capan cache).

9. Apakah langkah keselamatan yang DeepSeek R1 laksanakan?

  • Kawalan ulangan terbina dalam (suhu 0.5-0.7) dan mekanisme penjajaran menghalang gelung tidak berkesudahan yang biasa dalam model terlatih RL.

10. Di manakah saya boleh mendapatkan dokumentasi teknikal untuk DeepSeek R1?

Akses spesifikasi penuh melalui Kertas Teknikal DeepSeek R1 dan dokumen API.