Uncategorized - Deepseek R1

Rahasia di balik DeepSeek 1 | Rincian Matematika dan GRPO DeepSeekM

Uncategorized

Rahasia di balik DeepSeek 1 | Rincian Matematika dan GRPO DeepSeekM

Olehzddeepseeker 9 Februari 20259 Februari 2025

Hari ini saya ingin berbagi artikel dari DeepSeek, berjudul DeepSeekMath: Mendorong Batas Penalaran Matematika dalam Model Bahasa Terbuka. Artikel ini memperkenalkan DeepSeekMath 7B, yang telah dilatih sebelumnya pada DeepSeek-Coder-Base-v1.5 7B berdasarkan kumpulan 120B token terkait matematika, bahasa alami, dan data kode. Model tersebut mencapai skor yang mencengangkan sebesar 51,7% dalam level kompetitif…

Uncategorized

Teknologi DeepSeek-R1 terungkap: prinsip inti makalah dipecah dan kunci kinerja model terobosan terungkap

Olehzddeepseeker 9 Februari 20259 Februari 2025

Hari ini kami akan berbagi DeepSeek R1, Judul: DeepSeek-R1: Memberi Insentif Kemampuan Penalaran dalam LLM melalui Pembelajaran Penguatan: Memberi insentif pada kemampuan penalaran LLM melalui pembelajaran penguatan. Makalah ini memperkenalkan model penalaran generasi pertama DeepSeek, DeepSeek-R1-Zero dan DeepSeek-R1. Model DeepSeek-R1-Zero dilatih melalui pembelajaran penguatan skala besar (RL) tanpa penyempurnaan terbimbing (SFT) sebagai langkah awal,…

Uncategorized

Interpretasi makalah DeepSeek R1 & poin-poin teknis utama

Olehzddeepseeker 9 Februari 20259 Februari 2025

1 Latar Belakang Selama Festival Musim Semi, DeepSeek R1 sekali lagi menarik perhatian luas, dan bahkan artikel interpretasi DeepSeek V3 yang kami tulis sebelumnya juga disiarkan ulang dan banyak dibahas. Meskipun telah ada banyak analisis dan reproduksi DeepSeek R1, di sini kami telah memutuskan untuk menyusun beberapa catatan bacaan yang sesuai. Kami akan menggunakan tiga…

Model berbiaya rendah Google, seri Gemini 2.0, sedang menyerang: pertarungan untuk efektivitas biaya dalam model besar semakin intensif

Uncategorized

Model berbiaya rendah Google, seri Gemini 2.0, sedang menyerang: pertarungan untuk efektivitas biaya dalam model besar semakin intensif

Olehzddeepseeker 8 Februari 20258 Februari 2025

Biaya tinggi untuk menggunakan model AI yang besar merupakan alasan utama mengapa banyak aplikasi AI belum diimplementasikan dan dipromosikan. Memilih kinerja ekstrem berarti biaya daya komputasi yang besar, yang berujung pada biaya penggunaan tinggi yang tidak dapat diterima oleh pengguna biasa. Persaingan untuk model AI yang besar bagaikan perang tanpa asap. Setelah…

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!

Uncategorized

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Keluarga Google Gemini 2.0 akhirnya lengkap! Ia mendominasi tangga lagu segera setelah dirilis. Di tengah pengejaran dan blokade Deepseek, Qwen, dan o3, Google merilis tiga model sekaligus pagi ini: Gemini 2.0 Pro, Gemini 2.0 Flash, dan Gemini 2.0 Flash-Lite. Pada peringkat LMSYS model besar, Gemini…

Dialog a16z dengan CEO berusia 27 tahun: Agen AI memiliki efek leverage yang besar, dan harga jangka panjang akan dikaitkan dengan biaya tenaga kerja

Uncategorized

Dialog a16z dengan CEO berusia 27 tahun: Agen AI memiliki efek leverage yang besar, dan harga jangka panjang akan dikaitkan dengan biaya tenaga kerja

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan AI Agent membentuk kembali pengalaman pelanggan Jesse Zhang: Bagaimana Agen sebenarnya dibangun? Pandangan kami adalah bahwa seiring berjalannya waktu, Agen akan semakin mirip dengan Agen berbasis bahasa alami karena begitulah cara model bahasa besar (LLM) dilatih. Dalam jangka panjang, jika Anda memiliki agen super cerdas yang…

Uncategorized

Cathie Wood: DeepSeek hanya mempercepat proses pengurangan biaya; struktur pasar yang sangat terkonsentrasi yang sebanding dengan Depresi Besar akan berubah

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan Persaingan dengan DeepSeek menguntungkan AS Cathie Wood: Saya pikir ini menunjukkan bahwa biaya inovasi menurun drastis, dan tren ini sudah dimulai. Misalnya, sebelum DeepSeek, biaya pelatihan kecerdasan buatan turun 75% per tahun, dan biaya inferensi bahkan turun 85% menjadi…

Uncategorized

Google telah merilis tiga model baru sekaligus: Gemini-2.0-Pro gratis, memiliki skor luar biasa dan menempati peringkat pertama, serta cocok untuk pengkodean dan pemrosesan perintah yang rumit!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Kisah Gemini 2.0 semakin cepat. Versi Flash Thinking Experimental pada bulan Desember menghadirkan model kerja dengan latensi rendah dan performa tinggi bagi para pengembang. Awal tahun ini, Flash Thinking Experimental 2.0 diperbarui di Google AI Studio untuk lebih meningkatkan performa dengan menggabungkan kecepatan Flash dengan kemampuan inferensi yang ditingkatkan. Minggu lalu,…

DeepSeek TOP17 Alternatif Terbaik: Analisis Komprehensif (2025)

Uncategorized

DeepSeek TOP17 Alternatif Terbaik: Analisis Komprehensif (2025)

Olehdeepseeker 6 Februari 20256 Februari 2025

Pendahuluan Dalam lanskap kecerdasan buatan yang berkembang pesat, DeepSeek telah muncul sebagai model bahasa yang kuat. Analisis komprehensif ini mengeksplorasi 17 alternatif teratas untuk DeepSeek, dengan memeriksa fitur, kemampuan, dan kasus penggunaan uniknya. Penelitian kami berfokus pada platform internasional dan Tiongkok yang menawarkan integrasi DeepSeek atau kemampuan serupa. Analisis Alternatif Teratas 1….

Uncategorized

Ali Qwen2.5-Max menyalip DeepSeek-V3! Netizen: AI China dengan cepat menutup celah

Olehzddeepseeker 5 Februari 20255 Februari 2025

Baru saja, model domestik lain ditambahkan ke daftar Big Model Arena dari Ali, Qwen2.5-Max, yang melampaui DeepSeek-V3 dan menduduki peringkat ketujuh dalam peringkat keseluruhan dengan skor total 1332. Model ini juga melampaui model seperti Claude 3.5 Sonnet dan Llama 3.1 405B dalam satu gerakan. Secara khusus, model ini unggul dalam pemrograman…