zddeepseeker - Deepseek R1 - Halaman 2 dari 3

Uncategorized

Teknologi DeepSeek-R1 terungkap: prinsip inti makalah dipecah dan kunci kinerja model terobosan terungkap

Olehzddeepseeker 9 Februari 20259 Februari 2025

Hari ini kami akan berbagi DeepSeek R1, Judul: DeepSeek-R1: Memberi Insentif Kemampuan Penalaran dalam LLM melalui Pembelajaran Penguatan: Memberi insentif pada kemampuan penalaran LLM melalui pembelajaran penguatan. Makalah ini memperkenalkan model penalaran generasi pertama DeepSeek, DeepSeek-R1-Zero dan DeepSeek-R1. Model DeepSeek-R1-Zero dilatih melalui pembelajaran penguatan skala besar (RL) tanpa penyempurnaan terbimbing (SFT) sebagai langkah awal,…

Uncategorized

Interpretasi makalah DeepSeek R1 & poin-poin teknis utama

Olehzddeepseeker 9 Februari 20259 Februari 2025

1 Latar Belakang Selama Festival Musim Semi, DeepSeek R1 sekali lagi menarik perhatian luas, dan bahkan artikel interpretasi DeepSeek V3 yang kami tulis sebelumnya juga disiarkan ulang dan banyak dibahas. Meskipun telah ada banyak analisis dan reproduksi DeepSeek R1, di sini kami telah memutuskan untuk menyusun beberapa catatan bacaan yang sesuai. Kami akan menggunakan tiga…

Model berbiaya rendah Google, seri Gemini 2.0, sedang menyerang: pertarungan untuk efektivitas biaya dalam model besar semakin intensif

Uncategorized

Model berbiaya rendah Google, seri Gemini 2.0, sedang menyerang: pertarungan untuk efektivitas biaya dalam model besar semakin intensif

Olehzddeepseeker 8 Februari 20258 Februari 2025

Biaya tinggi untuk menggunakan model AI yang besar merupakan alasan utama mengapa banyak aplikasi AI belum diimplementasikan dan dipromosikan. Memilih kinerja ekstrem berarti biaya daya komputasi yang besar, yang berujung pada biaya penggunaan tinggi yang tidak dapat diterima oleh pengguna biasa. Persaingan untuk model AI yang besar bagaikan perang tanpa asap. Setelah…

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!

Uncategorized

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Keluarga Google Gemini 2.0 akhirnya lengkap! Ia mendominasi tangga lagu segera setelah dirilis. Di tengah pengejaran dan blokade Deepseek, Qwen, dan o3, Google merilis tiga model sekaligus pagi ini: Gemini 2.0 Pro, Gemini 2.0 Flash, dan Gemini 2.0 Flash-Lite. Pada peringkat LMSYS model besar, Gemini…

Dialog a16z dengan CEO berusia 27 tahun: Agen AI memiliki efek leverage yang besar, dan harga jangka panjang akan dikaitkan dengan biaya tenaga kerja

Uncategorized

Dialog a16z dengan CEO berusia 27 tahun: Agen AI memiliki efek leverage yang besar, dan harga jangka panjang akan dikaitkan dengan biaya tenaga kerja

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan AI Agent membentuk kembali pengalaman pelanggan Jesse Zhang: Bagaimana Agen sebenarnya dibangun? Pandangan kami adalah bahwa seiring berjalannya waktu, Agen akan semakin mirip dengan Agen berbasis bahasa alami karena begitulah cara model bahasa besar (LLM) dilatih. Dalam jangka panjang, jika Anda memiliki agen super cerdas yang…

Uncategorized

Cathie Wood: DeepSeek hanya mempercepat proses pengurangan biaya; struktur pasar yang sangat terkonsentrasi yang sebanding dengan Depresi Besar akan berubah

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan Persaingan dengan DeepSeek menguntungkan AS Cathie Wood: Saya pikir ini menunjukkan bahwa biaya inovasi menurun drastis, dan tren ini sudah dimulai. Misalnya, sebelum DeepSeek, biaya pelatihan kecerdasan buatan turun 75% per tahun, dan biaya inferensi bahkan turun 85% menjadi…

Uncategorized

Google telah merilis tiga model baru sekaligus: Gemini-2.0-Pro gratis, memiliki skor luar biasa dan menempati peringkat pertama, serta cocok untuk pengkodean dan pemrosesan perintah yang rumit!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Kisah Gemini 2.0 semakin cepat. Versi Flash Thinking Experimental pada bulan Desember menghadirkan model kerja dengan latensi rendah dan performa tinggi bagi para pengembang. Awal tahun ini, Flash Thinking Experimental 2.0 diperbarui di Google AI Studio untuk lebih meningkatkan performa dengan menggabungkan kecepatan Flash dengan kemampuan inferensi yang ditingkatkan. Minggu lalu,…

Uncategorized

Ali Qwen2.5-Max menyalip DeepSeek-V3! Netizen: AI China dengan cepat menutup celah

Olehzddeepseeker 5 Februari 20255 Februari 2025

Baru saja, model domestik lain ditambahkan ke daftar Big Model Arena dari Ali, Qwen2.5-Max, yang melampaui DeepSeek-V3 dan menduduki peringkat ketujuh dalam peringkat keseluruhan dengan skor total 1332. Model ini juga melampaui model seperti Claude 3.5 Sonnet dan Llama 3.1 405B dalam satu gerakan. Secara khusus, model ini unggul dalam pemrograman…

Berita terbaru! Peneliti DeepSeek mengungkapkan secara online: Pelatihan R1 hanya memakan waktu dua hingga tiga minggu, dan evolusi R1 nol yang kuat diamati selama liburan Tahun Baru Imlek

Uncategorized

Berita terbaru! Peneliti DeepSeek mengungkapkan secara online: Pelatihan R1 hanya memakan waktu dua hingga tiga minggu, dan evolusi R1 nol yang kuat diamati selama liburan Tahun Baru Imlek

Olehzddeepseeker 4 Februari 20254 Februari 2025

Berita terbaru! Peneliti DeepSeek mengungkapkan secara daring: Pelatihan R1 hanya memakan waktu dua hingga tiga minggu, dan evolusi hebat dari R1 zero diamati selama liburan Tahun Baru Imlek Baru saja, kami melihat bahwa peneliti DeepSeek Daya Guo menanggapi pertanyaan netizen tentang DeepSeek R1 dan rencana perusahaan ke depannya. Kami hanya bisa berkata…

DeepSeek R1 menempati urutan pertama dalam tes menulis kreatif, dan o3 mini bahkan lebih buruk daripada o1 mini!

Uncategorized

DeepSeek R1 menempati urutan pertama dalam tes menulis kreatif, dan o3 mini bahkan lebih buruk daripada o1 mini!

Olehzddeepseeker 3 Februari 20253 Februari 2025

DeepSeek R1 memenangkan kejuaraan dalam tes tolok ukur penulisan cerita pendek kreatif, berhasil mengungguli pemain dominan sebelumnya, Claude 3.5 Soneta! Tes tolok ukur Tes tolok ukur yang dirancang oleh peneliti Lech Mazur ini bukanlah kompetisi menulis biasa. Setiap model AI diharuskan menyelesaikan 500 cerita pendek, dan setiap cerita harus secara cerdik menggabungkan...