Selama beberapa hari terakhir, Deepseek-R1 0528 telah resmi menjadi open source. Di LiveCodeBench, kinerjanya hampir setara dengan o3 (tinggi) milik OpenAI; dalam uji benchmark multibahasa Aider, ia mampu bersaing dengan Claude Opus. Ketika diluncurkan di situs web resmi, kami segera menguji kemampuan front-end-nya dan menemukan bahwa kemampuan itu sangat…
Model DeepSeek R1 telah mengalami sedikit peningkatan versi, dengan versi saat ini menjadi DeepSeek-R1-0528. Saat Anda memasuki halaman web atau aplikasi DeepSeek, aktifkan fitur “Deep Thinking” di antarmuka dialog untuk merasakan versi terbaru. Bobot model DeepSeek-R1-0528 telah diunggah ke HuggingFace Selama empat bulan terakhir, DeepSeek-R1 telah mengalami…
Minggu lalu, DeepSeek mengumumkan akan membuka lima proyek sumber terbuka minggu depan: Netizen berkata, "Kali ini, OpenAI benar-benar hadir." Baru saja, proyek sumber terbuka pertama muncul, terkait dengan percepatan inferensi, FlashMLA: Alamat proyek sumber terbuka: DeepSeek FlashMLA Sudah menjadi sumber terbuka selama dua jam, dan Github sudah memiliki 2,7 ribu+ bintang: The…
FlashMLA dengan cepat menarik perhatian di dunia kecerdasan buatan, khususnya di bidang model bahasa besar (LLM). Alat inovatif ini, yang dikembangkan oleh DeepSeek, berfungsi sebagai kernel decoding yang dioptimalkan yang dirancang untuk GPU Hopper—chip berperforma tinggi yang umum digunakan dalam komputasi AI. FlashMLA berfokus pada pemrosesan sekuens dengan panjang variabel yang efisien, sehingga sangat cocok untuk…