Blog

  • Pertarungan Empat Model Teratas! Ulasan Menunjukkan Seberapa Kuat Deepseek R1
    Selama beberapa hari terakhir, Deepseek-R1 0528 telah resmi menjadi open source. Di LiveCodeBench, kinerjanya hampir setara dengan o3 (tinggi) milik OpenAI; dalam uji benchmark multibahasa Aider, ia mampu bersaing dengan Claude Opus. Ketika diluncurkan di situs web resmi, kami segera menguji kemampuan front-end-nya dan menemukan bahwa kemampuan itu sangat…
  • Pembaruan DeepSeek-R1-0528: Pemikiran yang Lebih Dalam, Penalaran yang Lebih Kuat
    Model DeepSeek R1 telah mengalami sedikit peningkatan versi, dengan versi saat ini menjadi DeepSeek-R1-0528. Saat Anda memasuki halaman web atau aplikasi DeepSeek, aktifkan fitur “Deep Thinking” di antarmuka dialog untuk merasakan versi terbaru. Bobot model DeepSeek-R1-0528 telah diunggah ke HuggingFace Selama empat bulan terakhir, DeepSeek-R1 telah mengalami…
  • DeepSeek telah merilis kode sumbernya, penjelasan rinci tentang FlashMLA
    Minggu lalu, DeepSeek mengumumkan akan membuka lima proyek sumber terbuka minggu depan: Netizen berkata, "Kali ini, OpenAI benar-benar hadir." Baru saja, proyek sumber terbuka pertama muncul, terkait dengan percepatan inferensi, FlashMLA: Alamat proyek sumber terbuka: DeepSeek FlashMLA Sudah menjadi sumber terbuka selama dua jam, dan Github sudah memiliki 2,7 ribu+ bintang: The…
  • Apa itu FlashMLA? Panduan Lengkap tentang Dampaknya pada Kernel Decoding AI
    FlashMLA dengan cepat menarik perhatian di dunia kecerdasan buatan, khususnya di bidang model bahasa besar (LLM). Alat inovatif ini, yang dikembangkan oleh DeepSeek, berfungsi sebagai kernel decoding yang dioptimalkan yang dirancang untuk GPU Hopper—chip berperforma tinggi yang umum digunakan dalam komputasi AI. FlashMLA berfokus pada pemrosesan sekuens dengan panjang variabel yang efisien, sehingga sangat cocok untuk…

Buat akun gratis Anda hari ini!