zddeepseeker - Deepseek R1

Pertarungan Empat Model Teratas! Ulasan Menunjukkan Seberapa Kuat Deepseek R1

Olehzddeepseeker 1 Juni 20251 Juni 2025

Selama beberapa hari terakhir, Deepseek-R1 0528 telah resmi menjadi open source. Di LiveCodeBench, kinerjanya hampir setara dengan o3 (tinggi) milik OpenAI; dalam uji benchmark multibahasa Aider, ia mampu bersaing dengan Claude Opus. Ketika diluncurkan di situs web resmi, kami segera menguji kemampuan front-end-nya dan menemukan bahwa kemampuan itu sangat…

Uncategorized

Pembaruan DeepSeek-R1-0528: Pemikiran yang Lebih Dalam, Penalaran yang Lebih Kuat

Olehzddeepseeker 29 Mei 202529 Mei 2025

Model DeepSeek R1 telah mengalami sedikit peningkatan versi, dengan versi saat ini menjadi DeepSeek-R1-0528. Saat Anda memasuki halaman web atau aplikasi DeepSeek, aktifkan fitur “Deep Thinking” di antarmuka dialog untuk merasakan versi terbaru. Bobot model DeepSeek-R1-0528 telah diunggah ke HuggingFace Selama empat bulan terakhir, DeepSeek-R1 telah mengalami…

Uncategorized

DeepSeek telah merilis kode sumbernya, penjelasan rinci tentang FlashMLA

Olehzddeepseeker 24 Februari 202524 Februari 2025

Minggu lalu, DeepSeek mengumumkan akan membuka lima proyek sumber terbuka minggu depan: Netizen berkata, "Kali ini, OpenAI benar-benar hadir." Baru saja, proyek sumber terbuka pertama muncul, terkait dengan percepatan inferensi, FlashMLA: Alamat proyek sumber terbuka: DeepSeek FlashMLA Sudah menjadi sumber terbuka selama dua jam, dan Github sudah memiliki 2,7 ribu+ bintang: The…

Uncategorized

Qwen2.5-max vs DeepSeek R1: Perbandingan mendalam antara kedua model: analisis lengkap skenario aplikasi

Olehzddeepseeker 14 Februari 202514 Februari 2025

Pendahuluan Saat ini, model bahasa besar (LLM) memegang peranan penting. Pada awal tahun 2025, seiring dengan semakin ketatnya persaingan untuk AI, Alibaba meluncurkan model AI Qwen2.5-max yang baru, dan DeepSeek, sebuah perusahaan dari Hangzhou, Tiongkok, meluncurkan model R1, yang merupakan puncak dari teknologi LLM. Deepseek R1 adalah model AI sumber terbuka yang telah menarik…

Uncategorized

Ini mendekati DeepSeek-R1-32B dan mengalahkan s1 Fei-Fei Li! UC Berkeley dan model inferensi SOTA sumber terbuka lainnya

Olehzddeepseeker 14 Februari 202514 Februari 2025

Model inferensi 32B hanya menggunakan 1/8 data dan dikaitkan dengan DeepSeek-R1 dengan ukuran yang sama! Baru-baru ini, lembaga seperti Stanford, UC Berkeley, dan University of Washington telah bersama-sama merilis model inferensi tingkat SOTA, OpenThinker-32B, dan juga telah membuka sumber data pelatihan hingga 114k. Beranda OpenThinker Project: OpenThinker Hugging Face:…

Uncategorized

Artefak manajemen Model Bahasa Besar seperti DeepSeek: Cherry Studio, Chatbox, AnythingLLM, siapa akselerator efisiensi Anda?

Olehzddeepseeker 11 Februari 202511 Februari 2025

Banyak orang telah mulai menerapkan dan menggunakan Deepseek Large Language Models secara lokal, menggunakan Chatbox sebagai alat visualisasi. Artikel ini akan terus memperkenalkan dua artefak manajemen dan visualisasi AI Large Language Model lainnya, dan akan membandingkan ketiganya secara terperinci untuk membantu Anda menggunakan AI Large Language Models dengan lebih efisien. Pada tahun 2025,…

Uncategorized

Le Chat menduduki puncak tangga lagu, dengan investasi ratusan miliar dolar. Setelah AS dan China, apakah ini kekuatan AI ketiga?

Olehzddeepseeker 11 Februari 202511 Februari 2025

Pada tanggal 9 Februari, Presiden Prancis Emmanuel Macron mengumumkan bahwa Prancis akan menginvestasikan 109 miliar euro (113 miliar dolar AS) di bidang AI dalam beberapa tahun ke depan. Investasi ini akan digunakan untuk membangun taman AI di Prancis, meningkatkan infrastruktur, dan berinvestasi pada perusahaan rintisan AI lokal. Sementara itu, Mistral, perusahaan rintisan Prancis,…

Uncategorized

Apa yang bisa dicapai Deepseek? Bahkan OpenAI tidak bisa melakukannya?

Olehzddeepseeker 10 Februari 202510 Februari 2025

Nilai sebenarnya dari DeepSeek diremehkan! DeepSeek-R1 tidak diragukan lagi telah membawa gelombang antusiasme baru ke pasar. Tidak hanya target penerima manfaat yang relevan meningkat tajam, tetapi beberapa orang bahkan telah mengembangkan kursus dan perangkat lunak terkait DeepSeek dalam upaya untuk menghasilkan uang darinya. Kami percaya bahwa meskipun fenomena ini memiliki…

Uncategorized

Produk AI arus utama dunia berfokus pada analisis dan pedoman pengalaman pengguna yang komprehensif (termasuk DeepSeek dan GPT)

Olehzddeepseeker 10 Februari 202510 Februari 2025

Pemosisian fungsi dan analisis keunggulan inti ChatGPT (OpenAI) – tolok ukur global untuk semua kalangan ChatGPT Gen teknis: AI generatif berdasarkan rangkaian model besar GPT, dengan keterampilan percakapan umum dan penalaran logis sebagai keunggulan intinya. Pemrosesan multibahasa: berkinerja terbaik dalam bahasa Inggris, dengan peningkatan berkelanjutan dalam bahasa Mandarin; tetapi kami sarankan untuk menggunakan bahasa Inggris untuk…

Uncategorized

Rahasia di balik DeepSeek 1 | Rincian Matematika dan GRPO DeepSeekM

Olehzddeepseeker 9 Februari 20259 Februari 2025

Hari ini saya ingin berbagi artikel dari DeepSeek, berjudul DeepSeekMath: Mendorong Batas Penalaran Matematika dalam Model Bahasa Terbuka. Artikel ini memperkenalkan DeepSeekMath 7B, yang telah dilatih sebelumnya pada DeepSeek-Coder-Base-v1.5 7B berdasarkan kumpulan 120B token terkait matematika, bahasa alami, dan data kode. Model tersebut mencapai skor yang mencengangkan sebesar 51,7% dalam level kompetitif…