zddeepseeker - Deepseek R1 - Halaman 2 daripada 3

Tidak dikategorikan

Teknologi DeepSeek-R1 didedahkan: prinsip teras kertas dipecahkan dan kunci kepada prestasi model terobosan didedahkan

Olehzddeepseeker 9 Februari 20259 Februari 2025

Hari ini kami akan berkongsi DeepSeek R1, Tajuk: DeepSeek-R1: Mendorong Keupayaan Penaakulan dalam LLM melalui Pembelajaran Peneguhan: Mendorong keupayaan penaakulan LLM melalui pembelajaran peneguhan. Makalah ini memperkenalkan model penaakulan generasi pertama DeepSeek, DeepSeek-R1-Zero dan DeepSeek-R1. Model DeepSeek-R1-Zero telah dilatih melalui pembelajaran pengukuhan (RL) berskala besar tanpa penalaan halus (SFT) yang diselia sebagai langkah awal,…

Tidak dikategorikan

Tafsiran kertas DeepSeek R1 & perkara teknikal utama

Olehzddeepseeker 9 Februari 20259 Februari 2025

1 Latar Belakang Semasa Pesta Musim Bunga, DeepSeek R1 sekali lagi menarik perhatian meluas, malah artikel tafsiran DeepSeek V3 yang kami tulis sebelum ini juga telah dihantar semula dan banyak dibincangkan. Walaupun terdapat banyak analisis dan pengeluaran semula DeepSeek R1, di sini kami telah memutuskan untuk menyusun beberapa nota bacaan yang sepadan. Kami akan menggunakan tiga…

Model kos rendah Google, siri Gemini 2.0, sedang menyerang: pertempuran untuk keberkesanan kos dalam model besar semakin sengit

Tidak dikategorikan

Model kos rendah Google, siri Gemini 2.0, sedang menyerang: pertempuran untuk keberkesanan kos dalam model besar semakin sengit

Olehzddeepseeker 8 Februari 20258 Februari 2025

Kos yang tinggi untuk menggunakan model AI yang besar adalah sebab utama mengapa banyak aplikasi AI masih belum dilaksanakan dan dipromosikan. Memilih prestasi melampau bermakna kos kuasa pengkomputeran yang besar, yang membawa kepada kos penggunaan yang tinggi yang tidak dapat diterima oleh pengguna biasa. Persaingan untuk model AI yang besar adalah seperti perang tanpa asap. Selepas…

Gemini 2.0 mendominasi carta, manakala DeepSeek V3 menangis dalam harganya, dan juara kos efektif baharu dilahirkan!

Tidak dikategorikan

Gemini 2.0 mendominasi carta, manakala DeepSeek V3 menangis dalam harganya, dan juara kos efektif baharu dilahirkan!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Keluarga Google Gemini 2.0 akhirnya lengkap! Ia mendominasi carta sebaik sahaja ia dikeluarkan. Di tengah-tengah pengejaran dan sekatan Deepseek, Qwen dan o3, Google mengeluarkan tiga model sekali gus awal pagi ini: Gemini 2.0 Pro, Gemini 2.0 Flash dan Gemini 2.0 Flash-Lite. Pada kedudukan LMSYS model besar, Gemini…

dialog a16z dengan CEO berusia 27 tahun: AI Agent mempunyai kesan leverage yang besar, dan harga jangka panjang akan dikaitkan dengan kos buruh

Tidak dikategorikan

dialog a16z dengan CEO berusia 27 tahun: AI Agent mempunyai kesan leverage yang besar, dan harga jangka panjang akan dikaitkan dengan kos buruh

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan Ejen AI membentuk semula pengalaman pelanggan Jesse Zhang: Bagaimanakah Ejen sebenarnya dibina? Pandangan kami ialah dari masa ke masa, ia akan menjadi lebih dan lebih seperti Ejen berasaskan bahasa semula jadi kerana itulah cara model bahasa besar (LLM) dilatih. Dalam jangka panjang, jika anda mempunyai ejen super pintar yang…

Tidak dikategorikan

Cathie Wood: DeepSeek hanya mempercepatkan proses pengurangan kos; struktur pasaran tertumpu yang melampau setanding dengan Kemelesetan Besar akan berubah

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan Persaingan dengan DeepSeek bagus untuk Cathie Wood AS: Saya rasa ia menunjukkan bahawa kos inovasi menurun secara mendadak, dan trend ini telah pun bermula. Sebagai contoh, sebelum DeepSeek, kos latihan kecerdasan buatan jatuh sebanyak 75% setahun, dan kos inferens juga turun sebanyak 85% kepada…

Tidak dikategorikan

Google telah mengeluarkan tiga model baharu sekali gus: Gemini-2.0-Pro adalah percuma, mempunyai skor cemerlang dan menduduki tempat pertama, serta sesuai untuk pengekodan dan pemprosesan gesaan kompleks!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Kisah Gemini 2.0 semakin pantas. Versi Eksperimen Flash Thinking pada bulan Disember membawa pembangun model yang berfungsi dengan kependaman rendah dan prestasi tinggi. Awal tahun ini, 2.0 Flash Thinking Experimental telah dikemas kini dalam Google AI Studio untuk meningkatkan lagi prestasi dengan menggabungkan kelajuan Flash dengan keupayaan inferens yang dipertingkatkan. Minggu lepas,…

Tidak dikategorikan

Ali Qwen2.5-Max memintas DeepSeek-V3! Netizen: AI China dengan pantas menutup jurang

Olehzddeepseeker 5 Februari 20255 Februari 2025

Sebentar tadi, satu lagi model domestik telah ditambahkan ke senarai Big Model Arena daripada Ali, Qwen2.5-Max, yang melepasi DeepSeek-V3 dan menduduki tempat ketujuh dalam kedudukan keseluruhan dengan jumlah markah 1332. Ia juga mengatasi model seperti Claude 3.5 Sonnet dan Llama 3.1 405B dalam satu masa. Khususnya, ia cemerlang dalam pengaturcaraan…

Berita tergempar! Penyelidik DeepSeek mendedahkan dalam talian: Latihan R1 hanya mengambil masa dua hingga tiga minggu, dan evolusi kuat sifar R1 telah diperhatikan semasa cuti Tahun Baru Cina

Tidak dikategorikan

Berita tergempar! Penyelidik DeepSeek mendedahkan dalam talian: Latihan R1 hanya mengambil masa dua hingga tiga minggu, dan evolusi kuat sifar R1 telah diperhatikan semasa cuti Tahun Baru Cina

Olehzddeepseeker 4 Februari 20254 Februari 2025

Berita tergempar! Penyelidik DeepSeek mendedahkan dalam talian: Latihan R1 hanya mengambil masa dua hingga tiga minggu, dan evolusi sifar R1 yang kuat telah diperhatikan semasa cuti Tahun Baharu Cina Baru-baru ini, kami mendapati bahawa penyelidik DeepSeek Daya Guo menjawab soalan netizen tentang DeepSeek R1 dan rancangan syarikat ke hadapan. Kami hanya mampu berkata…

DeepSeek R1 mendapat tempat pertama dalam ujian penulisan kreatif, dan o3 mini lebih teruk daripada o1 mini!

Tidak dikategorikan

DeepSeek R1 mendapat tempat pertama dalam ujian penulisan kreatif, dan o3 mini lebih teruk daripada o1 mini!

Olehzddeepseeker 3 Februari 20253 Februari 2025

DeepSeek R1 memenangi kejuaraan dalam ujian penanda aras penulisan cerpen kreatif, berjaya mengatasi pemain dominan sebelumnya Claude 3.5 Sonnet! Ujian penanda aras Ujian penanda aras yang direka oleh penyelidik Lech Mazur bukanlah persaingan menulis biasa anda. Setiap model AI dikehendaki menyiapkan 500 cerpen, dan setiap cerita harus bijak menggabungkan…