Dalam bulatan AI, DeepSeek R1 telah melepasi o1 dan Claude secara berterusan dalam ujian fizikal, dan kami telah memasuki zaman kegemilangan RL.

Tiada seorang pun daripada kami menjangkakan bahawa ini adalah bagaimana 2025 akan bermula dalam bidang AI.

DeepSeek R1 sungguh menakjubkan!

Baru-baru ini, "kuasa misteri Timur" DeepSeek telah "mengawal keras" Silicon Valley.

Saya meminta R1 untuk menerangkan teorem Pythagoras secara terperinci. Semua ini dilakukan oleh AI dalam masa kurang daripada 30 saat tanpa sebarang kesilapan. Pendek kata, sudah berakhir.

Dalam kalangan AI dalam dan luar negara, netizen biasa telah menemui AI baharu yang menakjubkan dan berkuasa (yang juga sumber terbuka), dan pakar akademik telah menjerit "kita mesti mengejar". Terdapat juga khabar angin bahawa syarikat AI di luar negara sudah pun menghadapi ancaman besar.

Ambil sahaja DeepSeek R1 yang dikeluarkan minggu ini. Laluan pembelajaran pengukuhan tulen tanpa sebarang latihan yang diselia adalah mengejutkan. Daripada pembangunan pangkalan Deepseek-v3 pada Disember tahun lalu kepada keupayaan rantaian pemikiran semasa yang setanding dengan OpenAI o1, nampaknya ia hanya menunggu masa.

Tetapi sementara komuniti AI sedang sibuk membaca laporan teknikal dan membandingkan ukuran sebenar, orang ramai masih mempunyai keraguan tentang R1: selain daripada dapat mengatasi sekumpulan penanda aras, bolehkah ia benar-benar memimpin?

Jadual Kandungan

Bolehkah ia membina simulasi sendiri "undang-undang fizikal"?

Anda tidak percaya? Mari biarkan model besar bermain dengan pinball?

Dalam beberapa hari kebelakangan ini, sesetengah orang dalam komuniti AI telah menjadi terobsesi dengan ujian - menguji model besar AI yang berbeza (terutamanya yang dipanggil model penaakulan) untuk menyelesaikan masalah: "Tulis skrip Python untuk membuat bola kuning melantun di dalam kawasan tertentu. bentuk. Buat bentuk berputar perlahan-lahan dan pastikan bola kekal di dalam bentuk.”

Sesetengah model mengatasi yang lain dalam penanda aras "bola berputar" ini. Menurut CoreView CTO Ivan Fioravanti, DeepSeek, makmal kecerdasan buatan domestik, mempunyai model besar sumber terbuka R1 yang mengalahkan model o1 pro OpenAI, yang berharga $200 sebulan sebagai sebahagian daripada program ChatGPT Pro OpenAI.

Di sebelah kiri ialah OpenAI o1, dan di sebelah kanan ialah DeepSeek R1. Seperti yang dinyatakan di atas, gesaan di sini ialah: “tulis skrip ular sawa untuk bola kuning yang melantun dalam petak, pastikan anda mengendalikan pengesanan perlanggaran dengan betul. buat petak itu berputar perlahan-lahan. melaksanakannya dalam python. pastikan bola berada di dalam petak.”

Menurut pengguna lain di X, model Anthropic Claude 3.5 Sonnet dan Gemini 1.5 Pro Google membuat pertimbangan yang salah tentang prinsip fizikal, menyebabkan bola menyimpang daripada bentuknya. Sesetengah pengguna juga telah melaporkan bahawa Eksperimen Pemikiran Kilat Gemini 2.0 terbaru Google, serta OpenAI GPT-4o yang agak lama, lulus penilaian sekaligus.

Tetapi ada cara untuk membezakannya di sini:

Netizen di bawah tweet ini berkata: keupayaan o1 pada asalnya sangat baik, tetapi ia menjadi lebih lemah selepas OpenAI mengoptimumkan kelajuan, walaupun dengan versi keahlian $200/bulan.

Mensimulasikan bola yang melantun ialah cabaran pengaturcaraan klasik. Simulasi yang tepat menggabungkan algoritma pengesanan perlanggaran, yang perlu mengenal pasti apabila dua objek (seperti bola dan sisi bentuk) berlanggar. Algoritma yang ditulis secara tidak betul boleh menjejaskan prestasi simulasi atau menyebabkan ralat fizikal yang jelas.

N8 Programs, seorang penyelidik di permulaan AI Nous Research, berkata dia mengambil masa kira-kira dua jam untuk menulis bola yang melantun dalam heptagon berputar dari awal. "Berbilang sistem koordinat mesti dijejaki, pemahaman tentang cara perlanggaran dikendalikan dalam setiap sistem diperlukan, dan kod mesti direka bentuk dari awal untuk menjadi mantap."

Walaupun bola melantun dan bentuk berputar merupakan ujian yang munasabah bagi kemahiran pengaturcaraan, ia masih merupakan projek baharu untuk model besar, malah perubahan kecil dalam gesaan boleh menghasilkan hasil yang berbeza. Jadi jika ia akhirnya menjadi sebahagian daripada ujian penanda aras untuk model AI yang besar, ia masih perlu diperbaiki.

Walau apa pun, selepas gelombang ujian praktikal ini, kami dapat merasakan perbezaan keupayaan antara model besar.

DeepSeek ialah “mitos Lembah Silikon yang baharu

DeepSeek menyebabkan panik” di seluruh Pasifik.

Kakitangan Meta telah menyiarkan bahawa "Jurutera Meta sedang menganalisa DeepSeek untuk cuba menyalin apa sahaja yang mereka boleh daripadanya."

Alexandr Wang, pengasas permulaan teknologi AI Skala AI, juga secara terbuka menyatakan bahawa prestasi model besar AI DeepSeek secara kasarnya setara dengan model terbaik di Amerika Syarikat.

Beliau juga percaya bahawa Amerika Syarikat mungkin telah mendahului China dalam persaingan AI sepanjang dekad yang lalu, tetapi keluaran DeepSeek model besar AInya mungkin "mengubah segala-galanya."

X Blogger @8teAPi percaya bahawa DeepSeek bukanlah "projek sampingan" tetapi seperti bekas "Skunk Works" Lockheed Martin.

Apa yang dipanggil "Skunk Works" merujuk kepada pasukan kecil yang sangat sulit, agak bebas yang Lockheed Martin pada asalnya ditubuhkan untuk membangunkan banyak pesawat canggih, yang terlibat dalam penyelidikan dan pembangunan teknologi yang canggih atau tidak konvensional. Daripada pesawat peninjau U-2 dan SR-71 Blackbird kepada pesawat pejuang F-22 Raptor dan F-35 Lightning II, semuanya datang dari sini.

Kemudian, istilah ini secara beransur-ansur berkembang menjadi istilah generik yang digunakan untuk menggambarkan "kecil tetapi baik", pasukan inovasi yang agak bebas dan lebih fleksibel yang ditubuhkan dalam syarikat atau organisasi besar.

Dia memberi dua alasan:

Di satu pihak, DeepSeek mempunyai sejumlah besar GPU, dilaporkan lebih daripada 10,000, dan Alexandr Wang, Ketua Pegawai Eksekutif Skala AI, malah berkata ia boleh mencapai 50,000.
Sebaliknya, DeepSeek hanya merekrut bakat dari tiga universiti terbaik di China, yang bermakna DeepSeek adalah kompetitif seperti Alibaba dan Tencent.

Kedua-dua fakta ini sahaja menunjukkan bahawa DeepSeek telah jelas mencapai kejayaan komersial dan cukup terkenal untuk mendapatkan sumber-sumber ini.

Bagi kos pembangunan DeepSeek, penulis blog itu berkata syarikat teknologi China boleh menerima pelbagai subsidi, seperti kos elektrik yang rendah dan penggunaan tanah.

Oleh itu, kemungkinan besar kebanyakan kos DeepSeek telah "diletakkan" dalam akaun di luar perniagaan teras atau dalam bentuk beberapa jenis subsidi pembinaan pusat data.

Malah selain daripada pengasas, tiada siapa yang memahami sepenuhnya semua pengaturan kewangan. Sesetengah perjanjian mungkin hanya "perjanjian lisan" yang dimuktamadkan berdasarkan reputasi sahaja.

Walau apa pun, beberapa perkara adalah jelas:

Model ini sangat baik, setanding dengan versi yang dikeluarkan oleh OpenAI dua bulan lalu, dan sudah tentu ada kemungkinan ia tidak sebaik model baharu yang masih belum dikeluarkan OpenAI dan Anthropic.
Dari perspektif semasa, hala tuju penyelidikan masih didominasi oleh syarikat Amerika. Model DeepSeek ialah "susulan pantas" kepada versi o1, tetapi kemajuan penyelidikan dan pembangunan DeepSeek sangat pesat, mengejar lebih cepat daripada yang dijangkakan. Mereka tidak memplagiat atau menipu, paling banyak ia adalah kejuruteraan terbalik.
DeepSeek terutamanya melatih bakatnya sendiri, dan bukannya bergantung pada PhD terlatih Amerika, yang meluaskan kumpulan bakat.
Berbanding dengan syarikat AS, DeepSeek tertakluk kepada lebih sedikit kekangan dari segi pelesenan harta intelek, privasi, keselamatan, politik, dsb., dan terdapat lebih sedikit kebimbangan tentang penggunaan data yang salah yang orang tidak mahu dilatih. Terdapat lebih sedikit tindakan undang-undang, lebih sedikit peguam dan lebih sedikit kebimbangan.

Tidak dinafikan bahawa semakin ramai orang percaya bahawa 2025 akan menjadi tahun yang menentukan. Sementara itu, syarikat sedang bersiap sedia untuk itu. Meta, sebagai contoh, sedang membina pusat data 2GW+, dengan anggaran pelaburan $60-65 bilion menjelang 2025, dan akan mempunyai lebih daripada 1.3 juta GPU menjelang akhir tahun.

Meta juga menggunakan carta untuk membandingkan pusat data 2 gigawattnya dengan Manhattan, New York.

Tetapi kini DeepSeek telah melakukan yang lebih baik dengan kos yang lebih rendah dan GPU yang lebih sedikit. Bagaimana ini tidak boleh membuat orang bimbang?

Yann LeCun: Kami harus berterima kasih kepada CTO dan pengasas bersama yang sumber terbuka

Hiperbolik, Yuchen Jin, kerana menyiarkan bahawa dalam masa 4 hari sahaja, DeepSeek-R1 telah membuktikan 4 fakta kepada kami:

AI sumber terbuka hanya 6 bulan di belakang AI sumber tertutup
China mendominasi persaingan AI sumber terbuka
Kita sedang memasuki zaman kegemilangan pembelajaran pengukuhan model bahasa besar
Model penyulingan sangat berkuasa, dan kami akan menjalankan AI yang sangat pintar pada telefon mudah alih

Reaksi berantai yang dicetuskan oleh DeepSeek masih berterusan, seperti OpenAI o3-mini disediakan secara percuma, harapan dalam komuniti untuk mengurangkan perbincangan yang tidak jelas tentang AGI/ASI, dan khabar angin bahawa Meta sedang panik.

Dia percaya sukar untuk meramal siapa yang akhirnya akan menang, tetapi kita tidak harus melupakan kekuatan kelebihan pemain yang lewat. Lagipun, kita semua tahu bahawa Google yang mencipta Transformer, manakala OpenAI membuka kunci potensi sebenarnya.

Selain itu, pemenang Anugerah Turing dan Ketua Saintis AI Meta Yann LeCun turut menyatakan pandangannya.

“Bagi mereka yang, apabila melihat prestasi DeepSeek, berfikir, 'China mengatasi AS dalam AI,' anda silap. Pemahaman yang betul ialah model sumber terbuka mengatasi model proprietari.”

LeCun berkata bahawa sebab DeepSeek telah membuat percikan kali ini adalah kerana mereka telah mendapat manfaat daripada penyelidikan terbuka dan sumber terbuka (seperti Meta's PyTorch dan Llama). DeepSeek telah menghasilkan idea baharu dan dibina berdasarkan hasil kerja orang lain. Kerana kerja mereka dikeluarkan secara terbuka dan sumber terbuka, semua orang boleh mendapat manfaat daripadanya. Inilah kuasa penyelidikan terbuka dan sumber terbuka.

Renungan netizen berterusan. Walaupun mereka teruja dengan perkembangan teknologi baharu, mereka juga dapat merasakan sedikit suasana kebimbangan. Lagipun, kemunculan DeepSeekers mungkin memberi impak yang nyata.

Dalam bulatan AI, DeepSeek R1 telah melepasi o1 dan Claude secara berterusan dalam ujian fizikal, dan kami telah memasuki zaman kegemilangan RL.

Bolehkah ia membina simulasi sendiri "undang-undang fizikal"?

DeepSeek ialah “mitos Lembah Silikon yang baharu

Yann LeCun: Kami harus berterima kasih kepada CTO dan pengasas bersama yang sumber terbuka

Apakah FlashMLA? Panduan Komprehensif untuk Kesannya pada Inti Penyahkod AI

Pelancaran pertama! SiliconFlow X Huawei Cloud bersama-sama melancarkan perkhidmatan inferens DeepSeek R1 & V3 berdasarkan Ascend Cloud!

Kemas kini DeepSeek-R1-0528: Pemikiran Lebih Dalam, Penaakulan Lebih Kuat

Paper-DeepSeek-R1: Insentif Keupayaan Penaakulan dalam LLM melalui Pembelajaran Pengukuhan

Cathie Wood: DeepSeek hanya mempercepatkan proses pengurangan kos; struktur pasaran tertumpu yang melampau setanding dengan Kemelesetan Besar akan berubah

Teknologi DeepSeek-R1 didedahkan: prinsip teras kertas dipecahkan dan kunci kepada prestasi model terobosan didedahkan

Tinggalkan Balasan Batal balasan

Bolehkah ia membina simulasi sendiri "undang-undang fizikal"?

DeepSeek ialah “mitos Lembah Silikon yang baharu

Yann LeCun: Kami harus berterima kasih kepada CTO dan pengasas bersama yang sumber terbuka

Catatan Serupa

Tinggalkan Balasan Batal balasan