o3-mini ada di sini, dengan momentum seorang pencabar
Pada 31 Januari, OpenAI mengeluarkan model besar o3-mini serba baharu dan menyediakan beberapa fungsinya secara percuma kepada semua pengguna ChatGPT. Walaupun terdapat had pada bilangan pertanyaan, ia membolehkan pengguna mengalami model komersial terbaru OpenAI secepat mungkin.
Hanya beberapa hari yang lalu, DeepSeek, sebuah syarikat model besar dari China, mengeluarkan model sumber terbuka terbarunya, DeepSeek-R1, yang juga telah mewujudkan pengaruhnya sendiri dalam komuniti AI.
Model DeepSeek-R1 mempunyai keupayaan untuk memadankan model ai o1 terbuka, tetapi ia lebih murah. Lebih penting lagi, DeepSeek R1 ialah model sumber terbuka, yang merupakan perbezaan terbesar berbanding openai.
Persoalannya ialah: adakah o3-mini benar-benar lebih baik daripada DeepSeek-R1?
Dalam perbandingan data rasmi yang disediakan oleh OpenAI, hanya beberapa model yang dikeluarkan oleh OpenAI dibandingkan, dan hasilnya tidak dibandingkan secara langsung dengan model yang besar. Model DeepSeek R1. Walau bagaimanapun, beberapa data ujian penanda aras yang baru dikeluarkan menunjukkan bahawa o3-mini adalah lebih baik sedikit dalam banyak cara. Kita boleh memahami situasi ini dengan melihat markah ujian yang berbeza.
Mari biarkan data bercakap untuk dirinya sendiri dan menganalisis secara mendalam kekuatan sebenar kedua-dua model AI ini. Kadangkala data adalah satu perkara, tetapi lebih kerap ia juga bergantung pada pengalaman sebenar dan penggunaan pengguna.
Perbandingan data: o3-mini lebih pintar, tetapi DeepSeek-R1 lebih "matematik"
Skor purata keseluruhan
OpenAI o3-mini: 73.94
DeepSeek-R1: 71.38
Jelas sekali bahawa skor keseluruhan o3-mini adalah lebih tinggi sedikit, yang menunjukkan bahawa ia berfungsi dengan lebih stabil dalam tugasan yang komprehensif. Ia boleh menyelesaikan tugas dengan lebih stabil, tetapi ia tidak mempunyai jurang yang besar dengan model sumber terbuka DeepSeek.
Keupayaan penaakulan (keupayaan AI untuk memahami, menganalisis dan menaakul tentang maklumat)
OpenAI o3-mini: 89.58
DeepSeek-R1: 83.17
Dalam tugasan penaakulan, o3-mini jelas menang, yang bermaksud ia lebih baik dalam mengekstrak kandungan utama daripada maklumat yang kompleks dan membuat inferens logik.
Keupayaan pengaturcaraan (keupayaan AI untuk memproses kod)
OpenAI o3-mini: 82.74
DeepSeek-R1: 66.74
Jika anda seorang pembangun, o3-mini mungkin pilihan yang lebih baik. Markah menunjukkan perbezaan yang besar, dengan keupayaan pengekodan o3-mini dengan ketara mendahului DeepSeek-R1, dan dapat memahami dan menyelesaikan masalah pengaturcaraan dengan lebih baik. Ini juga merupakan kawasan di mana o3-mini mempunyai kelebihan yang agak besar
Keupayaan matematik (pengiraan, terbitan formula, penaakulan matematik)
OpenAI o3-mini: 65.65
DeepSeek-R1: 79.54
DeepSeek-R1 lebih kuat dalam tugasan matematik, menunjukkan bahawa ia lebih baik dalam pengiraan berangka dan penaakulan matematik.
Kemahiran analisis data (keupayaan memproses dan memahami data)
OpenAI o3-mini: 70.64
DeepSeek-R1: 69.78
o3-mini mempunyai sedikit petunjuk dalam tugas analisis data.
Kemahiran memahami bahasa
OpenAI o3-mini: 50.68
DeepSeek-R1: 48.53
Walaupun kelebihannya tidak hebat, o3-mini masih sedikit mengatasi prestasi dalam tugas bahasa.
Sambungan NYT (teka-teki)
o3-mini: 72.4 mata (prestasi cemerlang)
DeepSeek-R1: 54.4 mata
Peperiksaan Akhir Manusia (tugas kompleks)
o3-mini: 13.0% ketepatan
DeepSeek-R1: 9.4% ketepatan
Codeforces (ujian bakat pengaturcaraan)
o3-mini > DeepSeek-R1 AIME 2024 (kefahaman arahan yang kompleks)
o3-mini > DeepSeek-R1 Secara ringkasnya, o3-mini lebih kuat dalam penaakulan, pengaturcaraan dan bahasa, manakala DeepSeek-R1 lebih berfaedah dalam keupayaan matematik.
Perbandingan harga API: siapa yang lebih kos efektif?
DeepSeek-R1 lebih murah dari segi harga API, manakala o3-mini masih agak mahal:
DeepSeek-R1 adalah lebih murah dan oleh itu sesuai untuk pemaju pada bajet.
Sumber terbuka lwn. sumber tertutup: OpenAI masih ditutup
Jika anda mengambil berat tentang sumber terbuka, DeepSeek-R1 ialah pilihan yang lebih baik. Ia adalah sumber terbuka sepenuhnya, manakala o3-mini masih mengikut tradisi OpenAI dan kekal tertutup. Ini mungkin menjejaskan kebebasan pembangun dari segi pengoptimuman dan penyesuaian model.
Kesimpulan akhir: siapa yang lebih layak dipilih?
Dimensi | o3-mini (OpenAI) | DeepSeek-R1 |
Skor keseluruhan | 73.94 | 71.38 |
membuat inferens | 89.58 (lebih kuat) | 83.17 |
Pengaturcaraan | 82.74 (lebih kuat) | 66.74 |
Matematik | 65.65 | 79.54 |
Analisis data | 70.64 | 69.78 |
Pemahaman bahasa | 50.68 | 48.53 |
harga API | Lebih mahal | lebih murah |
Sumber terbuka | dekat | Sumber terbuka sepenuhnya |
untuk siapa?
- Jika anda seorang pemaju atau jurutera dan memerlukan keupayaan pengaturcaraan dan inferens yang kuat, o3-mini adalah pilihan yang lebih baik. Kami percaya bahawa open dan O3mini mempunyai prestasi yang sangat baik dalam bidang pengenalan dan inferens ini. Pada masa yang sama, keupayaan pengaturcaraan dan inferens yang lebih berkuasa juga boleh membantu anda menulis kod dan atur cara yang lebih baik, mengurangkan masa anda untuk pengubahsuaian dan pemeriksaan
- Jika anda seorang pengkaji matematik atau sensitif kepada kos API, DeepSeek-R1 ialah pilihan yang lebih menjimatkan. Model ini mempunyai sokongan dan bantuan yang lebih baik untuk penyelidik matematik, dan mempunyai kos penggunaan yang lebih sesuai
- Jika anda memerlukan model sumber terbuka, DeepSeek-R1 adalah pemenang. Jelas sekali, meta, yang memfokuskan pada sumber terbuka, tidak setanding dengan DeepSeek dalam beberapa keupayaan. Walau bagaimanapun, model besar openAI yang setanding adalah lebih mahal dan merupakan model sumber tertutup komersial. DeepSeek akan menerajui penyelidikan dan pembangunan AI, sambil membenarkan lebih banyak syarikat dan pengguna individu menggunakan model besar AI secara tempatan atau pada pelayan awan, melindungi keselamatan dan privasi data mereka
Tinjauan masa depan: persaingan untuk model AI semakin sengit
Kedua-dua OpenAI dan DeepSeek memacu pembangunan teknologi AI. Walaupun o3-mini pada masa ini lebih baik sedikit pada kebanyakan tugas, DeepSeek-R1 masih mempunyai kelebihan uniknya sendiri.
Sifat sumber terbuka DeepSeek telah menarik perhatian ramai pembangun dan pengguna. Harga yang lebih rendah juga meletakkan asas yang baik untuk pembangunan aplikasi AI.
Sebaliknya, OpenAI, sebagai peneraju dalam industri AI, mempunyai banyak inovasi dan pembangunan, tetapi model komersial tidak terbuka dan kos penggunaan yang tinggi telah meningkatkan ambang penggunaan, yang tidak kondusif untuk promosi AI.
Kami fikir deepseek melakukan kerja yang hebat untuk industri AI. Sumber terbuka akan memberi lebih banyak peluang kepada pembangun untuk mengetahui lebih lanjut tentang model Ai termaju.
Pada masa hadapan, kita mungkin melihat kemunculan model yang lebih berkuasa, seperti OpenAI GPT-5 atau DeepSeek-R2. Bagi pengguna biasa, AI yang terbaik bukanlah AI yang "paling kuat", tetapi AI yang paling sesuai dengan keperluan mereka. Apabila memilih model AI yang sesuai dengan anda, anda mesti mempertimbangkan senario dan belanjawan aplikasi anda sendiri.