Perbandingan komprehensif OpenAI yang baru dikeluarkan o3-mini dan DeepSeek R1

OpenAI telah mengeluarkan model inferens terbarunya, o3-mini, yang dioptimumkan untuk bidang seperti sains, matematik dan pengaturcaraan, memberikan respons yang lebih pantas, ketepatan yang lebih tinggi dan kos yang lebih rendah.

Berbanding dengan pendahulunya o1-mini, o3-mini telah meningkatkan dengan ketara keupayaan inferensnya, terutamanya dalam menyelesaikan masalah yang kompleks. Penguji lebih suka jawapan o3-mini sebanyak 56%, dan kadar ralat telah dikurangkan sebanyak 39%. Mulai hari ini, ChatGPT Plus, Pasukan dan Pro pengguna boleh menggunakan o3-mini, dan pengguna percuma juga boleh mengalami beberapa cirinya.

Berbanding dengan model inferens DeepSeek-R1, betapa lebih baiknya OpenAI o3-mini daripada R1?

Artikel ini mula-mula akan memberikan gambaran keseluruhan tentang sorotan o3-mini, dan kemudian kami akan mengekstrak data dari kedua-dua belah pada setiap penanda aras dan membuat graf untuk membandingkannya secara visual. Selain itu, kami juga akan membandingkan harga o3-mini.

Jadual Kandungan

Sorotan teras

1.pengoptimuman STEM: cemerlang dalam bidang matematik, pengaturcaraan, sains, dsb., terutamanya mengatasi o1-mini dalam mod usaha inferens tinggi.

2.Fungsi pembangun: menyokong fungsi seperti panggilan fungsi, output berstruktur dan mesej pembangun untuk memenuhi keperluan persekitaran pengeluaran.

3.Respon cepat: 24% lebih pantas daripada o1-mini, dengan masa tindak balas 7.7 saat bagi setiap permintaan.

4.Peningkatan keselamatan: memastikan keluaran yang selamat dan boleh dipercayai melalui teknologi penjajaran dalam.

5.Kos efektif: keupayaan inferens dan pengoptimuman kos berjalan seiring, sekali gus mengurangkan ambang penggunaan AI.

Bandingkan

Buka AI Untuk menyerlahkan kelasnya, ia blog rasmi hanya membandingkannya dengan modelnya sendiri. Oleh itu, artikel ini adalah jadual yang diekstrak daripada kertas DeepSeek R1 dan data daripada blog rasmi OpenAI.

OpenAI secara rasmi membandingkan o3-mini dalam senarai versi, memecahkannya kepada tiga versi: rendah, sederhana dan tinggi, yang menunjukkan kekuatan inferens. Memandangkan DeepSeek menggunakan Math-500 dan OpenAI menggunakan dataset Matematik, perbandingan ini telah dialih keluar di sini.

Carta adalah lebih intuitif dan Codeforces telah dialih keluar kerana nilainya terlalu besar untuk dipaparkan secara intuitif. Walau bagaimanapun, perbandingan pada Codeforces menunjukkan bahawa kekuatan inferens tinggi o3-mini bukanlah petunjuk.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Disahkan

Daripada carta, terdapat sejumlah 4 perbandingan, dan O3-mini (tinggi) biasanya mendahului, tetapi petunjuknya sangat kecil.

harga

model	Harga input	Cache hit	Harga keluaran
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Ringkasan

Dengan DeepSeek R1 yang mencetuskan Panik DeepSeek di Amerika Syarikat, yang pertama merasa terancam ialah OpenAI, yang amat ketara dalam penetapan harga model baharunya o3-mini.

Apabila Openai o1 pertama kali dikeluarkan, harganya yang tinggi memberi tekanan kepada banyak pembangun dan pengguna. Kemunculan DeepSeek R1 memberi semua orang lebih banyak pilihan.Daripada perbezaan harga 30 kali ganda antara o1 dan R1 hingga harga akhir o3-mini menjadi dua kali ganda harga DeepSeek R1,

menunjukkan kesan DeepSeek R1 terhadap openai.Walau bagaimanapun, pengguna percuma ChatGPT hanya boleh mengalami o3-mini dengan cara yang terhad, manakala Pemikiran Dalam DeepSeek kini tersedia untuk semua pengguna.Saya juga berharap untuk openai membawa lebih banyak model ai terkemuka di samping mengurangkan kos penggunaan untuk pengguna.

Dari perspektif pengalaman peribadi blogger menggunakan R1, saya ingin mengatakan bahawa Pemikiran Dalam R1 sentiasa membuka fikiran saya. Saya mengesyorkan agar semua orang menggunakannya lebih banyak untuk memikirkan masalah~

Tidak dikategorikan

Apa yang boleh dicapai oleh Deepseek? Malah OpenAI tidak boleh melakukannya?

Olehzddeepseeker 10 Februari 202510 Februari 2025

Nilai sebenar DeepSeek dipandang remeh! DeepSeek-R1 sudah pasti telah membawa gelombang semangat baru ke pasaran. Bukan sahaja sasaran yang dipanggil benefisiari yang berkaitan meningkat dengan mendadak, malah sesetengah orang telah membangunkan kursus dan perisian berkaitan DeepSeek dalam usaha untuk menjana wang daripadanya. Kami percaya bahawa walaupun fenomena ini mempunyai…

Tidak dikategorikan

Altman: Kami silap tentang AI sumber terbuka! DeepSeek telah menjadikan OpenAI kurang berfaedah, dan yang seterusnya ialah GPT-5

Olehzddeepseeker 1 Februari 20251 Februari 2025

o3-mini tiba lewat malam, dan OpenAI akhirnya mendedahkan kad truf terbarunya. Semasa Soal Jawab AMA Reddit, Altman dengan mendalam mengaku bahawa dia telah berdiri di sisi yang salah dari AI sumber terbuka. Beliau berkata bahawa strategi dalaman sumber terbuka sedang dipertimbangkan, dan model itu akan terus dibangunkan, tetapi…

Tidak dikategorikan

Apakah FlashMLA? Panduan Komprehensif untuk Kesannya pada Inti Penyahkod AI

Olehdeepseeker 24 Februari 202524 Februari 2025

FlashMLA telah cepat mendapat perhatian dalam dunia kecerdasan buatan, khususnya dalam bidang model bahasa besar (LLM). Alat inovatif ini, yang dibangunkan oleh DeepSeek, berfungsi sebagai kernel penyahkodan yang dioptimumkan yang direka untuk GPU Hopper—cip berprestasi tinggi yang biasa digunakan dalam pengiraan AI. FlashMLA memfokuskan pada pemprosesan cekap jujukan panjang berubah-ubah, menjadikannya sangat sesuai…

Tidak dikategorikan

Kemas kini DeepSeek-R1-0528: Pemikiran Lebih Dalam, Penaakulan Lebih Kuat

Olehzddeepseeker 29 Mei 202529 Mei 2025

Model DeepSeek R1 telah melalui peningkatan versi kecil, dengan versi semasa ialah DeepSeek-R1-0528. Apabila anda memasuki halaman web atau apl DeepSeek, dayakan ciri "Pemikiran Dalam" dalam antara muka dialog untuk mengalami versi terkini. Berat model DeepSeek-R1-0528 telah dimuat naik ke HuggingFace Sejak empat bulan lalu, DeepSeek-R1 telah menjalani…

Tidak dikategorikan

Rahsia di sebalik DeepSeek 1 | Butiran DeepSeekMath dan GRPO

Olehzddeepseeker 9 Februari 20259 Februari 2025

Hari ini saya ingin berkongsi artikel daripada DeepSeek, bertajuk DeepSeekMath: Menolak Had Penaakulan Matematik dalam Model Bahasa Terbuka. Artikel ini memperkenalkan DeepSeekMath 7B, yang telah dilatih pada DeepSeek-Coder-Base-v1.5 7B berdasarkan koleksi 120B token berkaitan matematik, bahasa semula jadi dan data kod. Model itu mencapai skor menakjubkan 51.7% dalam peringkat kompetitif…

Tidak dikategorikan

DeepSeek TOP17 Alternatif Terbaik: Analisis Komprehensif (2025)

Olehdeepseeker 6 Februari 20256 Februari 2025

Pengenalan Dalam landskap kecerdasan buatan yang berkembang pesat, DeepSeek telah muncul sebagai model bahasa yang berkuasa. Analisis komprehensif ini meneroka 17 alternatif teratas kepada DeepSeek, meneliti ciri unik, keupayaan dan kes penggunaannya. Penyelidikan kami memfokuskan pada platform antarabangsa dan China yang menawarkan integrasi DeepSeek atau keupayaan serupa. Analisis Alternatif Teratas 1….

Perbandingan menyeluruh bagi o3-mini dan DeepSeek R1 yang baru dikeluarkan OpenAI

Sorotan teras

Bandingkan

harga

Ringkasan

Apa yang boleh dicapai oleh Deepseek? Malah OpenAI tidak boleh melakukannya?

Altman: Kami silap tentang AI sumber terbuka! DeepSeek telah menjadikan OpenAI kurang berfaedah, dan yang seterusnya ialah GPT-5

Apakah FlashMLA? Panduan Komprehensif untuk Kesannya pada Inti Penyahkod AI

Kemas kini DeepSeek-R1-0528: Pemikiran Lebih Dalam, Penaakulan Lebih Kuat

Rahsia di sebalik DeepSeek 1 | Butiran DeepSeekMath dan GRPO

DeepSeek TOP17 Alternatif Terbaik: Analisis Komprehensif (2025)

Tinggalkan Balasan Batal balasan

Sorotan teras

Bandingkan

harga

Ringkasan

Catatan Serupa

Tinggalkan Balasan Batal balasan