Berita tergempar! OpenAI mengeluarkan 2 model inferens baharu hari ini: o3-mini dan o3-mini-high.

o3-mini dan o3-mini (tinggi) akan dikeluarkan hari ini.

Pengguna biasa juga akan mendapat o3-mini, dan pengguna tambahan akan dapat menggunakan o3-mini (tinggi).

o3-mini (tinggi) adalah kira-kira 200 mata lebih tinggi daripada o1 pada Codeforce, lebih pantas daripada o1, dan berprestasi lebih baik dalam pengekodan dan matematik, tetapi kosnya masih pada tahap o1-mini.

Plus pengguna boleh menggunakan o3-mini 100 kali sehari. Walau bagaimanapun, had penggunaan o3-mini (tinggi) perlu disahkan lagi.

Beberapa netizen berkata, ya, R1 sangat popular sehingga Openai tidak dapat menahan:

Dan sebelum ini, pasukan Alibaba Qwen mengeluarkan qwen2.5-max pada Malam Tahun Baru. Semasa Festival Musim Bunga, semua orang masih perlu berguling, hahaha…

Malah, seawal siaran langsung Krismas, Openai mengumumkan bahawa o3 mini akan tersedia pada awal 2025:

Jadual Kandungan

Kita masih perlu bercakap tentang apa itu o3 dan o3-mini?

o3: Model inferens canggih yang cemerlang dalam pengekodan, matematik dan juga ujian penanda aras berorientasikan AGI. Ia menetapkan penanda aras baharu untuk kecerdasan dan penyelesaian masalah.

o3-mini: Versi o3 kos efektif yang memberikan prestasi unggul pada kos dan kelajuan yang sangat rendah.

Model-model ini telah mengambil inferens ke tahap yang baru, menjadikan penemuan dalam tugas yang kompleks mungkin yang memerlukan pemahaman dan logik yang mendalam.

o3 membawa tiga kejayaan besar.

Keupayaan pengaturcaraan: 71.7% ketepatan dalam pengaturcaraan praktikal, 20% lebih tinggi daripada o1. 2727 mata pada Codeforces, sudah melepasi tahap manusia.

Tahap matematik: hampir 97% ketepatan dalam pusingan kelayakan Olympiad Matematik AS. Malah masalah matematik sempadan Epik AI yang paling sukar boleh mendapat keputusan 25%.

Perkara yang paling menakjubkan ialah ujian Arc AGI: 87.5%, mengatasi manusia buat kali pertama pada ujian penanda aras yang amat sukar ini.

Mengapakah o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.

Pemikiran adaptif: kedalaman penaakulan boleh dilaraskan mengikut kesukaran tugasan, dengan tiga mod untuk dipilih: rendah, sederhana dan tinggi.

Ini menjadikan AI lebih sejajar dengan senario penggunaan dunia sebenar.

Penembusan keberkesanan kos: kos yang lebih rendah daripada o1-mini, tindak balas yang lebih pantas dan hasil yang lebih baik.

Walau bagaimanapun, netizen mengeluh bahawa o3 tinggi menggunakan $1,000 setiap tugas:

Selain itu, memang terdapat terlalu banyak model yang tersedia, dan kami masih belum mengesahkan cara untuk menukar antara model tersebut.

Tidak dikategorikan

DeepSeek telah melakukannya! OpenAI mengakui kesilapan sumber tertutup, kelebihan kelebihan utama menjadi lebih kecil

Olehzddeepseeker 2 Februari 20252 Februari 2025

Selepas OpenAI mengeluarkan model o3-mini, Ketua Pegawai Eksekutifnya Sam Altman, Ketua Pegawai Penyelidik Mark Chen, Ketua Pegawai Produk Kevin Weil; Naib Presiden Kejuruteraan Srinivas Narayanan, Ketua Penyelidikan API Michelle Pokrass, dan Ketua Penyelidikan Hongyu Ren, menjalankan Soal Jawab teknikal dalam talian mengenai reddit, salah satu forum komprehensif terbesar di dunia. Topik utama…

Tidak dikategorikan

Perbandingan menyeluruh bagi o3-mini dan DeepSeek R1 yang baru dikeluarkan OpenAI

Olehzddeepseeker 1 Februari 20251 Februari 2025

OpenAI telah mengeluarkan model inferens terbaharunya, o3-mini, yang dioptimumkan untuk bidang seperti sains, matematik dan pengaturcaraan, memberikan respons yang lebih pantas, ketepatan yang lebih tinggi dan kos yang lebih rendah. Berbanding dengan pendahulunya o1-mini, o3-mini telah meningkatkan dengan ketara keupayaan inferensnya, terutamanya dalam menyelesaikan masalah yang kompleks. Penguji lebih suka jawapan o3-mini oleh 56%, dan kadar ralat mempunyai…

Tidak dikategorikan

Tafsiran kertas DeepSeek R1 & perkara teknikal utama

Olehzddeepseeker 9 Februari 20259 Februari 2025

1 Latar Belakang Semasa Pesta Musim Bunga, DeepSeek R1 sekali lagi menarik perhatian meluas, malah artikel tafsiran DeepSeek V3 yang kami tulis sebelum ini juga telah dihantar semula dan banyak dibincangkan. Walaupun terdapat banyak analisis dan pengeluaran semula DeepSeek R1, di sini kami telah memutuskan untuk menyusun beberapa nota bacaan yang sepadan. Kami akan menggunakan tiga…

Tidak dikategorikan

Gemini 2.0 mendominasi carta, manakala DeepSeek V3 menangis dalam harganya, dan juara kos efektif baharu dilahirkan!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Keluarga Google Gemini 2.0 akhirnya lengkap! Ia mendominasi carta sebaik sahaja ia dikeluarkan. Di tengah-tengah pengejaran dan sekatan Deepseek, Qwen dan o3, Google mengeluarkan tiga model sekali gus awal pagi ini: Gemini 2.0 Pro, Gemini 2.0 Flash dan Gemini 2.0 Flash-Lite. Pada kedudukan LMSYS model besar, Gemini…

Tidak dikategorikan

Dalam bulatan AI, DeepSeek R1 telah melepasi o1 dan Claude secara berterusan dalam ujian fizikal, dan kami telah memasuki zaman kegemilangan RL.

Olehzddeepseeker 1 Februari 20251 Februari 2025

Tiada seorang pun daripada kami menjangkakan bahawa ini adalah bagaimana 2025 akan bermula dalam bidang AI. DeepSeek R1 sungguh menakjubkan! Baru-baru ini, "kuasa Timur misterius" DeepSeek telah "kawal keras" Silicon Valley. Saya meminta R1 untuk menerangkan teorem Pythagoras secara terperinci. Semua ini dilakukan oleh AI dalam masa kurang daripada 30 saat tanpa sebarang…

Tidak dikategorikan

Model kos rendah Google, siri Gemini 2.0, sedang menyerang: pertempuran untuk keberkesanan kos dalam model besar semakin sengit

Olehzddeepseeker 8 Februari 20258 Februari 2025

Kos yang tinggi untuk menggunakan model AI yang besar adalah sebab utama mengapa banyak aplikasi AI masih belum dilaksanakan dan dipromosikan. Memilih prestasi melampau bermakna kos kuasa pengkomputeran yang besar, yang membawa kepada kos penggunaan yang tinggi yang tidak dapat diterima oleh pengguna biasa. Persaingan untuk model AI yang besar adalah seperti perang tanpa asap. Selepas…

Kita masih perlu bercakap tentang apa itu o3 dan o3-mini?

o3 membawa tiga kejayaan besar.

Mengapakah o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.

Catatan Serupa

Tinggalkan Balasan Batal balasan