
o3-mini dan o3-mini (tinggi) akan dikeluarkan hari ini.

Pengguna biasa juga akan mendapat o3-mini, dan pengguna tambahan akan dapat menggunakan o3-mini (tinggi).
o3-mini (tinggi) adalah kira-kira 200 mata lebih tinggi daripada o1 pada Codeforce, lebih pantas daripada o1, dan berprestasi lebih baik dalam pengekodan dan matematik, tetapi kosnya masih pada tahap o1-mini.

Plus pengguna boleh menggunakan o3-mini 100 kali sehari. Walau bagaimanapun, had penggunaan o3-mini (tinggi) perlu disahkan lagi.
Beberapa netizen berkata, ya, R1 sangat popular sehingga Openai tidak dapat menahan:


Dan sebelum ini, pasukan Alibaba Qwen mengeluarkan qwen2.5-max pada Malam Tahun Baru. Semasa Festival Musim Bunga, semua orang masih perlu berguling, hahaha…
Malah, seawal siaran langsung Krismas, Openai mengumumkan bahawa o3 mini akan tersedia pada awal 2025:


Kita masih perlu bercakap tentang apa itu o3 dan o3-mini?
o3: Model inferens canggih yang cemerlang dalam pengekodan, matematik dan juga ujian penanda aras berorientasikan AGI. Ia menetapkan penanda aras baharu untuk kecerdasan dan penyelesaian masalah.
o3-mini: Versi o3 kos efektif yang memberikan prestasi unggul pada kos dan kelajuan yang sangat rendah.
Model-model ini telah mengambil inferens ke tahap yang baru, menjadikan penemuan dalam tugas yang kompleks mungkin yang memerlukan pemahaman dan logik yang mendalam.
o3 membawa tiga kejayaan besar.
Keupayaan pengaturcaraan: 71.7% ketepatan dalam pengaturcaraan praktikal, 20% lebih tinggi daripada o1. 2727 mata pada Codeforces, sudah melepasi tahap manusia.
Tahap matematik: hampir 97% ketepatan dalam pusingan kelayakan Olympiad Matematik AS. Malah masalah matematik sempadan Epik AI yang paling sukar boleh mendapat keputusan 25%.
Perkara yang paling menakjubkan ialah ujian Arc AGI: 87.5%, mengatasi manusia buat kali pertama pada ujian penanda aras yang amat sukar ini.

Mengapakah o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.
Pemikiran adaptif: kedalaman penaakulan boleh dilaraskan mengikut kesukaran tugasan, dengan tiga mod untuk dipilih: rendah, sederhana dan tinggi.
Ini menjadikan AI lebih sejajar dengan senario penggunaan dunia sebenar.
Penembusan keberkesanan kos: kos yang lebih rendah daripada o1-mini, tindak balas yang lebih pantas dan hasil yang lebih baik.
Walau bagaimanapun, netizen mengeluh bahawa o3 tinggi menggunakan $1,000 setiap tugas:

Selain itu, memang terdapat terlalu banyak model yang tersedia, dan kami masih belum mengesahkan cara untuk menukar antara model tersebut.
