o3-mini dan o3-mini (tinggi) akan dikeluarkan hari ini.

Pengguna biasa juga akan mendapat o3-mini, dan pengguna tambahan akan dapat menggunakan o3-mini (tinggi).

o3-mini (tinggi) adalah kira-kira 200 mata lebih tinggi daripada o1 pada Codeforce, lebih pantas daripada o1, dan berprestasi lebih baik dalam pengekodan dan matematik, tetapi kosnya masih pada tahap o1-mini.

Plus pengguna boleh menggunakan o3-mini 100 kali sehari. Walau bagaimanapun, had penggunaan o3-mini (tinggi) perlu disahkan lagi.

Beberapa netizen berkata, ya, R1 sangat popular sehingga Openai tidak dapat menahan:

Dan sebelum ini, pasukan Alibaba Qwen mengeluarkan qwen2.5-max pada Malam Tahun Baru. Semasa Festival Musim Bunga, semua orang masih perlu berguling, hahaha…

Malah, seawal siaran langsung Krismas, Openai mengumumkan bahawa o3 mini akan tersedia pada awal 2025:

Kita masih perlu bercakap tentang apa itu o3 dan o3-mini?

o3: Model inferens canggih yang cemerlang dalam pengekodan, matematik dan juga ujian penanda aras berorientasikan AGI. Ia menetapkan penanda aras baharu untuk kecerdasan dan penyelesaian masalah.

o3-mini: Versi o3 kos efektif yang memberikan prestasi unggul pada kos dan kelajuan yang sangat rendah.

Model-model ini telah mengambil inferens ke tahap yang baru, menjadikan penemuan dalam tugas yang kompleks mungkin yang memerlukan pemahaman dan logik yang mendalam.

o3 membawa tiga kejayaan besar.

Keupayaan pengaturcaraan: 71.7% ketepatan dalam pengaturcaraan praktikal, 20% lebih tinggi daripada o1. 2727 mata pada Codeforces, sudah melepasi tahap manusia.

Tahap matematik: hampir 97% ketepatan dalam pusingan kelayakan Olympiad Matematik AS. Malah masalah matematik sempadan Epik AI yang paling sukar boleh mendapat keputusan 25%.

Perkara yang paling menakjubkan ialah ujian Arc AGI: 87.5%, mengatasi manusia buat kali pertama pada ujian penanda aras yang amat sukar ini.

Mengapakah o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.

Pemikiran adaptif: kedalaman penaakulan boleh dilaraskan mengikut kesukaran tugasan, dengan tiga mod untuk dipilih: rendah, sederhana dan tinggi.

Ini menjadikan AI lebih sejajar dengan senario penggunaan dunia sebenar.

Penembusan keberkesanan kos: kos yang lebih rendah daripada o1-mini, tindak balas yang lebih pantas dan hasil yang lebih baik.

Walau bagaimanapun, netizen mengeluh bahawa o3 tinggi menggunakan $1,000 setiap tugas:

Selain itu, memang terdapat terlalu banyak model yang tersedia, dan kami masih belum mengesahkan cara untuk menukar antara model tersebut.

Catatan Serupa

Tinggalkan Balasan

Alamat e-mel anda tidak akan disiarkan. Medan diperlukan ditanda dengan *