o3-mini dan o3-mini (high) akan dirilis hari ini.

Pengguna reguler juga akan mendapatkan o3-minidan ditambah lagi pengguna akan dapat menggunakan o3-mini (high).

o3-mini (tinggi) sekitar 200 poin lebih tinggi daripada o1 pada Codeforce, lebih cepat daripada o1, dan berkinerja lebih baik dalam pengkodean dan matematika, tetapi biayanya masih pada tingkat o1-mini.

Ditambah lagi, pengguna bisa menggunakan o3-mini sebanyak 100 kali sehari. Namun, batas penggunaan o3-mini (tinggi) perlu dikonfirmasi lebih lanjut.

Beberapa netizen mengatakan, ya, R1 sangat populer sehingga Openai tidak bisa menahan diri:

Dan sebelumnya, tim Alibaba Qwen merilis qwen2.5-max pada Malam Tahun Baru. Selama Festival Musim Semi, semua orang masih perlu berguling, hahaha...

Bahkan, sedini siaran langsung Natal, Openai mengumumkan bahwa o3 mini akan tersedia pada awal tahun 2025:

Kita masih perlu membahas tentang apa itu o3 dan o3-mini?

o3: Model inferensi mutakhir yang unggul dalam pengkodean, matematika, dan bahkan tes tolok ukur yang berorientasi pada AGI. Model ini menetapkan tolok ukur baru untuk kecerdasan dan pemecahan masalah.

o3-mini: Versi o3 yang hemat biaya yang memberikan performa superior dengan biaya dan kecepatan yang sangat rendah.

Model-model ini telah membawa inferensi ke tingkat yang sama sekali baru, memungkinkan terobosan dalam tugas-tugas kompleks yang membutuhkan pemahaman dan logika yang mendalam.

o3 membawa tiga terobosan besar.

Kemampuan pemrograman: Akurasi 71.7% dalam pemrograman praktis, 20% lebih tinggi dari o1. 2727 poin pada Codeforces, sudah melampaui level manusia.

Tingkat matematika: akurasi hampir 97% di babak kualifikasi Olimpiade Matematika AS. Bahkan soal matematika frontier Epic AI yang paling sulit pun bisa mendapatkan hasil 25%.

Yang paling menakjubkan adalah tes Arc AGI: 87,5%, melampaui manusia untuk pertama kalinya dalam tes benchmark yang sangat sulit ini.

Mengapa o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.

Pemikiran adaptif: kedalaman penalaran dapat disesuaikan dengan tingkat kesulitan tugas, dengan tiga mode yang dapat dipilih: rendah, sedang, dan tinggi.

Hal ini membuat AI lebih selaras dengan skenario penggunaan di dunia nyata.

Terobosan efektivitas biaya: biaya yang lebih rendah daripada o1-mini, respons yang lebih cepat, dan hasil yang lebih baik.

Namun, para netizen menyesalkan bahwa o3 high mengkonsumsi $1.000 per tugas:

Selain itu, memang ada terlalu banyak model yang tersedia, dan kami belum mengonfirmasi cara beralih di antara mereka.

Posting serupa

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *