Berita terbaru! OpenAI merilis 2 model inferensi baru hari ini: o3-mini dan o3-mini-high.

o3-mini dan o3-mini (high) akan dirilis hari ini.

Pengguna reguler juga akan mendapatkan o3-minidan ditambah lagi pengguna akan dapat menggunakan o3-mini (high).

o3-mini (tinggi) sekitar 200 poin lebih tinggi daripada o1 pada Codeforce, lebih cepat daripada o1, dan berkinerja lebih baik dalam pengkodean dan matematika, tetapi biayanya masih pada tingkat o1-mini.

Ditambah lagi, pengguna bisa menggunakan o3-mini sebanyak 100 kali sehari. Namun, batas penggunaan o3-mini (tinggi) perlu dikonfirmasi lebih lanjut.

Beberapa netizen mengatakan, ya, R1 sangat populer sehingga Openai tidak bisa menahan diri:

Dan sebelumnya, tim Alibaba Qwen merilis qwen2.5-max pada Malam Tahun Baru. Selama Festival Musim Semi, semua orang masih perlu berguling, hahaha...

Bahkan, sedini siaran langsung Natal, Openai mengumumkan bahwa o3 mini akan tersedia pada awal tahun 2025:

Daftar Isi

Kita masih perlu membahas tentang apa itu o3 dan o3-mini?

o3: Model inferensi mutakhir yang unggul dalam pengkodean, matematika, dan bahkan tes tolok ukur yang berorientasi pada AGI. Model ini menetapkan tolok ukur baru untuk kecerdasan dan pemecahan masalah.

o3-mini: Versi o3 yang hemat biaya yang memberikan performa superior dengan biaya dan kecepatan yang sangat rendah.

Model-model ini telah membawa inferensi ke tingkat yang sama sekali baru, memungkinkan terobosan dalam tugas-tugas kompleks yang membutuhkan pemahaman dan logika yang mendalam.

o3 membawa tiga terobosan besar.

Kemampuan pemrograman: Akurasi 71.7% dalam pemrograman praktis, 20% lebih tinggi dari o1. 2727 poin pada Codeforces, sudah melampaui level manusia.

Tingkat matematika: akurasi hampir 97% di babak kualifikasi Olimpiade Matematika AS. Bahkan soal matematika frontier Epic AI yang paling sulit pun bisa mendapatkan hasil 25%.

Yang paling menakjubkan adalah tes Arc AGI: 87,5%, melampaui manusia untuk pertama kalinya dalam tes benchmark yang sangat sulit ini.

Mengapa o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.

Pemikiran adaptif: kedalaman penalaran dapat disesuaikan dengan tingkat kesulitan tugas, dengan tiga mode yang dapat dipilih: rendah, sedang, dan tinggi.

Hal ini membuat AI lebih selaras dengan skenario penggunaan di dunia nyata.

Terobosan efektivitas biaya: biaya yang lebih rendah daripada o1-mini, respons yang lebih cepat, dan hasil yang lebih baik.

Namun, para netizen menyesalkan bahwa o3 high mengkonsumsi $1.000 per tugas:

Selain itu, memang ada terlalu banyak model yang tersedia, dan kami belum mengonfirmasi cara beralih di antara mereka.

Uncategorized

Apa yang bisa dicapai Deepseek? Bahkan OpenAI tidak bisa melakukannya?

Olehzddeepseeker 10 Februari 202510 Februari 2025

Nilai sebenarnya dari DeepSeek diremehkan! DeepSeek-R1 tidak diragukan lagi telah membawa gelombang antusiasme baru ke pasar. Tidak hanya target penerima manfaat yang relevan meningkat tajam, tetapi beberapa orang bahkan telah mengembangkan kursus dan perangkat lunak terkait DeepSeek dalam upaya untuk menghasilkan uang darinya. Kami percaya bahwa meskipun fenomena ini memiliki…

Uncategorized

Google telah merilis tiga model baru sekaligus: Gemini-2.0-Pro gratis, memiliki skor luar biasa dan menempati peringkat pertama, serta cocok untuk pengkodean dan pemrosesan perintah yang rumit!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Kisah Gemini 2.0 semakin cepat. Versi Flash Thinking Experimental pada bulan Desember menghadirkan model kerja dengan latensi rendah dan performa tinggi bagi para pengembang. Awal tahun ini, Flash Thinking Experimental 2.0 diperbarui di Google AI Studio untuk lebih meningkatkan performa dengan menggabungkan kecepatan Flash dengan kemampuan inferensi yang ditingkatkan. Minggu lalu,…

Uncategorized

DeepSeek telah merilis kode sumbernya, penjelasan rinci tentang FlashMLA

Olehzddeepseeker 24 Februari 202524 Februari 2025

Minggu lalu, DeepSeek mengumumkan akan membuka lima proyek sumber terbuka minggu depan: Netizen berkata, "Kali ini, OpenAI benar-benar hadir." Baru saja, proyek sumber terbuka pertama muncul, terkait dengan percepatan inferensi, FlashMLA: Alamat proyek sumber terbuka: DeepSeek FlashMLA Sudah menjadi sumber terbuka selama dua jam, dan Github sudah memiliki 2,7 ribu+ bintang: The…

Uncategorized

DeepSeek TOP17 Alternatif Terbaik: Analisis Komprehensif (2025)

Olehdeepseeker 6 Februari 20256 Februari 2025

Pendahuluan Dalam lanskap kecerdasan buatan yang berkembang pesat, DeepSeek telah muncul sebagai model bahasa yang kuat. Analisis komprehensif ini mengeksplorasi 17 alternatif teratas untuk DeepSeek, dengan memeriksa fitur, kemampuan, dan kasus penggunaan uniknya. Penelitian kami berfokus pada platform internasional dan Tiongkok yang menawarkan integrasi DeepSeek atau kemampuan serupa. Analisis Alternatif Teratas 1….

Uncategorized

Apa itu FlashMLA? Panduan Lengkap tentang Dampaknya pada Kernel Decoding AI

Olehdeepseeker 24 Februari 202524 Februari 2025

FlashMLA dengan cepat menarik perhatian di dunia kecerdasan buatan, khususnya di bidang model bahasa besar (LLM). Alat inovatif ini, yang dikembangkan oleh DeepSeek, berfungsi sebagai kernel decoding yang dioptimalkan yang dirancang untuk GPU Hopper—chip berperforma tinggi yang umum digunakan dalam komputasi AI. FlashMLA berfokus pada pemrosesan sekuens dengan panjang variabel yang efisien, sehingga sangat cocok untuk…

Uncategorized

Dialog a16z dengan CEO berusia 27 tahun: Agen AI memiliki efek leverage yang besar, dan harga jangka panjang akan dikaitkan dengan biaya tenaga kerja

Olehzddeepseeker 8 Februari 20258 Februari 2025

Sorotan AI Agent membentuk kembali pengalaman pelanggan Jesse Zhang: Bagaimana Agen sebenarnya dibangun? Pandangan kami adalah bahwa seiring berjalannya waktu, Agen akan semakin mirip dengan Agen berbasis bahasa alami karena begitulah cara model bahasa besar (LLM) dilatih. Dalam jangka panjang, jika Anda memiliki agen super cerdas yang…

Kita masih perlu membahas tentang apa itu o3 dan o3-mini?

o3 membawa tiga terobosan besar.

Mengapa o3-mini merupakan inovasi yang mengganggu? O3-mini membawa dua perubahan.

Posting serupa

Tinggalkan Balasan Batalkan balasan