
o3-mini tiba larut malam, dan OpenAI akhirnya mengungkapkan kartu truf terbarunya. Dalam sebuah tanya jawab Reddit AMA, Altman secara mendalam mengakui bahwa dia telah berdiri di sisi yang salah dari AI open source.
Ia mengatakan bahwa strategi internal open source sedang dipertimbangkan, dan model ini akan terus dikembangkan, namun keunggulan OpenAI tidak akan sebesar sebelumnya.
Ketika semua orang masih mengagumi kekuatan luar biasa dari DeepSeek, OpenAI akhirnya tidak bisa tinggal diam.
Pada dini hari kemarin, o3-mini segera diluncurkan, menetapkan SOTA baru dalam tes benchmark seperti kode matematika dan kembali ke singgasana.
Yang paling penting adalah pengguna gratis juga dapat merasakannya! o3-mini bukan main-main. Dalam "ujian terakhir bagi manusia", o3-mini (high) secara langsung mencapai akurasi dan kesalahan kalibrasi terbaik.

Beberapa jam setelahnya o3-mini mulai beroperasi secara onlineOpenAI secara resmi membuka Reddit AMA selama sekitar satu jam.
Altman sendiri juga online dan menjawab semua pertanyaan dari para netizen.

Sorotan utamanya adalah:
- DeepSeek memang sangat bagusdan kami akan terus mengembangkan model yang lebih baik, tetapi keunggulannya tidak akan sebesar sebelumnya
- Dibandingkan dengan beberapa tahun yang lalu, saya sekarang lebih cenderung percaya bahwa AI dapat mengalami lompatan yang cepat
- Kami berada di sisi yang salah dalam masalah model AI berbobot sumber terbuka
- Pembaruan untuk mode suara lanjutan akan segera hadir, dan kami akan menyebutnya GPT-5 secara langsung, bukan GPT-5o. Belum ada jadwal yang spesifik.
Selain Altman sendiri, Chief Research Officer Mark Chen, Chief Product Officer Kevin Weil, Vice President of Engineering Srinivas Narayanan, Head of API Research Michelle Pokrass, dan Head of Research Hongyu Ren juga turut online dan dengan cermat menjawab semua pertanyaan dari para netizen.
Selanjutnya, mari kita lihat apa yang mereka katakan.
Altman sangat menyesal, mengambil sisi yang salah dalam pertempuran AI open source
Kembalinya DeepSeek secara tiba-tiba mungkin tidak terduga oleh semua orang.
Selama tanya jawab AMA, Altman sendiri juga sangat menyesal telah mengambil sisi yang salah dalam pertarungan open source AI dan harus mengakui keunggulan DeepSeek yang kuat.
Yang mengherankan banyak orang adalah bahwa Altman bahkan mengatakan bahwa keunggulan OpenAI tidak sekuat dulu.
Berikut ini adalah jawaban klasik yang kami kumpulkan dari Altman.
T: Mari kita bicarakan topik besar minggu ini: Deepseek. Ini jelas merupakan model yang sangat mengesankan, dan saya tahu bahwa model ini mungkin dilatih di atas keluaran LLM lainnya. Bagaimana hal ini akan mengubah rencana Anda untuk model-model di masa depan?
Altman: Ini memang model yang sangat mengesankan! Kami akan mengembangkan model yang lebih baik, tetapi kami tidak akan dapat mempertahankan keunggulan besar seperti tahun-tahun sebelumnya.
T: Menurut Anda, apakah peningkatan diri secara rekursif akan menjadi proses yang bertahap atau tiba-tiba?
Altman: Secara pribadi, saya rasa saya lebih cenderung berpikir bahwa AI dapat membuat kemajuan yang pesat daripada beberapa tahun yang lalu. Mungkin sudah waktunya untuk menulis sesuatu tentang topik ini...
T: Dapatkah kita melihat semua token yang dipikirkan oleh model?
Altman: Ya, kami akan segera menampilkan versi yang lebih bermanfaat dan terperinci. Terima kasih kepada R1 untuk pembaruannya.
Kevin Weil, Chief Product Officer: Kami sedang berupaya untuk menampilkan lebih banyak daripada yang kami lakukan sekarang - ini akan segera terjadi. Apakah kami akan menampilkan semuanya atau tidak, masih harus ditentukan. Menampilkan semua rantai pemikiran (CoT) akan mengarah pada penyulingan model pesaing, tetapi kami juga tahu bahwa pengguna (setidaknya pengguna tingkat lanjut) ingin melihat hal ini, jadi kami akan menemukan keseimbangan yang baik.
T: Kapan versi lengkap o3 akan tersedia?
Altman: Saya perkirakan ini akan memakan waktu lebih dari beberapa minggu, tapi tidak lebih dari beberapa bulan.
T: Apakah akan ada pembaruan untuk mode suara? Apakah ini berpotensi menjadi fokus untuk GPT-5o? Berapa jangka waktu kasar untuk GPT-5o?
Altman: Ya, pembaruan untuk mode suara lanjutan akan segera hadir! Saya rasa kami akan menyebutnya GPT-5, bukan GPT-5o. Belum ada jadwal yang spesifik.
T: Apakah Anda akan mempertimbangkan untuk merilis beberapa bobot model dan mempublikasikan beberapa penelitian?
Altman: Ya, kami sedang mendiskusikannya. Saya pribadi berpikir bahwa kami berada di sisi yang salah dalam masalah ini dan perlu membuat strategi open source yang berbeda; tidak semua orang di OpenAI memiliki pandangan yang sama, dan ini bukanlah prioritas utama kami saat ini.
Satu set pertanyaan lagi:
- Seberapa dekat kami dengan penawaran Operator dalam program Plus reguler?
- Apa saja prioritas utama departemen robotika?
- Bagaimana pendapat OpenAI tentang chip/TPU yang lebih khusus, seperti Trillium, Cerebras, dll.? Apakah OpenAI memperhatikan hal ini?
- Investasi apa yang dilakukan untuk melindungi nilai dari risiko masa depan di AGI dan ASI?
- Apa liburan Anda yang paling berkesan?
Altman:
- Beberapa bulan
- untuk menghasilkan robot yang benar-benar bagus dalam skala kecil dan belajar dari pengalaman
- GB200 saat ini sulit dikalahkan!
- Pilihan yang baik adalah meningkatkan kondisi batin Anda - ketahanan, kemampuan beradaptasi, ketenangan, kegembiraan, dll.
- Sulit untuk memilih! Tapi dua pilihan pertama yang terlintas dalam pikiran saya adalah: backpacking di Asia Tenggara atau safari di Afrika
T: Apakah Anda berencana menaikkan harga seri Plus?
Altman: Sebenarnya, saya ingin menguranginya secara bertahap.
T: Anggaplah sekarang adalah tahun 2030, dan Anda baru saja menciptakan sebuah sistem yang oleh kebanyakan orang disebut sebagai AGI. Sistem ini unggul dalam semua tes tolok ukur dan mengungguli para insinyur dan peneliti terbaik Anda dalam hal kecepatan dan kinerja. Apa selanjutnya? Selain "menaruhnya di situs web dan menawarkannya sebagai layanan", apakah Anda memiliki rencana lain?
Altman: Dampak yang paling penting, menurut saya, adalah mempercepat penemuan ilmiah, yang menurut saya merupakan faktor yang akan memberikan kontribusi terbesar dalam meningkatkan kualitas hidup.
Pembuatan gambar 4o, segera hadir
Selanjutnya, tanggapan dari anggota OpenAI lainnya ditambahkan.
T: Apakah Anda masih berencana meluncurkan generator gambar 4o?
Kevin Weil, Chief Product Officer: Ya! Dan menurut saya, penantian itu tidak sia-sia.
T: Bagus! Apakah ada jadwal kasarnya?
Kevin Weil, Chief Product Officer: Anda meminta saya untuk mendapatkan masalah. Mungkin beberapa bulan.
Dan pertanyaan serupa lainnya.
T: Kapan kita bisa melihat ChatGPT-5?
Kevin Weil, Chief Product Officer: Sesaat setelah o-17 mikro dan GPT-(π+1).
Dan pertanyaan lain muncul:
- Jenis agen apa lagi yang bisa kami harapkan?
- Dan juga menyediakan agen untuk pengguna gratis, yang dapat mempercepat adopsi...
- Adakah pembaruan pada versi baru DALL-E?
- Satu pertanyaan terakhir, dan ini adalah pertanyaan yang selalu ditanyakan oleh semua orang... Kapan AGI akan diimplementasikan?
Kevin Weil, Chief Product Officer:
- Lebih banyak agen: sangat, sangat segera. Saya pikir Anda akan senang.
- Pembuatan gambar berdasarkan 4o: dalam beberapa bulan lagi, saya tidak sabar menunggu Anda menggunakannya. Ini hebat.
- Ya
T: Apakah Anda berencana menambahkan fungsionalitas lampiran file ke model penalaran?
Srinivas Narayanan, Wakil Presiden Teknik: Sedang dalam pengembangan. Di masa depan, model penalaran akan dapat menggunakan alat yang berbeda, termasuk fungsi pencarian.
Kevin Weil, Chief Product Officer: Sekadar mengatakan, saya tidak sabar untuk melihat model penalaran yang dapat menggunakan alat bantu
T: Benarkah. Ketika Anda memecahkan masalah ini, beberapa skenario aplikasi AI yang sangat berguna akan terbuka. Bayangkan aplikasi ini mampu memahami konten dokumen kerja Anda sebesar 500GB.
Ketika Anda akan membalas email, sebuah panel akan terbuka di samping aplikasi email Anda yang terus menganalisis semua informasi yang terkait dengan orang tersebut, termasuk hubungan Anda, topik yang didiskusikan, pekerjaan sebelumnya, dll. Mungkin sesuatu dari dokumen yang sudah lama Anda lupakan akan ditandai karena sangat relevan dengan diskusi saat ini. Saya sangat menginginkan fitur ini.
Srinivas Narayanan, Wakil Presiden Teknik: Kami sedang berupaya untuk menambah panjang konteks. Belum ada tanggal pasti/pengumuman.
T: Seberapa pentingkah proyek Stargate bagi masa depan OpenAI? Kevin Weil, Chief Product Officer: Sangat penting. Semua yang telah kita lihat menunjukkan bahwa semakin banyak daya komputasi yang kita miliki, semakin baik model yang dapat kita buat dan semakin banyak produk berharga yang dapat kita ciptakan.
Saat ini kami sedang menskalakan model dalam dua dimensi - prapelatihan yang lebih besar dan lebih banyak pembelajaran penguatan (RL) / pelatihan "stroberi" - keduanya membutuhkan sumber daya komputasi.
Melayani ratusan juta pengguna juga membutuhkan sumber daya komputasi! Dan saat kami bergerak menuju produk agen yang lebih cerdas yang dapat bekerja untuk Anda secara terus menerus, hal ini juga membutuhkan sumber daya komputasi. Jadi, Anda dapat menganggap Stargate sebagai pabrik kami, tempat listrik/GPU diubah menjadi produk yang luar biasa.
T: Secara internal, model mana yang Anda gunakan sekarang? o4, o5 atau o6? Seberapa pintar model internal ini dibandingkan dengan o3?
Michelle Pokrass, Kepala Penelitian API: Kami telah kehilangan hitungan.
T: Izinkan kami berinteraksi dengan teks/kertas saat menggunakan fitur suara tingkat lanjut. Saya ingin dapat berbicara dengannya dan memerintahkannya untuk memodifikasi dokumen secara berulang.
Kevin Weil, Chief Product Officer: Ya! Kami memiliki banyak alat bantu hebat yang telah dikembangkan secara relatif independen - tujuannya adalah untuk memberikan alat bantu tersebut ke tangan Anda secepat mungkin.
Langkah selanjutnya adalah mengintegrasikan semua fitur ini sehingga Anda dapat berbicara dengan model, yang mencari dan memberi alasan pada saat yang sama, dan menghasilkan kanvas yang dapat menjalankan Python. Semua alat harus bekerja sama dengan lebih baik. Dan omong-omong, semua model membutuhkan akses alat penuh (model seri o saat ini tidak dapat menggunakan semua alat), yang juga akan diimplementasikan.
T: Kapan model o-series akan mendukung fungsi memori di ChatGPT?
Michelle Pokrass, Kepala Penelitian API: Sedang dalam pengembangan! Menyatukan semua fitur kami dengan model o-series adalah prioritas utama kami.
T: Apakah akan ada perbaikan besar pada 4o? Saya sangat menyukai GPT khusus, dan akan sangat bagus jika dapat ditingkatkan, atau jika kita dapat memilih model mana yang akan digunakan dalam GPT khusus (seperti o3 mini).
Michelle Pokrass, Kepala Penelitian API: Ya, kami belum selesai dengan seri 4o!