o3-mini ve o3-mini (yüksek) bugün piyasaya sürülecek.

Düzenli kullanıcılar ayrıca o3-minive artı kullanıcılar o3-mini (yüksek) kullanabilecektir.

o3-mini (yüksek) Codeforce'ta o1'den yaklaşık 200 puan daha yüksektir, o1'den daha hızlıdır ve kodlama ve matematikte daha iyi performans gösterir, ancak maliyet hala o1-mini seviyesindedir.

Plus kullanıcıları o3-mini'yi günde 100 kez kullanabilir. Ancak, o3-mini (yüksek) kullanım sınırının daha fazla onaylanması gerekmektedir.

Bazı netizenler, evet, R1 o kadar popüler ki Openai kendini tutamıyor dedi:

Ve daha önce, Alibaba Qwen ekibi Yılbaşı gecesi qwen2.5-max'ı yayınladı. Bahar Festivali sırasında, herkesin hala yuvarlanması gerekiyor, hahaha...

Aslında, Noel canlı yayını kadar erken, Openai, o3 mini'nin 2025'in başlarında satışa sunulacağını duyurdu:

Hala o3 ve o3-mini'nin ne olduğu hakkında konuşmamız gerekiyor mu?

o3: Kodlama, matematik ve hatta AGI odaklı kıyaslama testlerinde üstünlük sağlayan son teknoloji bir çıkarım modeli. Zeka ve problem çözme için yeni bir ölçüt belirliyor.

o3-mini: o3'ün çok düşük maliyet ve hızda üstün performans sağlayan uygun maliyetli bir sürümü.

Bu modeller çıkarımı yepyeni bir seviyeye taşıyarak derinlemesine anlayış ve mantık gerektiren karmaşık görevlerde atılımlar yapılmasını mümkün kılmıştır.

o3 üç büyük atılım getiriyor.

Programlama yeteneği: Pratik programlamada 71.7% doğruluk, o1'den 20% daha yüksek. Codeforces'da 2727 puan, şimdiden insan seviyesini aştı.

Matematik seviyesi: ABD Matematik Olimpiyatı eleme turunda yaklaşık 97% doğruluk. En zor Epic AI frontier matematik problemlerinde bile 25% sonuç alınabiliyor.

En şaşırtıcı şey ise Arc AGI testi: 87.5%, bu son derece zor kıyaslama testinde ilk kez insanları geride bıraktı.

o3-mini neden yıkıcı bir yeniliktir? o3-mini iki değişiklik getiriyor.

Uyarlanabilir düşünme: muhakeme derinliği görevin zorluğuna göre ayarlanabilir, üç mod arasından seçim yapılabilir: düşük, orta ve yüksek.

Bu, yapay zekayı gerçek dünyadaki kullanım senaryolarıyla daha yakından uyumlu hale getirir.

Maliyet-etkinlik atılımı: o1-mini'den daha düşük maliyet, daha hızlı yanıt ve daha iyi sonuçlar.

Ancak, netizenler o3 high'ın görev başına $1,000 tükettiğinden yakınıyor:

Buna ek olarak, gerçekten de çok fazla model mevcut ve bunlar arasında nasıl geçiş yapılacağını henüz onaylamadık.

Benzer Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir