Son dakika haberleri! OpenAI bugün 2 yeni çıkarım modeli yayınladı: o3-mini ve o3-mini-high.

o3-mini ve o3-mini (yüksek) bugün piyasaya sürülecek.

Düzenli kullanıcılar ayrıca o3-minive artı kullanıcılar o3-mini (yüksek) kullanabilecektir.

o3-mini (yüksek) Codeforce'ta o1'den yaklaşık 200 puan daha yüksektir, o1'den daha hızlıdır ve kodlama ve matematikte daha iyi performans gösterir, ancak maliyet hala o1-mini seviyesindedir.

Plus kullanıcıları o3-mini'yi günde 100 kez kullanabilir. Ancak, o3-mini (yüksek) kullanım sınırının daha fazla onaylanması gerekmektedir.

Bazı netizenler, evet, R1 o kadar popüler ki Openai kendini tutamıyor dedi:

Ve daha önce, Alibaba Qwen ekibi Yılbaşı gecesi qwen2.5-max'ı yayınladı. Bahar Festivali sırasında, herkesin hala yuvarlanması gerekiyor, hahaha...

Aslında, Noel canlı yayını kadar erken, Openai, o3 mini'nin 2025'in başlarında satışa sunulacağını duyurdu:

İçindekiler

Hala o3 ve o3-mini'nin ne olduğu hakkında konuşmamız gerekiyor mu?

o3: Kodlama, matematik ve hatta AGI odaklı kıyaslama testlerinde üstünlük sağlayan son teknoloji bir çıkarım modeli. Zeka ve problem çözme için yeni bir ölçüt belirliyor.

o3-mini: o3'ün çok düşük maliyet ve hızda üstün performans sağlayan uygun maliyetli bir sürümü.

Bu modeller çıkarımı yepyeni bir seviyeye taşıyarak derinlemesine anlayış ve mantık gerektiren karmaşık görevlerde atılımlar yapılmasını mümkün kılmıştır.

o3 üç büyük atılım getiriyor.

Programlama yeteneği: Pratik programlamada 71.7% doğruluk, o1'den 20% daha yüksek. Codeforces'da 2727 puan, şimdiden insan seviyesini aştı.

Matematik seviyesi: ABD Matematik Olimpiyatı eleme turunda yaklaşık 97% doğruluk. En zor Epic AI frontier matematik problemlerinde bile 25% sonuç alınabiliyor.

En şaşırtıcı şey ise Arc AGI testi: 87.5%, bu son derece zor kıyaslama testinde ilk kez insanları geride bıraktı.

o3-mini neden yıkıcı bir yeniliktir? o3-mini iki değişiklik getiriyor.

Uyarlanabilir düşünme: muhakeme derinliği görevin zorluğuna göre ayarlanabilir, üç mod arasından seçim yapılabilir: düşük, orta ve yüksek.

Bu, yapay zekayı gerçek dünyadaki kullanım senaryolarıyla daha yakından uyumlu hale getirir.

Maliyet-etkinlik atılımı: o1-mini'den daha düşük maliyet, daha hızlı yanıt ve daha iyi sonuçlar.

Ancak, netizenler o3 high'ın görev başına $1,000 tükettiğinden yakınıyor:

Buna ek olarak, gerçekten de çok fazla model mevcut ve bunlar arasında nasıl geçiş yapılacağını henüz onaylamadık.

Uncategorized

Qwen2.5-max ve DeepSeek R1: Modellerin derinlemesine karşılaştırılması: Uygulama senaryolarının tam analizi

Tarafındanzddeepseeker 14 Şubat 202514 Şubat 2025

Giriş Günümüzde büyük dil modelleri (LLM'ler) önemli bir rol oynamaktadır. 2025'in başlarında, AI için rekabet yoğunlaştıkça, Alibaba yeni Qwen2.5-max AI modelini piyasaya sürdü ve Çin'in Hangzhou kentinden bir şirket olan DeepSeek, LLM teknolojisinin zirvesini temsil eden R1 modelini piyasaya sürdü. Deepseek R1, ilgi çeken açık kaynaklı bir AI modelidir…

Uncategorized

Deepseek neyi başarabilir? OpenAI bile başaramaz mı?

Tarafındanzddeepseeker Şubat 10, 2025Şubat 10, 2025

DeepSeek'nin gerçek değeri küçümseniyor! DeepSeek-R1 şüphesiz pazara yeni bir coşku dalgası getirdi. Sadece ilgili sözde yararlanıcı hedefleri keskin bir şekilde artmakla kalmıyor, aynı zamanda bazı insanlar bundan para kazanmak amacıyla DeepSeek ile ilgili kurslar ve yazılımlar bile geliştirdiler. Bu fenomenlerin bir…

Uncategorized

DeepSeek R1 yaratıcı yazma testinde birinci oldu ve o3 mini, o1 mini'den bile daha kötüydü!

Tarafındanzddeepseeker Şubat 3, 2025Şubat 3, 2025

DeepSeek R1, yaratıcı kısa öykü yazma kıyaslama testinde şampiyonluğu kazandı ve bir önceki baskın oyuncu Claude 3.5 Sonnet'i başarıyla geride bıraktı! Benchmark testi Araştırmacı Lech Mazur tarafından tasarlanan benchmark testi sıradan bir yazma yarışması değil. Her bir yapay zeka modelinin 500 kısa hikayeyi tamamlaması ve her bir hikayenin akıllıca...

Uncategorized

Yapay zeka çemberinde DeepSeek R1, fiziksel testlerde o1 ve Claude'u istikrarlı bir şekilde geride bıraktı ve RL'nin altın çağına girdik.

Tarafındanzddeepseeker Şubat 1, 2025Şubat 1, 2025

Hiçbirimiz 2025'in yapay zeka alanında böyle başlayacağını beklemiyorduk. DeepSeek R1 gerçekten inanılmaz! Son zamanlarda, "gizemli Doğu gücü" DeepSeek Silikon Vadisi'ni "sıkı bir şekilde kontrol ediyor". R1'den Pisagor teoremini ayrıntılı olarak açıklamasını istedim. Tüm bunlar yapay zeka tarafından 30 saniyeden daha kısa bir sürede...

Uncategorized

Google'ın düşük maliyetli modeli Gemini 2.0 serisi saldırıyor: Büyük modellerde maliyet etkinliği için verilen mücadele yoğunlaşıyor

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Büyük AI modellerini kullanmanın yüksek maliyeti, birçok AI uygulamasının henüz uygulanmamış ve tanıtılmamış olmasının başlıca nedenidir. Aşırı performansı seçmek, sıradan kullanıcıların kabul edemeyeceği yüksek kullanım maliyetlerine yol açan büyük bilgi işlem gücü maliyetleri anlamına gelir. Büyük AI modelleri için rekabet, dumansız bir savaş gibidir. Sonrasında…

Uncategorized

Altman: Açık kaynak yapay zeka konusunda yanılmışız! DeepSeek OpenAI'yi daha az avantajlı hale getirdi ve bir sonraki GPT-5

Tarafındanzddeepseeker Şubat 1, 2025Şubat 1, 2025

o3-mini gece geç saatlerde geldi ve OpenAI nihayet en son kozunu ortaya çıkardı. Reddit AMA Soru-Cevap sırasında Altman, açık kaynak yapay zekanın yanlış tarafında durduğunu derinden itiraf etti. Açık kaynağın iç stratejisinin değerlendirildiğini ve modelin geliştirilmeye devam edeceğini söyledi, ancak...

Hala o3 ve o3-mini'nin ne olduğu hakkında konuşmamız gerekiyor mu?

o3 üç büyük atılım getiriyor.

o3-mini neden yıkıcı bir yeniliktir? o3-mini iki değişiklik getiriyor.

Benzer Yazılar

Bir yanıt yazın Yanıtı iptal et