OpenAI en son çıkarım modelini yayınladı, o3-minibilim, matematik ve programlama gibi alanlar için optimize edilmiş olup daha hızlı yanıt, daha yüksek doğruluk ve daha düşük maliyet sağlar.

Selefi o1-mini ile karşılaştırıldığında, o3-mini özellikle karmaşık problemlerin çözümünde çıkarım yeteneklerini önemli ölçüde geliştirmiştir. Test kullanıcıları o3-mini'nin cevaplarını 56% oranında tercih ediyor ve hata oranı 39% oranında azaldı. Bugünden itibaren, ChatGPT Plus, Takım ve Profesyonel kullanıcılar o3-mini'yi kullanabilir ve ücretsiz kullanıcılar bazı özelliklerini de deneyimleyebilir.

Çıkarım modeli ile karşılaştırıldığında DeepSeek-R1ne kadar daha iyi olduğunu OpenAI o3-mini R1'den daha mı iyi?

Bu makale ilk olarak o3-mini'nin öne çıkan özelliklerine genel bir bakış sunacak ve ardından her bir kıyaslamada her iki taraftan verileri çıkaracak ve bunları görsel olarak karşılaştırmak için bir grafik oluşturacağız. Ayrıca, o3-mini'nin fiyatını da karşılaştıracağız.

Önemli noktalar

1.STEM optimizasyonu: matematik, programlama, bilim vb. alanlarda üstündür, özellikle yüksek çıkarım çabası modunda o1-mini'yi geride bırakır.

2.Geliştirici fonksiyonları: üretim ortamının ihtiyaçlarını karşılamak için işlev çağrıları, yapılandırılmış çıktı ve geliştirici mesajları gibi işlevleri destekler.

3.Hızlı yanıt: 24%, istek başına 7,7 saniyelik yanıt süresiyle o1-mini'den daha hızlıdır.

4.Güvenlik iyileştirmesi: derin hizalama teknolojisi sayesinde güvenli ve güvenilir çıktı sağlar.

5.Uygun maliyetli: çıkarım yetenekleri ve maliyet optimizasyonu el ele gider ve yapay zeka kullanımı için eşiği büyük ölçüde azaltır.

Karşılaştırma

Açık Yapay Zeka Sınıfını vurgulamak için resmi blog sadece kendi modelleriyle karşılaştırmaktadır. Bu nedenle, bu makale DeepSeek R1 makalesinden ve resmi OpenAI blogundaki verilerden çıkarılmış bir tablodur.

OpenAI resmi olarak karşılaştırıyor o3-mini versiyon listesinde, çıkarım gücünü gösteren düşük, orta ve yüksek olmak üzere üç versiyona ayırır. DeepSeek Math-500'ü kullandığından ve OpenAI Math veri setini kullandığından, bu karşılaştırma burada kaldırılmıştır.

Grafik daha sezgiseldir ve Codeforces değerleri sezgisel olarak gösterilemeyecek kadar büyük olduğu için kaldırılmıştır. Ancak Codeforces'taki karşılaştırma, o3-mini'nin yüksek çıkarım gücünün pek de önde olmadığını göstermektedir.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Grafikte toplam 4 karşılaştırma var ve O3-mini (yüksek) genellikle önde gidiyor, ancak liderlik çok küçük.

Fiyat

modelGirdi fiyatıÖnbellek vuruşuÇıktı fiyatı
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

Özet

DeepSeek R1'nin Amerika Birleşik Devletleri'nde DeepSeek Paniğini tetiklemesiyle birlikte, kendini ilk tehdit altında hisseden OpenAI oldu ve bu durum özellikle yeni modeli o3-mini'nin fiyatlandırmasında açıkça görülüyor.

Openai o1 ilk piyasaya sürüldüğünde, yüksek fiyatı birçok geliştirici ve kullanıcı üzerinde baskı oluşturdu. DeepSeek R1'nin ortaya çıkması herkese daha fazla seçenek sundu.o1 ve R1 arasındaki 30 katlık fiyat farkından o3-mini'nin nihai fiyatının iki kat olmasına kadar DeepSeek R1'nin fiyatı,

DeepSeek R1'nin openai üzerindeki etkisini göstermektedir.Bununla birlikte, ChatGPT ücretsiz kullanıcıları o3-mini'yi yalnızca sınırlı bir şekilde deneyimleyebilirken, DeepSeek'nin Deep Thinking'i şu anda tüm kullanıcılar tarafından kullanılabilir.Ayrıca openai'nin kullanıcılar için kullanım maliyetini düşürürken daha fazla lider ai modeli getirmesini dört gözle bekliyorum.

Bir blog yazarının R1'i kullanarak edindiği kişisel deneyim açısından, R1'in Derin Düşünme özelliğinin her zaman zihnimi açtığını söylemek isterim. Herkesin sorunlar hakkında düşünmek için daha fazla kullanmasını tavsiye ederim~

Benzer Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir