OpenAI'nin yeni piyasaya sürdüğü o3-mini ve DeepSeek R1'nin kapsamlı bir karşılaştırması

OpenAI en son çıkarım modelini yayınladı, o3-minibilim, matematik ve programlama gibi alanlar için optimize edilmiş olup daha hızlı yanıt, daha yüksek doğruluk ve daha düşük maliyet sağlar.

Selefi o1-mini ile karşılaştırıldığında, o3-mini özellikle karmaşık problemlerin çözümünde çıkarım yeteneklerini önemli ölçüde geliştirmiştir. Test kullanıcıları o3-mini'nin cevaplarını 56% oranında tercih ediyor ve hata oranı 39% oranında azaldı. Bugünden itibaren, ChatGPT Plus, Takım ve Profesyonel kullanıcılar o3-mini'yi kullanabilir ve ücretsiz kullanıcılar bazı özelliklerini de deneyimleyebilir.

Çıkarım modeli ile karşılaştırıldığında DeepSeek-R1ne kadar daha iyi olduğunu OpenAI o3-mini R1'den daha mı iyi?

Bu makale ilk olarak o3-mini'nin öne çıkan özelliklerine genel bir bakış sunacak ve ardından her bir kıyaslamada her iki taraftan verileri çıkaracak ve bunları görsel olarak karşılaştırmak için bir grafik oluşturacağız. Ayrıca, o3-mini'nin fiyatını da karşılaştıracağız.

İçindekiler

Önemli noktalar

1.STEM optimizasyonu: matematik, programlama, bilim vb. alanlarda üstündür, özellikle yüksek çıkarım çabası modunda o1-mini'yi geride bırakır.

2.Geliştirici fonksiyonları: üretim ortamının ihtiyaçlarını karşılamak için işlev çağrıları, yapılandırılmış çıktı ve geliştirici mesajları gibi işlevleri destekler.

3.Hızlı yanıt: 24%, istek başına 7,7 saniyelik yanıt süresiyle o1-mini'den daha hızlıdır.

4.Güvenlik iyileştirmesi: derin hizalama teknolojisi sayesinde güvenli ve güvenilir çıktı sağlar.

5.Uygun maliyetli: çıkarım yetenekleri ve maliyet optimizasyonu el ele gider ve yapay zeka kullanımı için eşiği büyük ölçüde azaltır.

Karşılaştırma

Açık Yapay Zeka Sınıfını vurgulamak için resmi blog sadece kendi modelleriyle karşılaştırmaktadır. Bu nedenle, bu makale DeepSeek R1 makalesinden ve resmi OpenAI blogundaki verilerden çıkarılmış bir tablodur.

OpenAI resmi olarak karşılaştırıyor o3-mini versiyon listesinde, çıkarım gücünü gösteren düşük, orta ve yüksek olmak üzere üç versiyona ayırır. DeepSeek Math-500'ü kullandığından ve OpenAI Math veri setini kullandığından, bu karşılaştırma burada kaldırılmıştır.

Grafik daha sezgiseldir ve Codeforces değerleri sezgisel olarak gösterilemeyecek kadar büyük olduğu için kaldırılmıştır. Ancak Codeforces'taki karşılaştırma, o3-mini'nin yüksek çıkarım gücünün pek de önde olmadığını göstermektedir.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Grafikte toplam 4 karşılaştırma var ve O3-mini (yüksek) genellikle önde gidiyor, ancak liderlik çok küçük.

Fiyat

model	Girdi fiyatı	Önbellek vuruşu	Çıktı fiyatı
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Özet

DeepSeek R1'nin Amerika Birleşik Devletleri'nde DeepSeek Paniğini tetiklemesiyle birlikte, kendini ilk tehdit altında hisseden OpenAI oldu ve bu durum özellikle yeni modeli o3-mini'nin fiyatlandırmasında açıkça görülüyor.

Openai o1 ilk piyasaya sürüldüğünde, yüksek fiyatı birçok geliştirici ve kullanıcı üzerinde baskı oluşturdu. DeepSeek R1'nin ortaya çıkması herkese daha fazla seçenek sundu.o1 ve R1 arasındaki 30 katlık fiyat farkından o3-mini'nin nihai fiyatının iki kat olmasına kadar DeepSeek R1'nin fiyatı,

DeepSeek R1'nin openai üzerindeki etkisini göstermektedir.Bununla birlikte, ChatGPT ücretsiz kullanıcıları o3-mini'yi yalnızca sınırlı bir şekilde deneyimleyebilirken, DeepSeek'nin Deep Thinking'i şu anda tüm kullanıcılar tarafından kullanılabilir.Ayrıca openai'nin kullanıcılar için kullanım maliyetini düşürürken daha fazla lider ai modeli getirmesini dört gözle bekliyorum.

Bir blog yazarının R1'i kullanarak edindiği kişisel deneyim açısından, R1'in Derin Düşünme özelliğinin her zaman zihnimi açtığını söylemek isterim. Herkesin sorunlar hakkında düşünmek için daha fazla kullanmasını tavsiye ederim~

Uncategorized

DeepSeek-R1-32B'ye yakındır ve Fei-Fei Li'nin s1'ini ezer! UC Berkeley ve diğer açık kaynaklı yeni SOTA çıkarım modelleri

Tarafındanzddeepseeker 14 Şubat 202514 Şubat 2025

32B çıkarım modeli verilerin yalnızca 1/8'ini kullanır ve aynı boyuttaki DeepSeek-R1 ile eşittir! Şu anda, Stanford, UC Berkeley ve Washington Üniversitesi gibi kurumlar ortaklaşa bir SOTA düzeyinde çıkarım modeli olan OpenThinker-32B'yi yayınladılar ve ayrıca 114k'ya kadar eğitim verisini açık kaynaklı hale getirdiler. OpenThinker Projesi ana sayfası: OpenThinker Hugging Face:…

Uncategorized

DeepSeek nasıl oluşturuldu? DeepSeek'nin büyüme geçmişinin analizi

Tarafındanzddeepseeker Şubat 3, 2025Şubat 3, 2025

Gelecekte, daha fazla ve daha sert yenilikler olacaktır. Şu anda bunu anlamak kolay olmayabilir, çünkü tüm sosyal grubun gerçeklerle eğitilmesi gerekiyor. Bu toplum hardcore inovasyon yapan insanların başarılı olmasına izin verdiğinde, kolektif zihniyet değişecektir. Sadece bir grup gerçeğe ve bir sürece ihtiyacımız var....

Uncategorized

Yapay zeka çemberinde DeepSeek R1, fiziksel testlerde o1 ve Claude'u istikrarlı bir şekilde geride bıraktı ve RL'nin altın çağına girdik.

Tarafındanzddeepseeker Şubat 1, 2025Şubat 1, 2025

Hiçbirimiz 2025'in yapay zeka alanında böyle başlayacağını beklemiyorduk. DeepSeek R1 gerçekten inanılmaz! Son zamanlarda, "gizemli Doğu gücü" DeepSeek Silikon Vadisi'ni "sıkı bir şekilde kontrol ediyor". R1'den Pisagor teoremini ayrıntılı olarak açıklamasını istedim. Tüm bunlar yapay zeka tarafından 30 saniyeden daha kısa bir sürede...

Uncategorized

Le Chat, yüz milyar dolarlık yatırımla listelerin başında yer alıyor. ABD ve Çin'den sonra üçüncü yapay zeka gücü mü?

Tarafındanzddeepseeker 11 Şubat 202511 Şubat 2025

9 Şubat'ta Fransa Cumhurbaşkanı Emmanuel Macron, Fransa'nın önümüzdeki birkaç yıl içinde AI alanına 109 milyar avro (113 milyar ABD doları) yatırım yapacağını duyurdu. Bu yatırım, Fransa'da bir AI parkı inşa etmek, altyapıyı iyileştirmek ve yerel AI girişimlerine yatırım yapmak için kullanılacak. Bu arada, Fransız bir girişim olan Mistral,…

Uncategorized

Cathie Wood: DeepSeek sadece maliyet düşürme sürecini hızlandırıyor; Büyük Buhran'a benzer aşırı yoğunlaşmış piyasa yapısı değişecek

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Önemli Noktalar DeepSeek ile rekabet ABD için iyi Cathie Wood: Bence bu, inovasyon maliyetinin önemli ölçüde düştüğünü ve bu eğilimin çoktan başladığını gösteriyor. Örneğin, DeepSeek'den önce, yapay zekayı eğitme maliyeti yılda 75% düştü ve çıkarım maliyeti bile 85% düştü...

Uncategorized

DeepSeek R1 makale yorumlama ve temel teknik noktalar

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

1 Arka Plan Bahar Festivali sırasında, DeepSeek R1 bir kez daha geniş ilgi gördü ve daha önce yazdığımız DeepSeek V3 yorumlama makalesi bile yeniden iletildi ve çokça tartışıldı. DeepSeek R1'nin birçok analizi ve yeniden üretimi olmasına rağmen, burada bazı ilgili okuma notlarını derlemeye karar verdik. Üç tane kullanacağız…

Önemli noktalar

Karşılaştırma

Fiyat

Özet

Benzer Yazılar

Bir yanıt yazın Yanıtı iptal et