Genel - Deepseek R1

DeepSeek 1'in ardındaki sır | DeepSeekMath ve GRPO detayları

Uncategorized

DeepSeek 1'in ardındaki sır | DeepSeekMath ve GRPO detayları

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

Bugün DeepSeek'den DeepSeekMath: Açık Dil Modellerinde Matematiksel Akıl Yürütmenin Sınırlarını Zorlamak başlıklı bir makale paylaşmak istiyorum. Bu makale, 120 milyar matematikle ilgili token, doğal dil ve kod verisi koleksiyonuna dayalı olarak DeepSeek-Coder-Base-v1.5 7B üzerinde önceden eğitilmiş olan DeepSeekMath 7B'yi tanıtıyor. Model, rekabetçi düzeyde 51.7% gibi şaşırtıcı bir puan elde etti…

Uncategorized

DeepSeek-R1 teknolojisi ortaya çıkarıldı: Makalenin temel prensipleri açıklanıyor ve çığır açan model performansının anahtarı ortaya konuyor

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

Bugün DeepSeek R1'yi paylaşacağız, Başlık: DeepSeek-R1: Güçlendirme Öğrenimi ile LLM'lerde Muhakeme Yeteneğini Teşvik Etme: Güçlendirme öğrenimi ile LLM'nin muhakeme yeteneğini teşvik etme. Bu makale, DeepSeek'nin ilk nesil muhakeme modelleri olan DeepSeek-R1-Zero ve DeepSeek-R1'i tanıtıyor. DeepSeek-R1-Zero modeli, ilk adım olarak denetlenen ince ayar (SFT) olmadan büyük ölçekli güçlendirme öğrenimi (RL) yoluyla eğitildi,…

Uncategorized

DeepSeek R1 makale yorumlama ve temel teknik noktalar

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

1 Arka Plan Bahar Festivali sırasında, DeepSeek R1 bir kez daha geniş ilgi gördü ve daha önce yazdığımız DeepSeek V3 yorumlama makalesi bile yeniden iletildi ve çokça tartışıldı. DeepSeek R1'nin birçok analizi ve yeniden üretimi olmasına rağmen, burada bazı ilgili okuma notlarını derlemeye karar verdik. Üç tane kullanacağız…

Google'ın düşük maliyetli modeli Gemini 2.0 serisi saldırıyor: Büyük modellerde maliyet etkinliği için verilen mücadele yoğunlaşıyor

Uncategorized

Google'ın düşük maliyetli modeli Gemini 2.0 serisi saldırıyor: Büyük modellerde maliyet etkinliği için verilen mücadele yoğunlaşıyor

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Büyük AI modellerini kullanmanın yüksek maliyeti, birçok AI uygulamasının henüz uygulanmamış ve tanıtılmamış olmasının başlıca nedenidir. Aşırı performansı seçmek, sıradan kullanıcıların kabul edemeyeceği yüksek kullanım maliyetlerine yol açan büyük bilgi işlem gücü maliyetleri anlamına gelir. Büyük AI modelleri için rekabet, dumansız bir savaş gibidir. Sonrasında…

Gemini 2.0 listelere damga vururken, DeepSeek V3 fiyatıyla göz kamaştırıyor ve uygun fiyatlı yeni bir şampiyon doğuyor!

Uncategorized

Gemini 2.0 listelere damga vururken, DeepSeek V3 fiyatıyla göz kamaştırıyor ve uygun fiyatlı yeni bir şampiyon doğuyor!

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Google Gemini 2.0 ailesi sonunda tamamlandı! Yayınlandığı anda listelerde hakimiyet kuruyor. Deepseek, Qwen ve o3'ün takip ve engellemeleri arasında, Google bu sabah erken saatlerde üç modeli tek seferde yayınladı: Gemini 2.0 Pro, Gemini 2.0 Flash ve Gemini 2.0 Flash-Lite. Büyük model LMSYS sıralamalarında, Gemini…

a16z'nin 27 yaşındaki CEO'yla diyaloğu: AI Agent'ın büyük bir kaldıraç etkisi var ve uzun vadeli fiyatlandırma işçilik maliyetlerine bağlı olacak

Uncategorized

a16z'nin 27 yaşındaki CEO'yla diyaloğu: AI Agent'ın büyük bir kaldıraç etkisi var ve uzun vadeli fiyatlandırma işçilik maliyetlerine bağlı olacak

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Öne Çıkanlar AI Agent müşteri deneyimini yeniden şekillendiriyor Jesse Zhang: Bir Agent aslında nasıl oluşturulur? Bizim görüşümüze göre zamanla, büyük dil modelleri (LLM'ler) bu şekilde eğitildiği için giderek daha fazla doğal dil tabanlı bir Agent'a benzeyecek. Uzun vadede, eğer…

Uncategorized

Cathie Wood: DeepSeek sadece maliyet düşürme sürecini hızlandırıyor; Büyük Buhran'a benzer aşırı yoğunlaşmış piyasa yapısı değişecek

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Önemli Noktalar DeepSeek ile rekabet ABD için iyi Cathie Wood: Bence bu, inovasyon maliyetinin önemli ölçüde düştüğünü ve bu eğilimin çoktan başladığını gösteriyor. Örneğin, DeepSeek'den önce, yapay zekayı eğitme maliyeti yılda 75% düştü ve çıkarım maliyeti bile 85% düştü...

Uncategorized

Google üç yeni modeli aynı anda yayınladı: Gemini-2.0-Pro ücretsiz, olağanüstü bir puana sahip ve ilk sırada yer alıyor, ayrıca karmaşık komutları kodlamak ve işlemek için uygun!

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Gemini 2.0'ın hikayesi hızlanıyor. Aralık ayındaki Flash Thinking Experimental sürümü, geliştiricilere düşük gecikme ve yüksek performansa sahip çalışan bir model getirdi. Bu yılın başlarında, 2.0 Flash Thinking Experimental, Flash'ın hızını gelişmiş çıkarım yetenekleriyle birleştirerek performansı daha da iyileştirmek için Google AI Studio'da güncellendi. Geçtiğimiz hafta,…

DeepSeek TOP17 En İyi Alternatifler: Kapsamlı Analiz (2025)

Uncategorized

DeepSeek TOP17 En İyi Alternatifler: Kapsamlı Analiz (2025)

Tarafındandeepseeker 6 Şubat 20256 Şubat 2025

Giriş Hızla gelişen yapay zeka ortamında, DeepSeek güçlü bir dil modeli olarak ortaya çıkmıştır. Bu kapsamlı analiz, DeepSeek'ye en iyi 17 alternatifi inceleyerek benzersiz özelliklerini, yeteneklerini ve kullanım durumlarını incelemektedir. Araştırmamız, DeepSeek entegrasyonu veya benzer yetenekler sunan hem uluslararası hem de Çin platformlarına odaklanmaktadır. En İyi Alternatifler Analizi 1….

Uncategorized

Ali Qwen2.5-Max, DeepSeek-V3'ü geçti! Netizen: Çin'in yapay zekası hızla farkı kapatıyor

Tarafındanzddeepseeker 5 Şubat 20255 Şubat 2025

Az önce Ali'den Big Model Arena listesine bir başka yerli model daha eklendi, Qwen2.5-Max, DeepSeek-V3'ü geçti ve toplam 1332 puanla genel sıralamada yedinci oldu. Ayrıca Claude 3.5 Sonnet ve Llama 3.1 405B gibi modelleri de tek seferde geçti. Özellikle programlamada mükemmel…