zddeepseeker - Deepseek R1 - Sayfa 2 / 3

Uncategorized

DeepSeek-R1 teknolojisi ortaya çıkarıldı: Makalenin temel prensipleri açıklanıyor ve çığır açan model performansının anahtarı ortaya konuyor

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

Bugün DeepSeek R1'yi paylaşacağız, Başlık: DeepSeek-R1: Güçlendirme Öğrenimi ile LLM'lerde Muhakeme Yeteneğini Teşvik Etme: Güçlendirme öğrenimi ile LLM'nin muhakeme yeteneğini teşvik etme. Bu makale, DeepSeek'nin ilk nesil muhakeme modelleri olan DeepSeek-R1-Zero ve DeepSeek-R1'i tanıtıyor. DeepSeek-R1-Zero modeli, ilk adım olarak denetlenen ince ayar (SFT) olmadan büyük ölçekli güçlendirme öğrenimi (RL) yoluyla eğitildi,…

Uncategorized

DeepSeek R1 makale yorumlama ve temel teknik noktalar

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

1 Arka Plan Bahar Festivali sırasında, DeepSeek R1 bir kez daha geniş ilgi gördü ve daha önce yazdığımız DeepSeek V3 yorumlama makalesi bile yeniden iletildi ve çokça tartışıldı. DeepSeek R1'nin birçok analizi ve yeniden üretimi olmasına rağmen, burada bazı ilgili okuma notlarını derlemeye karar verdik. Üç tane kullanacağız…

Google'ın düşük maliyetli modeli Gemini 2.0 serisi saldırıyor: Büyük modellerde maliyet etkinliği için verilen mücadele yoğunlaşıyor

Uncategorized

Google'ın düşük maliyetli modeli Gemini 2.0 serisi saldırıyor: Büyük modellerde maliyet etkinliği için verilen mücadele yoğunlaşıyor

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Büyük AI modellerini kullanmanın yüksek maliyeti, birçok AI uygulamasının henüz uygulanmamış ve tanıtılmamış olmasının başlıca nedenidir. Aşırı performansı seçmek, sıradan kullanıcıların kabul edemeyeceği yüksek kullanım maliyetlerine yol açan büyük bilgi işlem gücü maliyetleri anlamına gelir. Büyük AI modelleri için rekabet, dumansız bir savaş gibidir. Sonrasında…

Gemini 2.0 listelere damga vururken, DeepSeek V3 fiyatıyla göz kamaştırıyor ve uygun fiyatlı yeni bir şampiyon doğuyor!

Uncategorized

Gemini 2.0 listelere damga vururken, DeepSeek V3 fiyatıyla göz kamaştırıyor ve uygun fiyatlı yeni bir şampiyon doğuyor!

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Google Gemini 2.0 ailesi sonunda tamamlandı! Yayınlandığı anda listelerde hakimiyet kuruyor. Deepseek, Qwen ve o3'ün takip ve engellemeleri arasında, Google bu sabah erken saatlerde üç modeli tek seferde yayınladı: Gemini 2.0 Pro, Gemini 2.0 Flash ve Gemini 2.0 Flash-Lite. Büyük model LMSYS sıralamalarında, Gemini…

a16z'nin 27 yaşındaki CEO'yla diyaloğu: AI Agent'ın büyük bir kaldıraç etkisi var ve uzun vadeli fiyatlandırma işçilik maliyetlerine bağlı olacak

Uncategorized

a16z'nin 27 yaşındaki CEO'yla diyaloğu: AI Agent'ın büyük bir kaldıraç etkisi var ve uzun vadeli fiyatlandırma işçilik maliyetlerine bağlı olacak

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Öne Çıkanlar AI Agent müşteri deneyimini yeniden şekillendiriyor Jesse Zhang: Bir Agent aslında nasıl oluşturulur? Bizim görüşümüze göre zamanla, büyük dil modelleri (LLM'ler) bu şekilde eğitildiği için giderek daha fazla doğal dil tabanlı bir Agent'a benzeyecek. Uzun vadede, eğer…

Uncategorized

Cathie Wood: DeepSeek sadece maliyet düşürme sürecini hızlandırıyor; Büyük Buhran'a benzer aşırı yoğunlaşmış piyasa yapısı değişecek

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Önemli Noktalar DeepSeek ile rekabet ABD için iyi Cathie Wood: Bence bu, inovasyon maliyetinin önemli ölçüde düştüğünü ve bu eğilimin çoktan başladığını gösteriyor. Örneğin, DeepSeek'den önce, yapay zekayı eğitme maliyeti yılda 75% düştü ve çıkarım maliyeti bile 85% düştü...

Uncategorized

Google üç yeni modeli aynı anda yayınladı: Gemini-2.0-Pro ücretsiz, olağanüstü bir puana sahip ve ilk sırada yer alıyor, ayrıca karmaşık komutları kodlamak ve işlemek için uygun!

Tarafındanzddeepseeker 8 Şubat 20258 Şubat 2025

Gemini 2.0'ın hikayesi hızlanıyor. Aralık ayındaki Flash Thinking Experimental sürümü, geliştiricilere düşük gecikme ve yüksek performansa sahip çalışan bir model getirdi. Bu yılın başlarında, 2.0 Flash Thinking Experimental, Flash'ın hızını gelişmiş çıkarım yetenekleriyle birleştirerek performansı daha da iyileştirmek için Google AI Studio'da güncellendi. Geçtiğimiz hafta,…

Uncategorized

Ali Qwen2.5-Max, DeepSeek-V3'ü geçti! Netizen: Çin'in yapay zekası hızla farkı kapatıyor

Tarafındanzddeepseeker 5 Şubat 20255 Şubat 2025

Az önce Ali'den Big Model Arena listesine bir başka yerli model daha eklendi, Qwen2.5-Max, DeepSeek-V3'ü geçti ve toplam 1332 puanla genel sıralamada yedinci oldu. Ayrıca Claude 3.5 Sonnet ve Llama 3.1 405B gibi modelleri de tek seferde geçti. Özellikle programlamada mükemmel…

Son dakika haberi! DeepSeek araştırmacısı çevrimiçi olarak şunları açıkladı: R1 eğitimi yalnızca iki ila üç hafta sürdü ve Çin Yeni Yılı tatili sırasında R1 sıfırının güçlü bir evrimi gözlemlendi

Uncategorized

Son dakika haberi! DeepSeek araştırmacısı çevrimiçi olarak şunları açıkladı: R1 eğitimi yalnızca iki ila üç hafta sürdü ve Çin Yeni Yılı tatili sırasında R1 sıfırının güçlü bir evrimi gözlemlendi

Tarafındanzddeepseeker 4 Şubat 20254 Şubat 2025

Son dakika! DeepSeek araştırmacısı çevrimiçi olarak şunları açıkladı: R1 eğitimi yalnızca iki ila üç hafta sürdü ve Çin Yeni Yılı tatili sırasında R1 sıfırının güçlü bir evrimi gözlemlendi Az önce, DeepSeek araştırmacısı Daya Guo'nun internet kullanıcılarının DeepSeek R1 ve şirketin gelecekteki planları hakkındaki sorularına yanıt verdiğini fark ettik. Sadece şunu söyleyebiliriz...

DeepSeek R1 yaratıcı yazma testinde birinci oldu ve o3 mini, o1 mini'den bile daha kötüydü!

Uncategorized

DeepSeek R1 yaratıcı yazma testinde birinci oldu ve o3 mini, o1 mini'den bile daha kötüydü!

Tarafındanzddeepseeker Şubat 3, 2025Şubat 3, 2025

DeepSeek R1, yaratıcı kısa öykü yazma kıyaslama testinde şampiyonluğu kazandı ve bir önceki baskın oyuncu Claude 3.5 Sonnet'i başarıyla geride bıraktı! Benchmark testi Araştırmacı Lech Mazur tarafından tasarlanan benchmark testi sıradan bir yazma yarışması değil. Her bir yapay zeka modelinin 500 kısa hikayeyi tamamlaması ve her bir hikayenin akıllıca...