zddeepseeker - Deepseek R1

En İyi Dört Modelin Karşılaşması! Bir İnceleme Deepseek R1'in Ne Kadar Güçlü Olduğunu Gösteriyor

Tarafındanzddeepseeker Haziran 1, 2025Haziran 1, 2025

Geçtiğimiz birkaç gün içinde Deepseek-R1 0528 resmi olarak açık kaynaklı hale getirildi. LiveCodeBench'te, performansı OpenAI'nin o3'üyle (yüksek) neredeyse aynı seviyede; Aider'in çok dilli kıyaslama testinde, Claude Opus'a karşı kendini koruyor. Resmi web sitesinde piyasaya sürüldüğünde, ön uç yeteneklerini hızla test ettik ve bunların olağanüstü olduğunu gördük…

Uncategorized

DeepSeek-R1-0528 Güncellemesi: Daha Derin Düşünme, Daha Güçlü Muhakeme

Tarafındanzddeepseeker 29 Mayıs 202529 Mayıs 2025

DeepSeek R1 modeli küçük bir sürüm yükseltmesinden geçti, mevcut sürüm DeepSeek-R1-0528. DeepSeek web sayfasına veya uygulamasına girdiğinizde, en son sürümü deneyimlemek için diyalog arayüzünde “Derin Düşünme” özelliğini etkinleştirin. DeepSeek-R1-0528 model ağırlıkları HuggingFace'e yüklendi Son dört ayda, DeepSeek-R1…

Uncategorized

DeepSeek, FlashMLA'nın kaynak kodunu ve ayrıntılı açıklamasını yayınladı

Tarafındanzddeepseeker 24 Şubat 202524 Şubat 2025

Geçtiğimiz hafta, DeepSeek önümüzdeki hafta beş projeyi açık kaynaklı hale getireceğini duyurdu: İnternet kullanıcıları, "Bu sefer, OpenAI gerçekten burada." dedi. Az önce, çıkarım hızlandırma ile ilgili ilk açık kaynaklı proje geldi, FlashMLA: Açık kaynaklı proje adresi: DeepSeek FlashMLA İki saattir açık kaynaklı ve Github'da halihazırda 2.7k+ yıldız var: The…

Uncategorized

Qwen2.5-max ve DeepSeek R1: Modellerin derinlemesine karşılaştırılması: Uygulama senaryolarının tam analizi

Tarafındanzddeepseeker 14 Şubat 202514 Şubat 2025

Giriş Günümüzde büyük dil modelleri (LLM'ler) önemli bir rol oynamaktadır. 2025'in başlarında, AI için rekabet yoğunlaştıkça, Alibaba yeni Qwen2.5-max AI modelini piyasaya sürdü ve Çin'in Hangzhou kentinden bir şirket olan DeepSeek, LLM teknolojisinin zirvesini temsil eden R1 modelini piyasaya sürdü. Deepseek R1, ilgi çeken açık kaynaklı bir AI modelidir…

Uncategorized

DeepSeek-R1-32B'ye yakındır ve Fei-Fei Li'nin s1'ini ezer! UC Berkeley ve diğer açık kaynaklı yeni SOTA çıkarım modelleri

Tarafındanzddeepseeker 14 Şubat 202514 Şubat 2025

32B çıkarım modeli verilerin yalnızca 1/8'ini kullanır ve aynı boyuttaki DeepSeek-R1 ile eşittir! Şu anda, Stanford, UC Berkeley ve Washington Üniversitesi gibi kurumlar ortaklaşa bir SOTA düzeyinde çıkarım modeli olan OpenThinker-32B'yi yayınladılar ve ayrıca 114k'ya kadar eğitim verisini açık kaynaklı hale getirdiler. OpenThinker Projesi ana sayfası: OpenThinker Hugging Face:…

Uncategorized

DeepSeek: Cherry Studio, Chatbox, AnythingLLM gibi Büyük Dil Modeli yönetim eserleri arasında verimliliğinizi kim hızlandırıyor?

Tarafındanzddeepseeker 11 Şubat 202511 Şubat 2025

Birçok kişi Deepseek Büyük Dil Modellerini yerel olarak dağıtmaya ve kullanmaya başladı ve Chatbox'ı görselleştirme aracı olarak kullanıyor. Bu makale, iki başka AI Büyük Dil Modeli yönetimi ve görselleştirme eserini tanıtmaya devam edecek ve AI Büyük Dil Modellerini daha verimli kullanmanıza yardımcı olmak için üçünü ayrıntılı olarak karşılaştıracaktır. 2025'te,…

Uncategorized

Le Chat, yüz milyar dolarlık yatırımla listelerin başında yer alıyor. ABD ve Çin'den sonra üçüncü yapay zeka gücü mü?

Tarafındanzddeepseeker 11 Şubat 202511 Şubat 2025

9 Şubat'ta Fransa Cumhurbaşkanı Emmanuel Macron, Fransa'nın önümüzdeki birkaç yıl içinde AI alanına 109 milyar avro (113 milyar ABD doları) yatırım yapacağını duyurdu. Bu yatırım, Fransa'da bir AI parkı inşa etmek, altyapıyı iyileştirmek ve yerel AI girişimlerine yatırım yapmak için kullanılacak. Bu arada, Fransız bir girişim olan Mistral,…

Uncategorized

Deepseek neyi başarabilir? OpenAI bile başaramaz mı?

Tarafındanzddeepseeker Şubat 10, 2025Şubat 10, 2025

DeepSeek'nin gerçek değeri küçümseniyor! DeepSeek-R1 şüphesiz pazara yeni bir coşku dalgası getirdi. Sadece ilgili sözde yararlanıcı hedefleri keskin bir şekilde artmakla kalmıyor, aynı zamanda bazı insanlar bundan para kazanmak amacıyla DeepSeek ile ilgili kurslar ve yazılımlar bile geliştirdiler. Bu fenomenlerin bir…

Uncategorized

Dünyanın ana akım AI ürünleri analiz ve kapsamlı kullanıcı deneyimi yönergelerine (DeepSeek ve GPT dahil) odaklanıyor

Tarafındanzddeepseeker Şubat 10, 2025Şubat 10, 2025

Fonksiyon konumlandırma ve temel avantaj analizi ChatGPT (OpenAI) – çok yönlüler için küresel ölçüt ChatGPT Teknik genler: temel avantajları genel konuşma becerileri ve mantıksal akıl yürütme olan, büyük modellerden oluşan GPT serisine dayalı üretken AI. Çok dilli işleme: Çince'de sürekli iyileştirme ile İngilizce'de en iyi performansı gösterir; ancak İngilizce'yi kullanmanızı öneririz…

Uncategorized

DeepSeek 1'in ardındaki sır | DeepSeekMath ve GRPO detayları

Tarafındanzddeepseeker 9 Şubat 20259 Şubat 2025

Bugün DeepSeek'den DeepSeekMath: Açık Dil Modellerinde Matematiksel Akıl Yürütmenin Sınırlarını Zorlamak başlıklı bir makale paylaşmak istiyorum. Bu makale, 120 milyar matematikle ilgili token, doğal dil ve kod verisi koleksiyonuna dayalı olarak DeepSeek-Coder-Base-v1.5 7B üzerinde önceden eğitilmiş olan DeepSeekMath 7B'yi tanıtıyor. Model, rekabetçi düzeyde 51.7% gibi şaşırtıcı bir puan elde etti…