গত কয়েকদিন ধরে, Deepseek-R1 0528 আনুষ্ঠানিকভাবে ওপেন-সোর্স করা হয়েছে। LiveCodeBench-এ, এর পারফরম্যান্স প্রায় OpenAI-এর o3 (উচ্চ) এর সমান; Aider-এর বহু-ভাষা বেঞ্চমার্ক পরীক্ষায়, এটি Claude Opus-এর বিরুদ্ধে তার নিজস্ব অবস্থান ধরে রেখেছে। যখন এটি অফিসিয়াল ওয়েবসাইটে চালু করা হয়েছিল, তখন আমরা দ্রুত এর ফ্রন্ট-এন্ড ক্ষমতা পরীক্ষা করে দেখেছি যে সেগুলি ব্যতিক্রমী...
DeepSeek R1 মডেলটির একটি ছোটখাটো সংস্করণ আপগ্রেড করা হয়েছে, বর্তমান সংস্করণটি হল DeepSeek-R1-0528। আপনি যখন DeepSeek ওয়েবপেজ বা অ্যাপে প্রবেশ করবেন, তখন সর্বশেষ সংস্করণটি উপভোগ করার জন্য ডায়ালগ ইন্টারফেসে "ডিপ থিংকিং" বৈশিষ্ট্যটি সক্ষম করুন। DeepSeek-R1-0528 মডেলের ওজন HuggingFace-এ আপলোড করা হয়েছে গত চার মাস ধরে, DeepSeek-R1…
গত সপ্তাহে, DeepSeek ঘোষণা করেছে যে তারা আগামী সপ্তাহে পাঁচটি প্রকল্প ওপেন সোর্স করবে: নেটিজেনরা বলেছেন, "এবার, OpenAI সত্যিই এখানে।" ঠিক এখনই, প্রথম ওপেন সোর্স প্রকল্প এসেছে, যা অনুমান ত্বরণের সাথে সম্পর্কিত, FlashMLA: ওপেন সোর্স প্রকল্পের ঠিকানা: DeepSeek FlashMLA এটি দুই ঘন্টা ধরে ওপেন সোর্স হয়েছে, এবং Github ইতিমধ্যেই 2.7k+ তারকা পেয়েছে: The…
FlashMLA দ্রুত কৃত্রিম বুদ্ধিমত্তার জগতে, বিশেষ করে বৃহৎ ভাষা মডেল (LLM) ক্ষেত্রে মনোযোগ আকর্ষণ করেছে। DeepSeek দ্বারা তৈরি এই উদ্ভাবনী টুলটি হপার জিপিইউ-এর জন্য ডিজাইন করা একটি অপ্টিমাইজড ডিকোডিং কার্নেল হিসেবে কাজ করে - উচ্চ-কার্যক্ষমতাসম্পন্ন চিপ যা সাধারণত AI গণনায় ব্যবহৃত হয়। FlashMLA পরিবর্তনশীল-দৈর্ঘ্যের ক্রমগুলির দক্ষ প্রক্রিয়াকরণের উপর দৃষ্টি নিবদ্ধ করে, যা এটিকে বিশেষভাবে উপযুক্ত করে তোলে...