গত সপ্তাহে, DeepSeek ঘোষণা করেছে যে তারা আগামী সপ্তাহে পাঁচটি প্রকল্প ওপেন সোর্স করবে: নেটিজেনরা বলেছেন, "এবার, OpenAI সত্যিই এখানে।" ঠিক এখনই, প্রথম ওপেন সোর্স প্রকল্প এসেছে, যা অনুমান ত্বরণের সাথে সম্পর্কিত, FlashMLA: ওপেন সোর্স প্রকল্পের ঠিকানা: DeepSeek FlashMLA এটি দুই ঘন্টা ধরে ওপেন সোর্স হয়েছে, এবং Github ইতিমধ্যেই 2.7k+ তারকা পেয়েছে: The…
FlashMLA দ্রুত কৃত্রিম বুদ্ধিমত্তার জগতে, বিশেষ করে বৃহৎ ভাষা মডেল (LLM) ক্ষেত্রে মনোযোগ আকর্ষণ করেছে। DeepSeek দ্বারা তৈরি এই উদ্ভাবনী টুলটি হপার জিপিইউ-এর জন্য ডিজাইন করা একটি অপ্টিমাইজড ডিকোডিং কার্নেল হিসেবে কাজ করে - উচ্চ-কার্যক্ষমতাসম্পন্ন চিপ যা সাধারণত AI গণনায় ব্যবহৃত হয়। FlashMLA পরিবর্তনশীল-দৈর্ঘ্যের ক্রমগুলির দক্ষ প্রক্রিয়াকরণের উপর দৃষ্টি নিবদ্ধ করে, যা এটিকে বিশেষভাবে উপযুক্ত করে তোলে...
ভূমিকা আজ, বৃহৎ ভাষা মডেল (LLM) একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। ২০২৫ সালের গোড়ার দিকে, AI-এর জন্য প্রতিযোগিতা তীব্র হওয়ার সাথে সাথে, Alibaba নতুন Qwen2.5-max AI মডেল চালু করে এবং চীনের Hangzhou-এর একটি কোম্পানি DeepSeek R1 মডেল চালু করে, যা LLM প্রযুক্তির শীর্ষস্থানকে প্রতিনিধিত্ব করে। Deepseek R1 হল একটি ওপেন সোর্স AI মডেল যা আকর্ষণ করেছে...
32B ইনফারেন্স মডেলটি মাত্র 1/8 ডেটা ব্যবহার করে এবং একই আকারের DeepSeek-R1 এর সাথে সংযুক্ত! এইমাত্র, স্ট্যানফোর্ড, ইউসি বার্কলে এবং ওয়াশিংটন বিশ্ববিদ্যালয়ের মতো প্রতিষ্ঠানগুলি যৌথভাবে একটি SOTA-স্তরের ইনফারেন্স মডেল, OpenThinker-32B প্রকাশ করেছে এবং 114k পর্যন্ত প্রশিক্ষণ ডেটাও ওপেন-সোর্স করেছে। OpenThinker প্রকল্পের হোমপেজ: OpenThinker Hugging Face:…