DeepSeek তার সোর্স কোড প্রকাশ করেছে, FlashMLA - Deepseek R1 এর বিস্তারিত ব্যাখ্যা

গত সপ্তাহে, DeepSeek ঘোষণা করেছে যে তারা আগামী সপ্তাহে পাঁচটি প্রকল্প ওপেন সোর্স করবে:

নেটিজেনরা বলেছেন, "এবার, ওপেনএআই সত্যিই এখানে।"

এইমাত্র, প্রথম ওপেন সোর্স প্রকল্পটি এসেছে, যা ইনফারেন্স অ্যাক্সিলারেশন সম্পর্কিত, FlashMLA:

ওপেন সোর্স প্রকল্পের ঠিকানা:

DeepSeek ফ্ল্যাশএমএলএ

এটি দুই ঘন্টা ধরে ওপেন সোর্স হিসেবে কাজ করছে, এবং Github ইতিমধ্যেই ২.৭ হাজারেরও বেশি তারকা পেয়েছে:

প্রকল্পের মূল কাজ হল:

"FlashMLA হল Hopper GPU-এর জন্য একটি দক্ষ MLA ডিকোডিং কার্নেল, যা ভেরিয়েবল-লেংথ সিকোয়েন্স পরিবেশনের জন্য অপ্টিমাইজ করা হয়েছে।"

অনুবাদিত, এটি হল:

"FlashMLA হল একটি দক্ষ MLA ডিকোডিং কার্নেল যা NVIDIA Hopper আর্কিটেকচার GPU-এর জন্য অপ্টিমাইজ করা হয়েছে, বিশেষ করে এমন পরিষেবা পরিস্থিতির জন্য অপ্টিমাইজ করা হয়েছে যা পরিবর্তনশীল-দৈর্ঘ্যের ক্রম প্রক্রিয়া করে।"

সংক্ষেপে:

FlashMLA হল একটি দক্ষ ডিকোডিং কোর যা DeepInference দ্বারা Hopper-আর্কিটেকচার GPU-এর জন্য ডিজাইন করা হয়েছে (যেমন H800)। পরিবর্তনশীল-দৈর্ঘ্যের সিকোয়েন্সের মাল্টি-হেড পটেনশিয়াল অ্যাটেনশন ক্যালকুলেশন অপ্টিমাইজ করে, এটি ডিকোডিং পর্যায়ে 3000GB/s মেমরি ব্যান্ডউইথ এবং 580TFLOPS কম্পিউটিং পাওয়ারের চূড়ান্ত কর্মক্ষমতা অর্জন করে, যা বৃহৎ মডেলগুলির জন্য দীর্ঘ প্রেক্ষাপটের সাথে যুক্তির দক্ষতা উল্লেখযোগ্যভাবে উন্নত করে।

কিছু নেটিজেন বলেছেন:

কিছু লোক ইতিমধ্যেই এটি ব্যবহার করছে, এবং তারা বলে পিওর ইঞ্জিনিয়ারিং:

এই প্রকল্পটি ইঞ্জিনিয়ারিং অপ্টিমাইজেশনের অন্তর্গত এবং হার্ডওয়্যারের কর্মক্ষমতাকে এমনভাবে চেপে ধরে যে সীমা।

প্রকল্পটি সম্পূর্ণরূপে ব্যবহারের জন্য প্রস্তুত।

পরিবেশগত প্রয়োজনীয়তা:

হপার জিপিইউ
CUDA ১২.৩ এবং তার উপরে
পাইটর্চ ২.০ এবং তার উপরে

প্রকল্পের শেষে, কর্মকর্তা আরও বলেন যে এটি FlashAttention 2&3 এবং NVIDIA CUTLASS প্রকল্প দ্বারা অনুপ্রাণিত।

FlashAttention দ্রুত এবং স্মৃতি-দক্ষ সুনির্দিষ্ট মনোযোগ অর্জন করতে সক্ষম, এবং মূলধারার বৃহৎ মডেলগুলিতে ব্যবহৃত হয়। সর্বশেষ তৃতীয়-প্রজন্মের সংস্করণটি H100 এর ব্যবহারের হার 75%-তে বৃদ্ধি করতে পারে।

প্রশিক্ষণের গতি ১.৫-২ গুণ বৃদ্ধি করা হয়েছে, এবং FP16 এর অধীনে গণনামূলক থ্রুপুট ৭৪০ TFLOPs/s পর্যন্ত, যা তাত্ত্বিক সর্বোচ্চ থ্রুপুটের ৭৫১TP11T এ পৌঁছায় এবং কম্পিউটিং সংস্থানগুলির পূর্ণ ব্যবহার করা হয়েছে, যা আগে মাত্র ৩৫১TP11T ছিল।

FlashMLA সম্পর্কে হার্ডওয়্যার-স্তরের অপ্টিমাইজেশনের মাধ্যমে কেবল কর্মক্ষমতায় উল্লম্ফনই অর্জন করে না, বরং এআই ইনফারেন্সে ইঞ্জিনিয়ারিং অনুশীলনের জন্য একটি বহিরাগত সমাধানও প্রদান করে, যা বৃহৎ মডেলের ইনফারেন্স ত্বরান্বিত করার ক্ষেত্রে একটি গুরুত্বপূর্ণ প্রযুক্তিগত অগ্রগতি হয়ে ওঠে।

প্রথম দিনেই এত বড় একটা তথ্য প্রকাশ পেল।

আমি আগামী চার দিনের মধ্যে ওপেন সোর্স স্টাফের জন্য অপেক্ষা করছি!

যেমনটি নেটিজেন বলেছেন:

তিমিটি ঢেউ তুলছে!

DeepSeek অসাধারণ!

অশ্রেণীভুক্ত

এটি DeepSeek-R1-32B এর কাছাকাছি এবং Fei-Fei Li এর s1 কে চূর্ণ করে দেয়! UC Berkeley এবং অন্যান্য ওপেন সোর্স নতুন SOTA ইনফারেন্স মডেল

দ্বারাzddeepseeker অক্টোবর 14, 2025অক্টোবর 14, 2025

32B ইনফারেন্স মডেলটি মাত্র 1/8 ডেটা ব্যবহার করে এবং একই আকারের DeepSeek-R1 এর সাথে সংযুক্ত! এইমাত্র, স্ট্যানফোর্ড, ইউসি বার্কলে এবং ওয়াশিংটন বিশ্ববিদ্যালয়ের মতো প্রতিষ্ঠানগুলি যৌথভাবে একটি SOTA-স্তরের ইনফারেন্স মডেল, OpenThinker-32B প্রকাশ করেছে এবং 114k পর্যন্ত প্রশিক্ষণ ডেটাও ওপেন-সোর্স করেছে। OpenThinker প্রকল্পের হোমপেজ: OpenThinker Hugging Face:…

অশ্রেণীভুক্ত

OpenAI o3-mini বনাম DeepSeek-R1: নতুন প্রজন্মের AI মডেলের রাজা কে?

দ্বারাzddeepseeker অক্টোবর 1, 2025অক্টোবর 1, 2025

o3-mini এখানে, একজন চ্যালেঞ্জারের গতির সাথে 31 জানুয়ারী, OpenAI একেবারে নতুন o3-mini বৃহৎ মডেল প্রকাশ করেছে এবং সমস্ত ChatGPT ব্যবহারকারীদের জন্য বিনামূল্যে এর কিছু ফাংশন প্রদান করেছে। যদিও প্রশ্নের সংখ্যার একটি সীমা রয়েছে, এটি ব্যবহারকারীদের যত তাড়াতাড়ি সম্ভব OpenAI এর সর্বশেষ বাণিজ্যিক মডেলের অভিজ্ঞতা লাভ করতে দেয়।

অশ্রেণীভুক্ত

DeepSeek শীর্ষ ১৭টি সেরা বিকল্প: ব্যাপক বিশ্লেষণ (২০২৫)

দ্বারাdeepseeker সম্পর্কে অক্টোবর 6, 2025অক্টোবর 6, 2025

ভূমিকা কৃত্রিম বুদ্ধিমত্তার দ্রুত বিকশিত ভূমিরূপে, DeepSeek একটি শক্তিশালী ভাষা মডেল হিসেবে আবির্ভূত হয়েছে। এই বিস্তৃত বিশ্লেষণে DeepSeek-এর শীর্ষ 17টি বিকল্প অন্বেষণ করা হয়েছে, তাদের অনন্য বৈশিষ্ট্য, ক্ষমতা এবং ব্যবহারের ক্ষেত্রে পরীক্ষা করা হয়েছে। আমাদের গবেষণা আন্তর্জাতিক এবং চীনা উভয় প্ল্যাটফর্মের উপর দৃষ্টি নিবদ্ধ করে যা DeepSeek ইন্টিগ্রেশন বা অনুরূপ ক্ষমতা প্রদান করে। শীর্ষ বিকল্প বিশ্লেষণ 1….

অশ্রেণীভুক্ত

পেপার-DeepSeek-R1: রিইনফোর্সমেন্ট লার্নিং এর মাধ্যমে এলএলএম-এ রিজনিং ক্ষমতাকে উৎসাহিত করা

দ্বারাdeepseeker সম্পর্কে জানুয়ারী 29, 2025জানুয়ারী 29, 2025

বিমূর্ত এই কাগজটি DeepSeek-এর প্রথম প্রজন্মের যুক্তি মডেলগুলি উপস্থাপন করে: DeepSeek-R1-শূন্য এবং DeepSeek-R1৷ DeepSeek-R1-জিরো, তত্ত্বাবধানে ফাইন-টিউনিং (SFT) ছাড়াই বৃহৎ-স্কেল রিইনফোর্সমেন্ট লার্নিং (RL) এর মাধ্যমে প্রশিক্ষিত, অসাধারণ যুক্তির ক্ষমতা প্রদর্শন করে। RL এর মাধ্যমে, এটি স্বাভাবিকভাবেই শক্তিশালী যুক্তিযুক্ত আচরণ বিকাশ করে। যাইহোক, এটি দুর্বল পাঠযোগ্যতা এবং ভাষার মিশ্রণের মতো চ্যালেঞ্জগুলির মুখোমুখি। এই সমস্যাগুলি মোকাবেলা করতে এবং যুক্তির কার্যকারিতা বাড়ানোর জন্য, DeepSeek-R1 তৈরি করা হয়েছিল,…

অশ্রেণীভুক্ত

DeepSeek R1 সৃজনশীল লেখার পরীক্ষায় প্রথম এসেছে, এবং o3 মিনি o1 মিনির থেকেও খারাপ ছিল!

দ্বারাzddeepseeker 3 অক্টোবর, 20253 অক্টোবর, 2025

DeepSeek R1 সৃজনশীল ছোট গল্প লেখার বেঞ্চমার্ক পরীক্ষায় চ্যাম্পিয়নশিপ জিতেছে, সফলভাবে আগের প্রভাবশালী খেলোয়াড় ক্লড 3.5 সনেটকে ছাড়িয়ে গেছে! বেঞ্চমার্ক পরীক্ষা গবেষক লেচ মাজুর দ্বারা ডিজাইন করা বেঞ্চমার্ক পরীক্ষা আপনার গড় লেখার প্রতিযোগিতা নয়। প্রতিটি AI মডেলের জন্য 500টি ছোট গল্প সম্পূর্ণ করতে হবে, এবং প্রতিটি গল্পকে চতুরতার সাথে অন্তর্ভুক্ত করতে হয়েছিল...

অশ্রেণীভুক্ত

ব্রেকিং নিউজ! DeepSeek গবেষক অনলাইনে প্রকাশ করেছেন: R1 প্রশিক্ষণে মাত্র দুই থেকে তিন সপ্তাহ সময় লেগেছে, এবং চীনা নববর্ষের ছুটির সময় R1 শূন্যের একটি শক্তিশালী বিবর্তন লক্ষ্য করা গেছে

দ্বারাzddeepseeker অক্টোবর 4, 2025অক্টোবর 4, 2025

ব্রেকিং নিউজ! DeepSeek গবেষক অনলাইনে প্রকাশ করেছেন: R1 প্রশিক্ষণে মাত্র দুই থেকে তিন সপ্তাহ সময় লেগেছে, এবং চীনা নববর্ষের ছুটির সময় R1 শূন্যের একটি শক্তিশালী বিবর্তন লক্ষ্য করা গেছে। এইমাত্র, আমরা লক্ষ্য করেছি যে DeepSeek গবেষক দয়া গুও DeepSeek R1 এবং কোম্পানির ভবিষ্যৎ পরিকল্পনা সম্পর্কে নেটিজেনদের প্রশ্নের উত্তর দিয়েছেন। আমরা কেবল বলতে পারি...

DeepSeek তার সোর্স কোড প্রকাশ করেছে, FlashMLA এর বিস্তারিত ব্যাখ্যা

এটি DeepSeek-R1-32B এর কাছাকাছি এবং Fei-Fei Li এর s1 কে চূর্ণ করে দেয়! UC Berkeley এবং অন্যান্য ওপেন সোর্স নতুন SOTA ইনফারেন্স মডেল

OpenAI o3-mini বনাম DeepSeek-R1: নতুন প্রজন্মের AI মডেলের রাজা কে?

DeepSeek শীর্ষ ১৭টি সেরা বিকল্প: ব্যাপক বিশ্লেষণ (২০২৫)

পেপার-DeepSeek-R1: রিইনফোর্সমেন্ট লার্নিং এর মাধ্যমে এলএলএম-এ রিজনিং ক্ষমতাকে উৎসাহিত করা

DeepSeek R1 সৃজনশীল লেখার পরীক্ষায় প্রথম এসেছে, এবং o3 মিনি o1 মিনির থেকেও খারাপ ছিল!

মন্তব্য করুন জবাব বাতিল

অনুরূপ পোস্ট

মন্তব্য করুন জবাব বাতিল