پچھلے ہفتے، DeepSeek نے اعلان کیا کہ وہ اگلے ہفتے پانچ پروجیکٹس کھولے گا: نیٹیزنز نے کہا، "اس بار، OpenAI واقعی یہاں ہے۔" ابھی، پہلا اوپن سورس پروجیکٹ آیا، جس کا تعلق انفرنس ایکسلریشن سے ہے، فلیش ایم ایل اے: اوپن سورس پروجیکٹ ایڈریس: DeepSeek FlashMLA یہ دو گھنٹے سے اوپن سورس ہے، اور گیتھب کے پاس پہلے ہی 2.7k+ ستارے ہیں: The…
FlashMLA نے مصنوعی ذہانت کی دنیا میں خاص طور پر بڑے لینگویج ماڈلز (LLMs) کے میدان میں تیزی سے توجہ حاصل کر لی ہے۔ یہ اختراعی ٹول، جو DeepSeek کے ذریعے تیار کیا گیا ہے، Hopper GPUs کے لیے ڈیزائن کیا گیا ایک بہترین ڈیکوڈنگ کرنل کے طور پر کام کرتا ہے—اعلیٰ کارکردگی والی چپس جو عام طور پر AI کمپیوٹنگ میں استعمال ہوتی ہیں۔ فلیش ایم ایل اے متغیر لمبائی کے سلسلے کی موثر پروسیسنگ پر توجہ مرکوز کرتا ہے، جس سے یہ خاص طور پر موزوں ہے…
تعارف آج، بڑے زبان کے ماڈلز (LLMs) ایک اہم کردار ادا کرتے ہیں۔ 2025 کے اوائل میں، جیسا کہ AI کا مقابلہ تیز ہوا، علی بابا نے نیا Qwen2.5-max AI ماڈل لانچ کیا، اور Hangzhou، چین کی ایک کمپنی DeepSeek نے R1 ماڈل لانچ کیا، جو LLM ٹیکنالوجی کے عروج کی نمائندگی کرتا ہے۔ Deepseek R1 ایک اوپن سورس AI ماڈل ہے جس نے اپنی طرف متوجہ کیا ہے…
32B انفرنس ماڈل ڈیٹا کا صرف 1/8 استعمال کرتا ہے اور اسی سائز کے DeepSeek-R1 کے ساتھ بندھا ہوا ہے! ابھی ابھی، Stanford، UC Berkeley، اور University of Washington نے مشترکہ طور پر SOTA کی سطح کا انفرنس ماڈل، OpenThinker-32B جاری کیا ہے، اور 114k ٹریننگ ڈیٹا کو اوپن سورس بھی کیا ہے۔ OpenThinker پروجیکٹ ہوم پیج: OpenThinker کو گلے لگانا چہرہ:…