DeepSeek 1 کے پیچھے کا راز | DeepSeekMath اور GRPO تفصیلات

DeepSeek 1 کے پیچھے کا راز | DeepSeekMath اور GRPO تفصیلات

آج میں DeepSeek سے ایک مضمون شیئر کرنا چاہوں گا، جس کا عنوان ہے DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. اس مضمون میں DeepSeekMath 7B متعارف کرایا گیا ہے، جو DeepSeek-Coder-Base-v1.5 7B پر 120B ریاضی سے متعلق ٹوکن، قدرتی زبان اور کوڈ ڈیٹا کے مجموعے کی بنیاد پر پہلے سے تربیت یافتہ ہے۔ ماڈل نے مسابقتی سطح پر 51.7% کا حیران کن سکور حاصل کیا…

DeepSeek-R1 ٹیکنالوجی کا انکشاف: کاغذ کے بنیادی اصولوں کو توڑ دیا گیا ہے اور پیش رفت ماڈل کی کارکردگی کی کلید سامنے آئی ہے۔

آج ہم DeepSeek R1 کا اشتراک کریں گے، عنوان: DeepSeek-R1: Reinforcement Learning کے ذریعے LLMs میں استدلال کی صلاحیت کی حوصلہ افزائی: کمک سیکھنے کے ذریعے LLM کی استدلال کی صلاحیت کو ترغیب دینا۔ اس مقالے میں DeepSeek کے استدلال کے ماڈلز کی پہلی نسل، DeepSeek-R1-Zero اور DeepSeek-R1 متعارف کرائی گئی ہے۔ DeepSeek-R1-Zero ماڈل کو ابتدائی قدم کے طور پر بڑے پیمانے پر کمک سیکھنے (RL) کے ذریعے زیر نگرانی فائن ٹیوننگ (SFT) کے ذریعے تربیت دی گئی تھی،…

DeepSeek R1 کاغذ کی تشریح اور اہم تکنیکی نکات

1 پس منظر بہار کے تہوار کے دوران، DeepSeek R1 نے ایک بار پھر بڑے پیمانے پر توجہ مبذول کروائی، اور یہاں تک کہ DeepSeek V3 تشریحی مضمون جو ہم نے پہلے لکھا تھا اسے بھی دوبارہ منتقل کیا گیا اور اس پر کافی بحث کی گئی۔ اگرچہ DeepSeek R1 کے بہت سے تجزیے اور ری پروڈکشن ہو چکے ہیں، یہاں ہم نے کچھ متعلقہ پڑھنے کے نوٹ مرتب کرنے کا فیصلہ کیا ہے۔ ہم تین استعمال کریں گے…

گوگل کا کم لاگت والا ماڈل، جیمنی 2.0 سیریز، حملہ کر رہا ہے: بڑے ماڈلز میں لاگت کی تاثیر کی جنگ تیز ہوتی جا رہی ہے۔

گوگل کا کم لاگت والا ماڈل، جیمنی 2.0 سیریز، حملہ کر رہا ہے: بڑے ماڈلز میں لاگت کی تاثیر کی جنگ تیز ہوتی جا رہی ہے۔

بڑے AI ماڈلز کے استعمال کی زیادہ قیمت ایک بڑی وجہ ہے کہ بہت سے AI ایپلی کیشنز کو ابھی تک لاگو اور فروغ نہیں دیا گیا ہے۔ انتہائی کارکردگی کا انتخاب کرنے کا مطلب ہے کمپیوٹنگ پاور کی بھاری لاگت، جس کی وجہ سے استعمال میں زیادہ لاگت آتی ہے جسے عام صارفین قبول نہیں کر سکتے۔ بڑے AI ماڈلز کا مقابلہ دھوئیں کے بغیر جنگ کی طرح ہے۔ کے بعد…

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

گوگل جیمنی 2.0 فیملی آخر کار مکمل ہو گئی! جیسے ہی یہ ریلیز ہوتا ہے چارٹ پر حاوی ہوجاتا ہے۔ Deepseek، Qwen اور o3 کے تعاقب اور ناکہ بندیوں کے درمیان، Google نے آج صبح ایک ہی بار میں تین ماڈلز جاری کیے: Gemini 2.0 Pro، Gemini 2.0 Flash اور Gemini 2.0 Flash-Lite۔ بڑے ماڈل LMSYS درجہ بندی پر، Gemini…

27 سالہ سی ای او کے ساتھ a16z مکالمہ: AI ایجنٹ کا بہت بڑا فائدہ ہے، اور طویل مدتی قیمتوں کا تعین مزدوری کے اخراجات سے منسلک کیا جائے گا۔

27 سالہ سی ای او کے ساتھ a16z مکالمہ: AI ایجنٹ کا بہت بڑا فائدہ ہے، اور طویل مدتی قیمتوں کا تعین مزدوری کے اخراجات سے منسلک کیا جائے گا۔

جھلکیاں AI ایجنٹ نے گاہک کے تجربے کو نئی شکل دی ہے جیسی ژانگ: ایجنٹ کی اصل میں تعمیر کیسے ہوتی ہے؟ ہمارا خیال یہ ہے کہ وقت گزرنے کے ساتھ ساتھ یہ قدرتی زبان پر مبنی ایجنٹ کی طرح بنتا جائے گا کیونکہ اسی طرح بڑے لینگویج ماڈلز (LLMs) کو تربیت دی جاتی ہے۔ طویل مدتی میں، اگر آپ کے پاس کوئی انتہائی ذہین ایجنٹ ہے جو…

کیتھی ووڈ: DeepSeek صرف لاگت میں کمی کے عمل کو تیز کر رہا ہے۔ گریٹ ڈپریشن سے موازنہ کرنے والا انتہائی مرتکز مارکیٹ کا ڈھانچہ بدل جائے گا۔

جھلکیاں DeepSeek کے ساتھ مقابلہ یو ایس کیتھی ووڈ کے لیے اچھا ہے: میرے خیال میں اس سے ظاہر ہوتا ہے کہ اختراع کی قیمت ڈرامائی طور پر کم ہو رہی ہے، اور یہ رجحان پہلے ہی شروع ہو چکا ہے۔ مثال کے طور پر، DeepSeek سے پہلے، مصنوعی ذہانت کی تربیت کی لاگت میں سالانہ 75% کی کمی واقع ہوئی، اور تخمینہ کی لاگت یہاں تک کہ 85% تک گر کر…

گوگل نے ایک ساتھ تین نئے ماڈلز جاری کیے ہیں: Gemini-2.0-Pro مفت ہے، اس کا شاندار سکور ہے اور پہلے نمبر پر ہے، اور پیچیدہ اشارے کوڈنگ اور پروسیسنگ کے لیے موزوں ہے!

جیمنی 2.0 کی کہانی میں تیزی آرہی ہے۔ دسمبر میں فلیش تھنکنگ تجرباتی ورژن نے ڈویلپرز کو کم تاخیر اور اعلی کارکردگی کے ساتھ کام کرنے والا ماڈل لایا۔ اس سال کے شروع میں، 2.0 فلیش تھنکنگ تجرباتی کو گوگل اے آئی اسٹوڈیو میں اپ ڈیٹ کیا گیا تھا تاکہ فلیش کی رفتار کو بہتر انداز کی صلاحیتوں کے ساتھ ملا کر کارکردگی کو مزید بہتر بنایا جا سکے۔ گزشتہ ہفتے،…

DeepSeek TOP17 بہترین متبادل: جامع تجزیہ (2025)

DeepSeek TOP17 بہترین متبادل: جامع تجزیہ (2025)

تعارف مصنوعی ذہانت کے تیزی سے ارتقا پذیر منظر نامے میں، DeepSeek ایک طاقتور زبان کے ماڈل کے طور پر ابھرا ہے۔ یہ جامع تجزیہ DeepSeek کے سرفہرست 17 متبادلوں کو تلاش کرتا ہے، ان کی منفرد خصوصیات، صلاحیتوں اور استعمال کے معاملات کا جائزہ لیتا ہے۔ ہماری تحقیق بین الاقوامی اور چینی دونوں پلیٹ فارمز پر مرکوز ہے جو DeepSeek انضمام یا اسی طرح کی صلاحیتیں پیش کرتے ہیں۔ سرفہرست متبادل تجزیہ 1….

Ali Qwen2.5-Max نے DeepSeek-V3 کو پیچھے چھوڑ دیا! Netizen: چین کا AI تیزی سے خلا کو ختم کر رہا ہے۔

ابھی ابھی، علی کی جانب سے بگ ماڈل ایرینا کی فہرست میں ایک اور گھریلو ماڈل کا اضافہ کیا گیا، Qwen2.5-Max، جس نے DeepSeek-V3 کو پیچھے چھوڑ دیا اور مجموعی درجہ بندی میں 1332 کے مجموعی اسکور کے ساتھ ساتویں نمبر پر آگیا۔ اس نے Claude 3.5 Sonnet اور Llama 3.1 Bwoop میں 1.1 40 سے آگے نکل گئے۔ خاص طور پر، یہ پروگرامنگ میں سبقت رکھتا ہے…