Uncategorized - Deepseek R1

DeepSeek 1 کے پیچھے کا راز | DeepSeekMath اور GRPO تفصیلات

غیر زمرہ بندی

DeepSeek 1 کے پیچھے کا راز | DeepSeekMath اور GRPO تفصیلات

کی طرف سےzddeepseeker 9 فروری 20259 فروری 2025

آج میں DeepSeek سے ایک مضمون شیئر کرنا چاہوں گا، جس کا عنوان ہے DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. اس مضمون میں DeepSeekMath 7B متعارف کرایا گیا ہے، جو DeepSeek-Coder-Base-v1.5 7B پر 120B ریاضی سے متعلق ٹوکن، قدرتی زبان اور کوڈ ڈیٹا کے مجموعے کی بنیاد پر پہلے سے تربیت یافتہ ہے۔ ماڈل نے مسابقتی سطح پر 51.7% کا حیران کن سکور حاصل کیا…

غیر زمرہ بندی

DeepSeek-R1 ٹیکنالوجی کا انکشاف: کاغذ کے بنیادی اصولوں کو توڑ دیا گیا ہے اور پیش رفت ماڈل کی کارکردگی کی کلید سامنے آئی ہے۔

کی طرف سےzddeepseeker 9 فروری 20259 فروری 2025

آج ہم DeepSeek R1 کا اشتراک کریں گے، عنوان: DeepSeek-R1: Reinforcement Learning کے ذریعے LLMs میں استدلال کی صلاحیت کی حوصلہ افزائی: کمک سیکھنے کے ذریعے LLM کی استدلال کی صلاحیت کو ترغیب دینا۔ اس مقالے میں DeepSeek کے استدلال کے ماڈلز کی پہلی نسل، DeepSeek-R1-Zero اور DeepSeek-R1 متعارف کرائی گئی ہے۔ DeepSeek-R1-Zero ماڈل کو ابتدائی قدم کے طور پر بڑے پیمانے پر کمک سیکھنے (RL) کے ذریعے زیر نگرانی فائن ٹیوننگ (SFT) کے ذریعے تربیت دی گئی تھی،…

غیر زمرہ بندی

DeepSeek R1 کاغذ کی تشریح اور اہم تکنیکی نکات

کی طرف سےzddeepseeker 9 فروری 20259 فروری 2025

1 پس منظر بہار کے تہوار کے دوران، DeepSeek R1 نے ایک بار پھر بڑے پیمانے پر توجہ مبذول کروائی، اور یہاں تک کہ DeepSeek V3 تشریحی مضمون جو ہم نے پہلے لکھا تھا اسے بھی دوبارہ منتقل کیا گیا اور اس پر کافی بحث کی گئی۔ اگرچہ DeepSeek R1 کے بہت سے تجزیے اور ری پروڈکشن ہو چکے ہیں، یہاں ہم نے کچھ متعلقہ پڑھنے کے نوٹ مرتب کرنے کا فیصلہ کیا ہے۔ ہم تین استعمال کریں گے…

گوگل کا کم لاگت والا ماڈل، جیمنی 2.0 سیریز، حملہ کر رہا ہے: بڑے ماڈلز میں لاگت کی تاثیر کی جنگ تیز ہوتی جا رہی ہے۔

غیر زمرہ بندی

گوگل کا کم لاگت والا ماڈل، جیمنی 2.0 سیریز، حملہ کر رہا ہے: بڑے ماڈلز میں لاگت کی تاثیر کی جنگ تیز ہوتی جا رہی ہے۔

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

بڑے AI ماڈلز کے استعمال کی زیادہ قیمت ایک بڑی وجہ ہے کہ بہت سے AI ایپلی کیشنز کو ابھی تک لاگو اور فروغ نہیں دیا گیا ہے۔ انتہائی کارکردگی کا انتخاب کرنے کا مطلب ہے کمپیوٹنگ پاور کی بھاری لاگت، جس کی وجہ سے استعمال میں زیادہ لاگت آتی ہے جسے عام صارفین قبول نہیں کر سکتے۔ بڑے AI ماڈلز کا مقابلہ دھوئیں کے بغیر جنگ کی طرح ہے۔ کے بعد…

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

غیر زمرہ بندی

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

گوگل جیمنی 2.0 فیملی آخر کار مکمل ہو گئی! جیسے ہی یہ ریلیز ہوتا ہے چارٹ پر حاوی ہوجاتا ہے۔ Deepseek، Qwen اور o3 کے تعاقب اور ناکہ بندیوں کے درمیان، Google نے آج صبح ایک ہی بار میں تین ماڈلز جاری کیے: Gemini 2.0 Pro، Gemini 2.0 Flash اور Gemini 2.0 Flash-Lite۔ بڑے ماڈل LMSYS درجہ بندی پر، Gemini…

27 سالہ سی ای او کے ساتھ a16z مکالمہ: AI ایجنٹ کا بہت بڑا فائدہ ہے، اور طویل مدتی قیمتوں کا تعین مزدوری کے اخراجات سے منسلک کیا جائے گا۔

غیر زمرہ بندی

27 سالہ سی ای او کے ساتھ a16z مکالمہ: AI ایجنٹ کا بہت بڑا فائدہ ہے، اور طویل مدتی قیمتوں کا تعین مزدوری کے اخراجات سے منسلک کیا جائے گا۔

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

جھلکیاں AI ایجنٹ نے گاہک کے تجربے کو نئی شکل دی ہے جیسی ژانگ: ایجنٹ کی اصل میں تعمیر کیسے ہوتی ہے؟ ہمارا خیال یہ ہے کہ وقت گزرنے کے ساتھ ساتھ یہ قدرتی زبان پر مبنی ایجنٹ کی طرح بنتا جائے گا کیونکہ اسی طرح بڑے لینگویج ماڈلز (LLMs) کو تربیت دی جاتی ہے۔ طویل مدتی میں، اگر آپ کے پاس کوئی انتہائی ذہین ایجنٹ ہے جو…

غیر زمرہ بندی

کیتھی ووڈ: DeepSeek صرف لاگت میں کمی کے عمل کو تیز کر رہا ہے۔ گریٹ ڈپریشن سے موازنہ کرنے والا انتہائی مرتکز مارکیٹ کا ڈھانچہ بدل جائے گا۔

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

جھلکیاں DeepSeek کے ساتھ مقابلہ یو ایس کیتھی ووڈ کے لیے اچھا ہے: میرے خیال میں اس سے ظاہر ہوتا ہے کہ اختراع کی قیمت ڈرامائی طور پر کم ہو رہی ہے، اور یہ رجحان پہلے ہی شروع ہو چکا ہے۔ مثال کے طور پر، DeepSeek سے پہلے، مصنوعی ذہانت کی تربیت کی لاگت میں سالانہ 75% کی کمی واقع ہوئی، اور تخمینہ کی لاگت یہاں تک کہ 85% تک گر کر…

غیر زمرہ بندی

گوگل نے ایک ساتھ تین نئے ماڈلز جاری کیے ہیں: Gemini-2.0-Pro مفت ہے، اس کا شاندار سکور ہے اور پہلے نمبر پر ہے، اور پیچیدہ اشارے کوڈنگ اور پروسیسنگ کے لیے موزوں ہے!

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

جیمنی 2.0 کی کہانی میں تیزی آرہی ہے۔ دسمبر میں فلیش تھنکنگ تجرباتی ورژن نے ڈویلپرز کو کم تاخیر اور اعلی کارکردگی کے ساتھ کام کرنے والا ماڈل لایا۔ اس سال کے شروع میں، 2.0 فلیش تھنکنگ تجرباتی کو گوگل اے آئی اسٹوڈیو میں اپ ڈیٹ کیا گیا تھا تاکہ فلیش کی رفتار کو بہتر انداز کی صلاحیتوں کے ساتھ ملا کر کارکردگی کو مزید بہتر بنایا جا سکے۔ گزشتہ ہفتے،…

DeepSeek TOP17 بہترین متبادل: جامع تجزیہ (2025)

غیر زمرہ بندی

DeepSeek TOP17 بہترین متبادل: جامع تجزیہ (2025)

کی طرف سےdeepseeker 6 فروری 20256 فروری 2025

تعارف مصنوعی ذہانت کے تیزی سے ارتقا پذیر منظر نامے میں، DeepSeek ایک طاقتور زبان کے ماڈل کے طور پر ابھرا ہے۔ یہ جامع تجزیہ DeepSeek کے سرفہرست 17 متبادلوں کو تلاش کرتا ہے، ان کی منفرد خصوصیات، صلاحیتوں اور استعمال کے معاملات کا جائزہ لیتا ہے۔ ہماری تحقیق بین الاقوامی اور چینی دونوں پلیٹ فارمز پر مرکوز ہے جو DeepSeek انضمام یا اسی طرح کی صلاحیتیں پیش کرتے ہیں۔ سرفہرست متبادل تجزیہ 1….

غیر زمرہ بندی

Ali Qwen2.5-Max نے DeepSeek-V3 کو پیچھے چھوڑ دیا! Netizen: چین کا AI تیزی سے خلا کو ختم کر رہا ہے۔

کی طرف سےzddeepseeker 5 فروری 20255 فروری 2025

ابھی ابھی، علی کی جانب سے بگ ماڈل ایرینا کی فہرست میں ایک اور گھریلو ماڈل کا اضافہ کیا گیا، Qwen2.5-Max، جس نے DeepSeek-V3 کو پیچھے چھوڑ دیا اور مجموعی درجہ بندی میں 1332 کے مجموعی اسکور کے ساتھ ساتویں نمبر پر آگیا۔ اس نے Claude 3.5 Sonnet اور Llama 3.1 Bwoop میں 1.1 40 سے آگے نکل گئے۔ خاص طور پر، یہ پروگرامنگ میں سبقت رکھتا ہے…