zddeepseeker - Deepseek R1 - صفحہ 2 میں سے 3

غیر زمرہ بندی

DeepSeek-R1 ٹیکنالوجی کا انکشاف: کاغذ کے بنیادی اصولوں کو توڑ دیا گیا ہے اور پیش رفت ماڈل کی کارکردگی کی کلید سامنے آئی ہے۔

کی طرف سےzddeepseeker 9 فروری 20259 فروری 2025

آج ہم DeepSeek R1 کا اشتراک کریں گے، عنوان: DeepSeek-R1: Reinforcement Learning کے ذریعے LLMs میں استدلال کی صلاحیت کی حوصلہ افزائی: کمک سیکھنے کے ذریعے LLM کی استدلال کی صلاحیت کو ترغیب دینا۔ اس مقالے میں DeepSeek کے استدلال کے ماڈلز کی پہلی نسل، DeepSeek-R1-Zero اور DeepSeek-R1 متعارف کرائی گئی ہے۔ DeepSeek-R1-Zero ماڈل کو ابتدائی قدم کے طور پر بڑے پیمانے پر کمک سیکھنے (RL) کے ذریعے زیر نگرانی فائن ٹیوننگ (SFT) کے ذریعے تربیت دی گئی تھی،…

غیر زمرہ بندی

DeepSeek R1 کاغذ کی تشریح اور اہم تکنیکی نکات

کی طرف سےzddeepseeker 9 فروری 20259 فروری 2025

1 پس منظر بہار کے تہوار کے دوران، DeepSeek R1 نے ایک بار پھر بڑے پیمانے پر توجہ مبذول کروائی، اور یہاں تک کہ DeepSeek V3 تشریحی مضمون جو ہم نے پہلے لکھا تھا اسے بھی دوبارہ منتقل کیا گیا اور اس پر کافی بحث کی گئی۔ اگرچہ DeepSeek R1 کے بہت سے تجزیے اور ری پروڈکشن ہو چکے ہیں، یہاں ہم نے کچھ متعلقہ پڑھنے کے نوٹ مرتب کرنے کا فیصلہ کیا ہے۔ ہم تین استعمال کریں گے…

گوگل کا کم لاگت والا ماڈل، جیمنی 2.0 سیریز، حملہ کر رہا ہے: بڑے ماڈلز میں لاگت کی تاثیر کی جنگ تیز ہوتی جا رہی ہے۔

غیر زمرہ بندی

گوگل کا کم لاگت والا ماڈل، جیمنی 2.0 سیریز، حملہ کر رہا ہے: بڑے ماڈلز میں لاگت کی تاثیر کی جنگ تیز ہوتی جا رہی ہے۔

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

بڑے AI ماڈلز کے استعمال کی زیادہ قیمت ایک بڑی وجہ ہے کہ بہت سے AI ایپلی کیشنز کو ابھی تک لاگو اور فروغ نہیں دیا گیا ہے۔ انتہائی کارکردگی کا انتخاب کرنے کا مطلب ہے کمپیوٹنگ پاور کی بھاری لاگت، جس کی وجہ سے استعمال میں زیادہ لاگت آتی ہے جسے عام صارفین قبول نہیں کر سکتے۔ بڑے AI ماڈلز کا مقابلہ دھوئیں کے بغیر جنگ کی طرح ہے۔ کے بعد…

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

غیر زمرہ بندی

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

گوگل جیمنی 2.0 فیملی آخر کار مکمل ہو گئی! جیسے ہی یہ ریلیز ہوتا ہے چارٹ پر حاوی ہوجاتا ہے۔ Deepseek، Qwen اور o3 کے تعاقب اور ناکہ بندیوں کے درمیان، Google نے آج صبح ایک ہی بار میں تین ماڈلز جاری کیے: Gemini 2.0 Pro، Gemini 2.0 Flash اور Gemini 2.0 Flash-Lite۔ بڑے ماڈل LMSYS درجہ بندی پر، Gemini…

27 سالہ سی ای او کے ساتھ a16z مکالمہ: AI ایجنٹ کا بہت بڑا فائدہ ہے، اور طویل مدتی قیمتوں کا تعین مزدوری کے اخراجات سے منسلک کیا جائے گا۔

غیر زمرہ بندی

27 سالہ سی ای او کے ساتھ a16z مکالمہ: AI ایجنٹ کا بہت بڑا فائدہ ہے، اور طویل مدتی قیمتوں کا تعین مزدوری کے اخراجات سے منسلک کیا جائے گا۔

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

جھلکیاں AI ایجنٹ نے گاہک کے تجربے کو نئی شکل دی ہے جیسی ژانگ: ایجنٹ کی اصل میں تعمیر کیسے ہوتی ہے؟ ہمارا خیال یہ ہے کہ وقت گزرنے کے ساتھ ساتھ یہ قدرتی زبان پر مبنی ایجنٹ کی طرح بنتا جائے گا کیونکہ اسی طرح بڑے لینگویج ماڈلز (LLMs) کو تربیت دی جاتی ہے۔ طویل مدتی میں، اگر آپ کے پاس کوئی انتہائی ذہین ایجنٹ ہے جو…

غیر زمرہ بندی

کیتھی ووڈ: DeepSeek صرف لاگت میں کمی کے عمل کو تیز کر رہا ہے۔ گریٹ ڈپریشن سے موازنہ کرنے والا انتہائی مرتکز مارکیٹ کا ڈھانچہ بدل جائے گا۔

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

جھلکیاں DeepSeek کے ساتھ مقابلہ یو ایس کیتھی ووڈ کے لیے اچھا ہے: میرے خیال میں اس سے ظاہر ہوتا ہے کہ اختراع کی قیمت ڈرامائی طور پر کم ہو رہی ہے، اور یہ رجحان پہلے ہی شروع ہو چکا ہے۔ مثال کے طور پر، DeepSeek سے پہلے، مصنوعی ذہانت کی تربیت کی لاگت میں سالانہ 75% کی کمی واقع ہوئی، اور تخمینہ کی لاگت یہاں تک کہ 85% تک گر کر…

غیر زمرہ بندی

گوگل نے ایک ساتھ تین نئے ماڈلز جاری کیے ہیں: Gemini-2.0-Pro مفت ہے، اس کا شاندار سکور ہے اور پہلے نمبر پر ہے، اور پیچیدہ اشارے کوڈنگ اور پروسیسنگ کے لیے موزوں ہے!

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

جیمنی 2.0 کی کہانی میں تیزی آرہی ہے۔ دسمبر میں فلیش تھنکنگ تجرباتی ورژن نے ڈویلپرز کو کم تاخیر اور اعلی کارکردگی کے ساتھ کام کرنے والا ماڈل لایا۔ اس سال کے شروع میں، 2.0 فلیش تھنکنگ تجرباتی کو گوگل اے آئی اسٹوڈیو میں اپ ڈیٹ کیا گیا تھا تاکہ فلیش کی رفتار کو بہتر انداز کی صلاحیتوں کے ساتھ ملا کر کارکردگی کو مزید بہتر بنایا جا سکے۔ گزشتہ ہفتے،…

غیر زمرہ بندی

Ali Qwen2.5-Max نے DeepSeek-V3 کو پیچھے چھوڑ دیا! Netizen: چین کا AI تیزی سے خلا کو ختم کر رہا ہے۔

کی طرف سےzddeepseeker 5 فروری 20255 فروری 2025

ابھی ابھی، علی کی جانب سے بگ ماڈل ایرینا کی فہرست میں ایک اور گھریلو ماڈل کا اضافہ کیا گیا، Qwen2.5-Max، جس نے DeepSeek-V3 کو پیچھے چھوڑ دیا اور مجموعی درجہ بندی میں 1332 کے مجموعی اسکور کے ساتھ ساتویں نمبر پر آگیا۔ اس نے Claude 3.5 Sonnet اور Llama 3.1 Bwoop میں 1.1 40 سے آگے نکل گئے۔ خاص طور پر، یہ پروگرامنگ میں سبقت رکھتا ہے…

بریکنگ نیوز! DeepSeek محقق نے آن لائن انکشاف کیا: R1 کی تربیت میں صرف دو سے تین ہفتے لگے، اور چینی نئے سال کی چھٹی کے دوران R1 صفر کا ایک طاقتور ارتقاء دیکھا گیا۔

غیر زمرہ بندی

بریکنگ نیوز! DeepSeek محقق نے آن لائن انکشاف کیا: R1 کی تربیت میں صرف دو سے تین ہفتے لگے، اور چینی نئے سال کی چھٹی کے دوران R1 صفر کا ایک طاقتور ارتقاء دیکھا گیا۔

کی طرف سےzddeepseeker 4 فروری 20254 فروری 2025

بریکنگ نیوز! DeepSeek کے محقق نے آن لائن انکشاف کیا: R1 کی تربیت میں صرف دو سے تین ہفتے لگے، اور چینی نئے سال کی تعطیلات کے دوران R1 صفر کا ایک طاقتور ارتقاء دیکھا گیا، ابھی، ہم نے دیکھا کہ DeepSeek کے محقق دیا گو نے DeepSeek R1 اور کمپنی کے منصوبوں کے بارے میں نیٹیزنز کے سوالات کا جواب دیا۔ آگے جا رہا ہے ہم صرف یہ کہہ سکتے ہیں…

DeepSeek R1 تخلیقی تحریری امتحان میں پہلے آیا، اور o3 mini o1 mini سے بھی بدتر تھا!

غیر زمرہ بندی

DeepSeek R1 تخلیقی تحریری امتحان میں پہلے آیا، اور o3 mini o1 mini سے بھی بدتر تھا!

کی طرف سےzddeepseeker 3 فروری 20253 فروری 2025

DeepSeek R1 نے تخلیقی مختصر کہانی لکھنے کے بینچ مارک ٹیسٹ میں چیمپیئن شپ جیت لی، اور پچھلے غالب کھلاڑی Claude 3.5 Sonnet کو کامیابی سے پیچھے چھوڑ دیا! بینچ مارک ٹیسٹ محقق Lech Mazur کی طرف سے ڈیزائن کردہ بینچ مارک ٹیسٹ آپ کا اوسط تحریری مقابلہ نہیں ہے۔ ہر اے آئی ماڈل کو 500 مختصر کہانیاں مکمل کرنے کی ضرورت تھی، اور ہر کہانی کو چالاکی سے شامل کرنا تھا…