OpenAI کے نئے جاری کردہ o3-mini اور DeepSeek R1 کا ایک جامع موازنہ

اوپن اے آئی نے اپنا تازہ ترین انفرنس ماڈل جاری کیا ہے، o3-miniجو کہ سائنس، ریاضی اور پروگرامنگ جیسے شعبوں کے لیے موزوں ہے، جو تیز تر رسپانس، زیادہ درستگی اور کم قیمت فراہم کرتا ہے۔

اپنے پیشرو o1-mini کے مقابلے میں، o3-mini نے خاص طور پر پیچیدہ مسائل کو حل کرنے میں اپنی تخمینہ صلاحیتوں میں نمایاں بہتری لائی ہے۔ ٹیسٹرز o3-mini کے جوابات کو 56% تک ترجیح دیتے ہیں، اور غلطی کی شرح 39% تک کم ہو گئی ہے۔ آج سے، چیٹ جی پی ٹی پلس، ٹیم اور پرو صارفین o3-mini استعمال کر سکتے ہیں، اور مفت صارفین اس کی کچھ خصوصیات کا تجربہ بھی کر سکتے ہیں۔

انفرنس ماڈل کے مقابلے میں DeepSeek-R1، کتنا بہتر ہے۔ OpenAI o3-mini R1 سے زیادہ؟

یہ مضمون پہلے o3-mini کی جھلکیوں کا ایک جائزہ پیش کرے گا، اور پھر ہم ہر بینچ مارک پر دونوں اطراف سے ڈیٹا نکالیں گے اور ان کا بصری طور پر موازنہ کرنے کے لیے ایک گراف بنائیں گے۔ اس کے علاوہ، ہم o3-mini کی قیمت کا بھی موازنہ کریں گے۔

مندرجات کا جدول

بنیادی جھلکیاں

1.STEM کی اصلاح: ریاضی، پروگرامنگ، سائنس، وغیرہ کے شعبوں میں مہارت، خاص طور پر ہائی انفرنس کوشش کے موڈ میں o1-mini کو پیچھے چھوڑنا۔

2.ڈویلپر کے افعال: پیداواری ماحول کی ضروریات کو پورا کرنے کے لیے فنکشن کالز، سٹرکچرڈ آؤٹ پٹ، اور ڈویلپر پیغامات جیسے فنکشنز کو سپورٹ کرتا ہے۔

3.تیز ردعمل: o1-mini سے 24% تیز، 7.7 سیکنڈ فی درخواست کے جوابی وقت کے ساتھ۔

4.سیکیورٹی میں بہتری: ڈیپ الائنمنٹ ٹیکنالوجی کے ذریعے محفوظ اور قابل اعتماد آؤٹ پٹ کو یقینی بناتا ہے۔

5.سرمایہ کاری مؤثر: قیاس کی صلاحیتیں اور لاگت کی اصلاح ایک دوسرے کے ساتھ چلتی ہے، جس سے AI کے استعمال کی حد بہت کم ہو جاتی ہے۔

موازنہ کریں۔

اس کی کلاس کو اجاگر کرنے کے لیے AI کھولیں۔ سرکاری بلاگ صرف اس کے اپنے ماڈلز کے ساتھ موازنہ کرتا ہے۔ لہذا، یہ مضمون DeepSeek R1 پیپر اور آفیشل OpenAI بلاگ کے ڈیٹا سے نکالا گیا ایک ٹیبل ہے۔

OpenAI سرکاری طور پر موازنہ کرتا ہے۔ o3-mini ورژن کی فہرست میں، اسے تین ورژنوں میں توڑتے ہوئے: کم، درمیانے اور اعلی، جو قیاس کی طاقت کی نشاندہی کرتے ہیں۔ چونکہ DeepSeek Math-500 استعمال کرتا ہے اور OpenAI Math ڈیٹاسیٹ استعمال کرتا ہے، اس لیے اس موازنہ کو یہاں ہٹا دیا گیا ہے۔

ایک چارٹ زیادہ بدیہی ہے، اور Codeforces کو ہٹا دیا گیا ہے کیونکہ قدریں اتنی بڑی ہیں کہ بدیہی طور پر ظاہر نہیں کی جا سکتیں۔ تاہم، کوڈفورسز کا موازنہ ظاہر کرتا ہے کہ o3-mini کی اعلی قیاس کی طاقت زیادہ لیڈ نہیں ہے۔

↑1AIME2024→2GPQA ڈائمنڈ→3MMLU→4SWE-bench-Verified

چارٹ سے، مجموعی طور پر 4 موازنہ ہیں، اور O3-mini (ہائی) عام طور پر لیڈ کرتا ہے، لیکن لیڈ بہت چھوٹی ہے۔

قیمت

ماڈل	ان پٹ کی قیمت	کیشے ہٹ	آؤٹ پٹ قیمت
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
ڈیپ سیک آر 1	$0.55	$0.14	$2.19

خلاصہ

DeepSeek R1 نے ریاستہائے متحدہ میں DeepSeek گھبراہٹ کو متحرک کرنے کے ساتھ، سب سے پہلے خطرہ محسوس کرنے والا OpenAI تھا، جو خاص طور پر اس کے نئے ماڈل o3-mini کی قیمتوں میں واضح ہے۔

جب Openai o1 کو پہلی بار جاری کیا گیا تھا، تو اس کی زیادہ قیمت بہت سے ڈویلپرز اور صارفین پر دباؤ ڈالتی تھی۔ DeepSeek R1 کی ظاہری شکل نے ہر ایک کو مزید انتخاب فراہم کیے ہیں۔o1 اور R1 کے درمیان قیمت کے 30 گنا فرق سے لے کر o3-mini کی آخری قیمت تک دو بار DeepSeek R1 کی قیمت،

اوپنائی پر DeepSeek R1 کا اثر دکھاتا ہے۔تاہم، چیٹ جی پی ٹی مفت صارفین صرف محدود طریقے سے o3-mini کا تجربہ کر سکتے ہیں، جبکہ DeepSeek کی ڈیپ تھنکنگ فی الحال تمام صارفین کے لیے دستیاب ہے۔میں اوپنائی کے صارفین کے لیے استعمال کی لاگت کو کم کرتے ہوئے مزید معروف AI ماڈلز لانے کا بھی منتظر ہوں۔

R1 استعمال کرنے والے بلاگر کے ذاتی تجربے کے تناظر میں، میں یہ کہنا چاہوں گا کہ R1 کی گہری سوچ ہمیشہ میرے ذہن کو کھولتی ہے۔ میرا مشورہ ہے کہ ہر کوئی اسے مسائل کے بارے میں سوچنے کے لیے زیادہ استعمال کرے~

غیر زمرہ بندی

لی چیٹ سو بلین ڈالر کی سرمایہ کاری کے ساتھ چارٹ میں سرفہرست ہے۔ کیا امریکہ اور چین کے بعد یہ تیسری AI طاقت ہے؟

کی طرف سےzddeepseeker 11 فروری 202511 فروری 2025

9 فروری کو، فرانسیسی صدر ایمانوئل میکرون نے اعلان کیا کہ فرانس آئندہ چند سالوں میں AI کے شعبے میں 109 بلین یورو (113 بلین امریکی ڈالر) کی سرمایہ کاری کرے گا۔ اس سرمایہ کاری کا استعمال فرانس میں ایک AI پارک بنانے، انفراسٹرکچر کو بہتر بنانے اور مقامی AI اسٹارٹ اپس میں سرمایہ کاری کے لیے کیا جائے گا۔ دریں اثنا، Mistral، ایک فرانسیسی اسٹارٹ اپ،…

غیر زمرہ بندی

بڑی زبان کے ماڈل کے انتظام کے نمونے جیسے DeepSeek: Cherry Studio، Chatbox، AnythingLLM، آپ کی کارکردگی کو تیز کرنے والا کون ہے؟

کی طرف سےzddeepseeker 11 فروری 202511 فروری 2025

بہت سے لوگوں نے پہلے ہی ڈیپ سیک لارج لینگویج ماڈلز کو مقامی طور پر تعینات کرنا اور استعمال کرنا شروع کر دیا ہے، چیٹ باکس کو بطور ویژولائزیشن ٹول استعمال کرتے ہوئے یہ مضمون دو دیگر AI لارج لینگویج ماڈل مینجمنٹ اور ویژولائزیشن آرٹیفیکٹس کو متعارف کرانا جاری رکھے گا، اور ان تینوں کا تفصیل سے موازنہ کرے گا تاکہ آپ کو AI Large Language Models کو زیادہ موثر طریقے سے استعمال کرنے میں مدد ملے۔ 2025 میں،…

غیر زمرہ بندی

بریکنگ نیوز! OpenAI نے آج 2 نئے انفرنس ماڈل جاری کیے: o3-mini اور o3-mini-high۔

کی طرف سےzddeepseeker یکم فروری 2025یکم فروری 2025

o3-mini اور o3-mini (ہائی) آج ریلیز کی جائیں گی۔ باقاعدہ صارفین کو o3-mini بھی ملے گا، اور اس کے علاوہ صارفین o3-mini (ہائی) استعمال کر سکیں گے۔ o3-mini (اعلی) Codeforce پر o1 سے تقریباً 200 پوائنٹس زیادہ ہے، o1 سے تیز، اور کوڈنگ اور ریاضی میں بہتر کارکردگی کا مظاہرہ کرتا ہے، لیکن لاگت ابھی بھی o1-mini کی سطح پر ہے….

غیر زمرہ بندی

ڈیپ سیک کیا حاصل کر سکتا ہے؟ یہاں تک کہ OpenAI یہ نہیں کر سکتا؟

کی طرف سےzddeepseeker 10 فروری 202510 فروری 2025

DeepSeek کی حقیقی قدر کو کم سمجھا جاتا ہے! DeepSeek-R1 بلاشبہ مارکیٹ میں جوش و خروش کی ایک نئی لہر لے کر آیا ہے۔ نہ صرف متعلقہ نام نہاد فائدہ اٹھانے والے اہداف تیزی سے بڑھ رہے ہیں، بلکہ کچھ لوگوں نے اس سے پیسہ کمانے کی کوشش میں DeepSeek سے متعلق کورسز اور سافٹ ویئر بھی تیار کیے ہیں۔ ہمیں یقین ہے کہ اگرچہ ان مظاہر میں ایک…

غیر زمرہ بندی

DeepSeek TOP17 بہترین متبادل: جامع تجزیہ (2025)

کی طرف سےdeepseeker 6 فروری 20256 فروری 2025

تعارف مصنوعی ذہانت کے تیزی سے ارتقا پذیر منظر نامے میں، DeepSeek ایک طاقتور زبان کے ماڈل کے طور پر ابھرا ہے۔ یہ جامع تجزیہ DeepSeek کے سرفہرست 17 متبادلوں کو تلاش کرتا ہے، ان کی منفرد خصوصیات، صلاحیتوں اور استعمال کے معاملات کا جائزہ لیتا ہے۔ ہماری تحقیق بین الاقوامی اور چینی دونوں پلیٹ فارمز پر مرکوز ہے جو DeepSeek انضمام یا اسی طرح کی صلاحیتیں پیش کرتے ہیں۔ سرفہرست متبادل تجزیہ 1….

غیر زمرہ بندی

جیمنی 2.0 چارٹس پر حاوی ہے، جبکہ DeepSeek V3 اپنی قیمت میں روتا ہے، اور ایک نیا سرمایہ کاری مؤثر چیمپئن پیدا ہوا ہے!

کی طرف سےzddeepseeker 8 فروری 20258 فروری 2025

گوگل جیمنی 2.0 فیملی آخر کار مکمل ہو گئی! جیسے ہی یہ ریلیز ہوتا ہے چارٹ پر حاوی ہوجاتا ہے۔ Deepseek، Qwen اور o3 کے تعاقب اور ناکہ بندیوں کے درمیان، Google نے آج صبح ایک ہی بار میں تین ماڈلز جاری کیے: Gemini 2.0 Pro، Gemini 2.0 Flash اور Gemini 2.0 Flash-Lite۔ بڑے ماڈل LMSYS درجہ بندی پر، Gemini…

بنیادی جھلکیاں

موازنہ کریں۔

قیمت

خلاصہ

ملتے جلتے پوسٹس

جواب دیں جواب منسوخ کریں