اوپن اے آئی نے اپنا تازہ ترین انفرنس ماڈل جاری کیا ہے، o3-miniجو کہ سائنس، ریاضی اور پروگرامنگ جیسے شعبوں کے لیے موزوں ہے، جو تیز تر رسپانس، زیادہ درستگی اور کم قیمت فراہم کرتا ہے۔

اپنے پیشرو o1-mini کے مقابلے میں، o3-mini نے خاص طور پر پیچیدہ مسائل کو حل کرنے میں اپنی تخمینہ صلاحیتوں میں نمایاں بہتری لائی ہے۔ ٹیسٹرز o3-mini کے جوابات کو 56% تک ترجیح دیتے ہیں، اور غلطی کی شرح 39% تک کم ہو گئی ہے۔ آج سے، چیٹ جی پی ٹی پلس، ٹیم اور پرو صارفین o3-mini استعمال کر سکتے ہیں، اور مفت صارفین اس کی کچھ خصوصیات کا تجربہ بھی کر سکتے ہیں۔

انفرنس ماڈل کے مقابلے میں DeepSeek-R1، کتنا بہتر ہے۔ OpenAI o3-mini R1 سے زیادہ؟

یہ مضمون پہلے o3-mini کی جھلکیوں کا ایک جائزہ پیش کرے گا، اور پھر ہم ہر بینچ مارک پر دونوں اطراف سے ڈیٹا نکالیں گے اور ان کا بصری طور پر موازنہ کرنے کے لیے ایک گراف بنائیں گے۔ اس کے علاوہ، ہم o3-mini کی قیمت کا بھی موازنہ کریں گے۔

بنیادی جھلکیاں

1.STEM کی اصلاح: ریاضی، پروگرامنگ، سائنس، وغیرہ کے شعبوں میں مہارت، خاص طور پر ہائی انفرنس کوشش کے موڈ میں o1-mini کو پیچھے چھوڑنا۔

2.ڈویلپر کے افعال: پیداواری ماحول کی ضروریات کو پورا کرنے کے لیے فنکشن کالز، سٹرکچرڈ آؤٹ پٹ، اور ڈویلپر پیغامات جیسے فنکشنز کو سپورٹ کرتا ہے۔

3.تیز ردعمل: o1-mini سے 24% تیز، 7.7 سیکنڈ فی درخواست کے جوابی وقت کے ساتھ۔

4.سیکیورٹی میں بہتری: ڈیپ الائنمنٹ ٹیکنالوجی کے ذریعے محفوظ اور قابل اعتماد آؤٹ پٹ کو یقینی بناتا ہے۔

5.سرمایہ کاری مؤثر: قیاس کی صلاحیتیں اور لاگت کی اصلاح ایک دوسرے کے ساتھ چلتی ہے، جس سے AI کے استعمال کی حد بہت کم ہو جاتی ہے۔

موازنہ کریں۔

اس کی کلاس کو اجاگر کرنے کے لیے AI کھولیں۔ سرکاری بلاگ صرف اس کے اپنے ماڈلز کے ساتھ موازنہ کرتا ہے۔ لہذا، یہ مضمون DeepSeek R1 پیپر اور آفیشل OpenAI بلاگ کے ڈیٹا سے نکالا گیا ایک ٹیبل ہے۔

OpenAI سرکاری طور پر موازنہ کرتا ہے۔ o3-mini ورژن کی فہرست میں، اسے تین ورژنوں میں توڑتے ہوئے: کم، درمیانے اور اعلی، جو قیاس کی طاقت کی نشاندہی کرتے ہیں۔ چونکہ DeepSeek Math-500 استعمال کرتا ہے اور OpenAI Math ڈیٹاسیٹ استعمال کرتا ہے، اس لیے اس موازنہ کو یہاں ہٹا دیا گیا ہے۔

ایک چارٹ زیادہ بدیہی ہے، اور Codeforces کو ہٹا دیا گیا ہے کیونکہ قدریں اتنی بڑی ہیں کہ بدیہی طور پر ظاہر نہیں کی جا سکتیں۔ تاہم، کوڈفورسز کا موازنہ ظاہر کرتا ہے کہ o3-mini کی اعلی قیاس کی طاقت زیادہ لیڈ نہیں ہے۔

↑1AIME2024→2GPQA ڈائمنڈ→3MMLU→4SWE-bench-Verified

چارٹ سے، مجموعی طور پر 4 موازنہ ہیں، اور O3-mini (ہائی) عام طور پر لیڈ کرتا ہے، لیکن لیڈ بہت چھوٹی ہے۔

قیمت

ماڈلان پٹ کی قیمتکیشے ہٹآؤٹ پٹ قیمت
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
ڈیپ سیک آر 1$0.55$0.14$2.19

خلاصہ

DeepSeek R1 نے ریاستہائے متحدہ میں DeepSeek گھبراہٹ کو متحرک کرنے کے ساتھ، سب سے پہلے خطرہ محسوس کرنے والا OpenAI تھا، جو خاص طور پر اس کے نئے ماڈل o3-mini کی قیمتوں میں واضح ہے۔

جب Openai o1 کو پہلی بار جاری کیا گیا تھا، تو اس کی زیادہ قیمت بہت سے ڈویلپرز اور صارفین پر دباؤ ڈالتی تھی۔ DeepSeek R1 کی ظاہری شکل نے ہر ایک کو مزید انتخاب فراہم کیے ہیں۔o1 اور R1 کے درمیان قیمت کے 30 گنا فرق سے لے کر o3-mini کی آخری قیمت تک دو بار DeepSeek R1 کی قیمت،

اوپنائی پر DeepSeek R1 کا اثر دکھاتا ہے۔تاہم، چیٹ جی پی ٹی مفت صارفین صرف محدود طریقے سے o3-mini کا تجربہ کر سکتے ہیں، جبکہ DeepSeek کی ڈیپ تھنکنگ فی الحال تمام صارفین کے لیے دستیاب ہے۔میں اوپنائی کے صارفین کے لیے استعمال کی لاگت کو کم کرتے ہوئے مزید معروف AI ماڈلز لانے کا بھی منتظر ہوں۔

R1 استعمال کرنے والے بلاگر کے ذاتی تجربے کے تناظر میں، میں یہ کہنا چاہوں گا کہ R1 کی گہری سوچ ہمیشہ میرے ذہن کو کھولتی ہے۔ میرا مشورہ ہے کہ ہر کوئی اسے مسائل کے بارے میں سوچنے کے لیے زیادہ استعمال کرے~

ملتے جلتے پوسٹس

جواب دیں

آپ کا ای میل ایڈریس شائع نہیں کیا جائے گا۔ ضروری خانوں کو * سے نشان زد کیا گیا ہے