
o3-mini رات گئے پہنچے، اور OpenAI نے آخر کار اپنا تازہ ترین ٹرمپ کارڈ ظاہر کر دیا۔ ایک Reddit AMA سوال و جواب کے دوران، Altman نے دل کی گہرائیوں سے اعتراف کیا کہ وہ اوپن سورس AI کے غلط رخ پر کھڑا تھا۔
انہوں نے کہا کہ اوپن سورس کی اندرونی حکمت عملی پر غور کیا جا رہا ہے، اور ماڈل تیار ہوتا رہے گا، لیکن اوپن اے آئی کی برتری پہلے جیسی بڑی نہیں ہوگی۔
جب کہ ہر کوئی اب بھی DeepSeek کی حیرت انگیز طاقت پر حیرت زدہ تھا، OpenAI آخر کار مزید خاموش نہیں بیٹھ سکا۔
کل کی علی الصبح، o3-mini کو فوری طور پر لانچ کیا گیا، جس نے بینچ مارک ٹیسٹوں میں نیا SOTA ترتیب دیا جیسے کہ ریاضی کے کوڈ اور تخت پر واپس جانا۔
سب سے اہم بات یہ ہے کہ مفت صارفین بھی اس کا تجربہ کر سکتے ہیں! o3-mini کوئی مذاق نہیں ہے۔ "انسانوں کے لیے آخری امتحان" میں، o3-mini (اعلی) نے براہ راست بہترین درستگی اور انشانکن کی خرابی حاصل کی۔

چند گھنٹوں بعد o3-mini آن لائن ہو گیا۔، OpenAI نے سرکاری طور پر تقریباً ایک گھنٹے کے لیے ایک Reddit AMA کھولا۔
آلٹ مین خود بھی آن لائن گئے اور نیٹیزنز کے تمام سوالات کے جوابات دیئے۔

اہم جھلکیاں یہ ہیں:
- DeepSeek واقعی بہت اچھا ہے۔، اور ہم بہتر ماڈل تیار کرتے رہیں گے، لیکن لیڈ پہلے کی طرح بڑا نہیں ہوگا۔
- کچھ سال پہلے کے مقابلے میں، میں اب اس بات پر یقین کرنے کی طرف مائل ہوں کہ AI تیزی سے چھلانگ لگا سکتا ہے
- ہم اوپن سورسنگ وزنی AI ماڈلز کے معاملے کے غلط رخ پر ہیں۔
- اعلی درجے کی آواز کے موڈ میں ایک اپ ڈیٹ جلد آرہا ہے، اور ہم اسے براہ راست GPT-5 کہیں گے، GPT-5o نہیں۔ ابھی تک کوئی مخصوص ٹائم ٹیبل نہیں ہے۔
خود آلٹ مین کے علاوہ، چیف ریسرچ آفیسر مارک چن، چیف پروڈکٹ آفیسر کیون وائل، انجینئرنگ کے نائب صدر سری نواس نارائنن، اے پی آئی ریسرچ کے سربراہ مشیل پوکراس، اور ریسرچ کے سربراہ ہونگیو رین بھی آن لائن تھے اور نیٹیزنز کے تمام سوالوں کے بغور جواب دیتے تھے۔
اگلا، آئیے ایک نظر ڈالتے ہیں کہ ان سب نے کیا کہا۔
اوپن سورس AI جنگ میں غلط رخ اختیار کرتے ہوئے آلٹ مین نے دل کی گہرائیوں سے توبہ کی۔
DeepSeek کی اچانک واپسی سب کے لیے غیر متوقع ہو سکتی ہے۔
AMA سوال و جواب کے دوران، Altman نے خود بھی اوپن سورس AI جنگ میں غلط رخ اختیار کرنے سے توبہ کی اور اسے DeepSeek کے مضبوط فوائد کو تسلیم کرنا پڑا۔
جس چیز نے بہت سے لوگوں کو حیران کیا وہ یہ تھا کہ آلٹ مین نے یہاں تک کہا کہ OpenAI کی برتری اتنی مضبوط نہیں تھی جتنی پہلے ہوتی تھی۔
ذیل میں تمام کلاسک جوابات ہیں جو ہم نے Altman سے مرتب کیے ہیں۔
س: آئیے ہفتے کے بڑے موضوع کے بارے میں بات کریں: ڈیپ سیک۔ یہ واضح طور پر ایک بہت ہی متاثر کن ماڈل ہے، اور میں جانتا ہوں کہ یہ شاید دوسرے LLM کے آؤٹ پٹس کے سب سے اوپر تربیت یافتہ تھا۔ یہ مستقبل کے ماڈلز کے لیے آپ کے منصوبوں کو کیسے بدلے گا؟
آلٹ مین: یہ واقعی ایک بہت ہی متاثر کن ماڈل ہے! ہم بہتر ماڈل تیار کریں گے، لیکن ہم پچھلے سالوں کی طرح اتنی بڑی برتری برقرار نہیں رکھ پائیں گے۔
سوال: کیا آپ کو لگتا ہے کہ خود کو دوبارہ پیدا کرنا ایک بتدریج عمل ہوگا یا اچانک ٹیک آف؟
آلٹمین: ذاتی طور پر، مجھے لگتا ہے کہ میں یہ سوچنے کی طرف زیادہ مائل ہوں کہ AI کچھ سال پہلے کی نسبت تیزی سے ترقی کر سکتا ہے۔ شاید اس موضوع پر کچھ لکھنے کا وقت آگیا ہے…
سوال: کیا ہم وہ تمام ٹوکن دیکھ سکتے ہیں جن کے بارے میں ماڈل سوچتا ہے؟
Altman: جی ہاں، ہم جلد ہی ایک مزید مددگار اور تفصیلی ورژن دکھائیں گے۔ اپ ڈیٹ کے لیے R1 کا شکریہ۔
کیون ویل، چیف پروڈکٹ آفیسر: ہم ابھی سے زیادہ دکھانے پر کام کر رہے ہیں – یہ جلد ہی ہو گا۔ ہم سب کچھ دکھاتے ہیں یا نہیں اس کا تعین کرنا باقی ہے۔ تمام سوچ کی زنجیریں (CoT) دکھانے سے مسابقتی ماڈل ڈسٹلیشن ہو جائے گا، لیکن ہم یہ بھی جانتے ہیں کہ صارفین (کم از کم اعلی درجے کے صارفین) اسے دیکھنا چاہتے ہیں، اس لیے ہمیں ایک اچھا توازن ملے گا۔
سوال: o3 کا مکمل ورژن کب دستیاب ہوگا؟
آلٹ مین: میں اندازہ لگاؤں گا کہ یہ چند ہفتوں سے زیادہ کا ہوگا، لیکن چند مہینوں سے زیادہ نہیں۔
سوال: کیا وائس موڈ میں کوئی اپ ڈیٹ ہوگا؟ کیا یہ ممکنہ طور پر GPT-5o پر فوکس ہے؟ GPT-5o کے لیے رف ٹائم لائن کیا ہے؟
آلٹ مین: جی ہاں، ایڈوانس وائس موڈ میں اپ ڈیٹ آ رہا ہے! میرے خیال میں ہم اسے صرف GPT-5 کہیں گے، GPT-5o نہیں۔ ابھی تک کوئی مخصوص ٹائم لائن نہیں ہے۔
س: کیا آپ کچھ ماڈل وزن جاری کرنے اور کچھ تحقیق شائع کرنے پر غور کریں گے؟
Altman: ہاں، ہم اس پر بات کر رہے ہیں۔ میں ذاتی طور پر سوچتا ہوں کہ ہم اس مسئلے کے غلط رخ پر ہیں اور ہمیں ایک مختلف اوپن سورس حکمت عملی کے ساتھ آنے کی ضرورت ہے۔ OpenAI میں ہر کوئی اس نظریے کا اشتراک نہیں کرتا، اور یہ اس وقت ہماری اولین ترجیح نہیں ہے۔
ایک اور سوال سیٹ:
- ہم باقاعدہ پلس پروگرام میں آپریٹر کی پیشکش کے کتنے قریب ہیں؟
- روبوٹکس ڈیپارٹمنٹ کی اولین ترجیحات کیا ہیں؟
- OpenAI مزید خصوصی چپس/TPUs، جیسے Trillium، Cerebras وغیرہ کے بارے میں کیسا محسوس کرتا ہے؟ کیا OpenAI اس پر توجہ دے رہا ہے؟
- AGI اور ASI میں مستقبل کے خطرات سے بچنے کے لیے کیا سرمایہ کاری کی جا رہی ہے؟
- آپ کی سب سے یادگار چھٹی کون سی تھی؟
آلٹ مین:
- چند ماہ
- چھوٹے پیمانے پر واقعی ایک اچھا روبوٹ تیار کرنا اور تجربے سے سیکھنا
- GB200 کو شکست دینا فی الحال مشکل ہے!
- ایک اچھا انتخاب یہ ہوگا کہ آپ اپنی اندرونی حالت کو بہتر بنائیں - لچک، موافقت، پرسکون، خوشی وغیرہ۔
- اس کا انتخاب کرنا مشکل ہے! لیکن ذہن میں آنے والے پہلے دو ہیں: جنوب مشرقی ایشیا میں بیک پیکنگ یا افریقہ میں سفاری
س: کیا آپ پلس سیریز کی قیمت بڑھانے کا سوچ رہے ہیں؟
آلٹ مین: دراصل، میں اسے آہستہ آہستہ کم کرنا چاہتا ہوں۔
س: فرض کریں کہ اب سال 2030 ہے، اور آپ نے ابھی ایک ایسا نظام بنایا ہے جسے زیادہ تر لوگ AGI کہیں گے۔ یہ تمام بینچ مارک ٹیسٹوں میں سبقت لے جاتا ہے اور رفتار اور کارکردگی کے لحاظ سے آپ کے بہترین انجینئرز اور محققین کو پیچھے چھوڑ دیتا ہے۔ آگے کیا ہے؟ "اسے ویب سائٹ پر ڈالنے اور بطور سروس پیش کرنے" کے علاوہ، کیا آپ کے پاس کوئی اور منصوبہ ہے؟
آلٹ مین: سب سے اہم اثر، میری رائے میں، سائنسی دریافت کو تیز کرنا ہو گا، جو میرے خیال میں وہ عنصر ہے جو معیار زندگی کو بہتر بنانے میں سب سے زیادہ حصہ ڈالے گا۔
4o امیج جنریشن، جلد آرہا ہے۔
اگلا، اوپن اے آئی کے دیگر اراکین کے جوابات شامل کیے گئے۔
سوال: کیا آپ اب بھی 4o امیج جنریٹر شروع کرنے کا سوچ رہے ہیں؟
کیون ویل، چیف پروڈکٹ آفیسر: جی ہاں! اور مجھے لگتا ہے کہ انتظار اس کے قابل ہے۔
س: بہت اچھا! کیا کوئی خراب ٹائم ٹیبل ہے؟
کیون ویل، چیف پروڈکٹ آفیسر: آپ مجھ سے پریشانی میں پڑنے کے لیے کہہ رہے ہیں۔ شاید چند ماہ۔
اور اسی طرح کا ایک اور سوال۔
سوال: ہم ChatGPT-5 کب دیکھنے کی توقع کر سکتے ہیں؟
کیون ویل، چیف پروڈکٹ آفیسر: o-17 مائیکرو اور GPT-(π+1) کے فوراً بعد۔
اور ایک اور سوال اٹھتا ہے:
- ہم کس قسم کے ایجنٹوں کی توقع کر سکتے ہیں؟
- اور مفت صارفین کے لیے ایک ایجنٹ بھی فراہم کریں، جو اپنانے کو تیز کر سکتا ہے…
- DALL·E کے نئے ورژن پر کوئی اپ ڈیٹ؟
- ایک آخری سوال، اور یہ وہ ہے جو ہر کوئی پوچھتا ہے… AGI کو کب نافذ کیا جائے گا؟
کیون ویل، چیف پروڈکٹ آفیسر:
- مزید ایجنٹس: بہت، بہت جلد۔ مجھے لگتا ہے کہ آپ خوش ہوں گے۔
- 4o پر مبنی امیج جنریشن: چند مہینوں میں، میں آپ کے استعمال کرنے کا انتظار نہیں کر سکتا۔ یہ بہت اچھا ہے.
- AGI: ہاں
س: کیا آپ ریجننگ ماڈل میں فائل اٹیچمنٹ کی فعالیت کو شامل کرنے کا ارادہ رکھتے ہیں؟
سرینواس نارائنن، VP انجینئرنگ: یہ ترقی میں ہے۔ مستقبل میں، استدلال ماڈل تلاش کے افعال سمیت مختلف ٹولز استعمال کرنے کے قابل ہو جائے گا۔
کیون ویل، چیف پروڈکٹ آفیسر: صرف یہ کہنے کے لیے، میں استدلال کے ماڈل کو ٹولز استعمال کرنے کے قابل ہونے کا انتظار نہیں کر سکتا۔
س: واقعی۔ جب آپ اس مسئلے کو حل کرتے ہیں تو، کچھ بہت مفید AI ایپلیکیشن کے منظرنامے کھل جائیں گے۔ تصور کریں کہ یہ آپ کے 500GB کام کے دستاویزات کے مواد کو سمجھنے کے قابل ہے۔
جب آپ کسی ای میل کا جواب دینے والے ہوں گے، تو آپ کی ای میل ایپ کے ساتھ ایک پینل کھل جائے گا جو اس شخص سے متعلق تمام معلومات کا مسلسل تجزیہ کرتا ہے، بشمول آپ کے تعلقات، زیر بحث موضوعات، ماضی کا کام وغیرہ۔ شاید آپ کسی دستاویز میں سے کچھ طویل عرصے سے بھول گئے کو جھنڈا لگایا جائے گا کیونکہ یہ موجودہ بحث سے انتہائی متعلقہ ہے۔ میں اس خصوصیت کو بری طرح سے چاہتا ہوں۔
سری نواس نارائنن، VP انجینئرنگ: ہم سیاق و سباق کی لمبائی بڑھانے پر کام کر رہے ہیں۔ ابھی تک کوئی پختہ تاریخ/اعلان نہیں ہے۔
س: اوپن اے آئی کے مستقبل کے لیے اسٹار گیٹ پروجیکٹ کتنا اہم ہے؟ کیون ویل، چیف پروڈکٹ آفیسر: بہت اہم۔ ہم نے جو کچھ بھی دیکھا ہے اس سے پتہ چلتا ہے کہ ہمارے پاس جتنی زیادہ کمپیوٹ طاقت ہے، ہم اتنے ہی بہتر ماڈل بنا سکتے ہیں اور ہم اتنی ہی قیمتی مصنوعات بنا سکتے ہیں۔
ہم ابھی ماڈلز کو دو جہتوں میں سکیل کر رہے ہیں — بڑی پری ٹریننگ اور زیادہ ریانفورسمنٹ لرننگ (RL)/"اسٹرابیری" ٹریننگ — دونوں کے لیے کمپیوٹ وسائل کی ضرورت ہوتی ہے۔
لاکھوں صارفین کی خدمت کے لیے بھی حسابی وسائل کی ضرورت ہوتی ہے! اور جیسا کہ ہم زیادہ ذہین ایجنٹ مصنوعات کی طرف بڑھتے ہیں جو آپ کے لیے مسلسل کام کر سکتے ہیں، اس کے لیے حسابی وسائل کی بھی ضرورت ہوتی ہے۔ لہذا آپ Stargate کے بارے میں ہماری فیکٹری کے طور پر سوچ سکتے ہیں، جہاں بجلی/GPUs کو حیرت انگیز مصنوعات میں تبدیل کیا جاتا ہے۔
سوال: اندرونی طور پر، آپ اب کون سا ماڈل استعمال کر رہے ہیں؟ o4، o5 یا o6؟ o3 کے مقابلے یہ اندرونی ماڈلز کتنے زیادہ ہوشیار ہیں؟
مشیل پوکراس، API ریسرچ کے سربراہ: ہم نے گنتی گنوا دی ہے۔
سوال: براہ کرم ہمیں آواز کی جدید خصوصیات کا استعمال کرتے ہوئے متن/کینوس کے ساتھ تعامل کرنے کی اجازت دیں۔ میں اس سے بات کرنے کے قابل ہونا چاہتا ہوں اور اسے بار بار دستاویزات میں ترمیم کرنا چاہتا ہوں۔
کیون ویل، چیف پروڈکٹ آفیسر: جی ہاں! ہمارے پاس بہت سارے بہترین ٹولز ہیں جو نسبتاً آزادانہ طور پر تیار کیے گئے ہیں – مقصد یہ ہے کہ ان ٹولز کو جلد از جلد اپنے ہاتھ میں لے لیا جائے۔
اگلا مرحلہ ان تمام خصوصیات کو یکجا کرنا ہے تاکہ آپ ایک ایسے ماڈل سے بات کر سکیں، جو ایک ہی وقت میں تلاش اور وجوہات کو ظاہر کرتا ہے، اور ایک ایسا کینوس تیار کر سکتا ہے جو ازگر کو چلا سکے۔ تمام ٹولز کو مل کر بہتر طریقے سے کام کرنے کی ضرورت ہے۔ اور ویسے، تمام ماڈلز کو مکمل ٹول تک رسائی کی ضرورت ہے (او سیریز کے ماڈلز فی الحال تمام ٹولز استعمال نہیں کر سکتے ہیں)، جس پر عمل درآمد بھی کیا جائے گا۔
س: اے سیریز کے ماڈلز ChatGPT میں میموری فنکشن کو کب سپورٹ کریں گے؟
مشیل پوکراس، API ریسرچ کے سربراہ: یہ ترقی میں ہے! O سیریز کے ماڈلز کے ساتھ اپنی تمام خصوصیات کو یکجا کرنا ہماری اولین ترجیح ہے۔
سوال: کیا 4o میں کوئی بڑی بہتری ہوگی؟ مجھے واقعی کسٹم GPT پسند ہے، اور یہ بہت اچھا ہو گا اگر اسے اپ گریڈ کیا جا سکے، یا اگر ہم منتخب کر سکیں کہ کسٹم GPT (جیسے o3 mini) میں کون سا ماڈل استعمال کرنا ہے۔
مشیل پوکراس، API ریسرچ کے سربراہ: ہاں، ہم نے ابھی تک 4o سیریز ختم نہیں کی ہے!