
o3-মিনি গভীর রাতে পৌঁছেছে, এবং OpenAI অবশেষে তার সর্বশেষ ট্রাম্প কার্ড প্রকাশ করেছে। একটি Reddit AMA প্রশ্নোত্তর চলাকালীন, অল্টম্যান গভীরভাবে স্বীকার করেছেন যে তিনি ওপেন সোর্স AI এর ভুল দিকে দাঁড়িয়েছিলেন।
তিনি বলেছিলেন যে ওপেন সোর্সের অভ্যন্তরীণ কৌশল বিবেচনা করা হচ্ছে, এবং মডেলটি বিকাশ করা অব্যাহত থাকবে, তবে ওপেনএআইয়ের নেতৃত্ব আগের মতো বড় হবে না।
যখন সবাই DeepSeek-এর আশ্চর্যজনক শক্তি দেখে বিস্মিত হচ্ছিল, ওপেনএআই অবশেষে আর বসে থাকতে পারেনি।
গতকালের ভোরে, o3-mini জরুরীভাবে চালু করা হয়েছিল, গাণিতিক কোড এবং সিংহাসনে ফিরে আসার মতো বেঞ্চমার্ক পরীক্ষায় নতুন SOTA সেট করে।
সবচেয়ে গুরুত্বপূর্ণ বিষয় হল বিনামূল্যে ব্যবহারকারীরাও এটি উপভোগ করতে পারেন! o3-মিনি কোন রসিকতা নয়। "মানুষের জন্য শেষ পরীক্ষায়" o3-মিনি (উচ্চ) সরাসরি সেরা নির্ভুলতা এবং ক্রমাঙ্কন ত্রুটি অর্জন করেছে৷

কয়েক ঘণ্টা পর o3-মিনি অনলাইন হয়েছে, OpenAI আনুষ্ঠানিকভাবে প্রায় এক ঘন্টার জন্য একটি Reddit AMA খুলল।
অল্টম্যান নিজেও অনলাইনে গিয়ে নেটিজেনদের সব প্রশ্নের উত্তর দিয়েছেন।

প্রধান হাইলাইটগুলি হল:
- DeepSeek সত্যিই খুব ভাল, এবং আমরা আরও ভাল মডেলগুলি বিকাশ করতে থাকব, তবে সীসা আগের মতো বড় হবে না
- কয়েক বছর আগের তুলনায়, আমি এখন বিশ্বাস করতে আগ্রহী যে AI দ্রুত লাফিয়ে ও সীমানা অনুভব করতে পারে
- আমরা ওপেন-সোর্সিং ওয়েটেড এআই মডেলের ইস্যুতে ভুল দিকে আছি
- উন্নত ভয়েস মোডের একটি আপডেট শীঘ্রই আসছে, এবং আমরা এটিকে সরাসরি GPT-5 বলব, GPT-5o নয়৷ এখনো কোনো নির্দিষ্ট সময়সূচি নেই।
অল্টম্যান নিজে ছাড়াও, চিফ রিসার্চ অফিসার মার্ক চেন, চিফ প্রোডাক্ট অফিসার কেভিন ওয়েইল, ইঞ্জিনিয়ারিং ভাইস প্রেসিডেন্ট শ্রীনিবাস নারায়ণন, এপিআই রিসার্চের প্রধান মিশেল পোক্রাস এবং রিসার্চের প্রধান হংইউ রেনও অনলাইনে ছিলেন এবং সতর্কতার সাথে নেটিজেনদের সমস্ত প্রশ্নের উত্তর দিয়েছিলেন।
এর পরে, তারা সবাই কি বলেছিল তা একবার দেখে নেওয়া যাক।
ওপেন সোর্স এআই যুদ্ধে ভুল দিক নিয়ে অল্টম্যান গভীরভাবে অনুতপ্ত
DeepSeek এর আকস্মিক প্রত্যাবর্তন সবার জন্য অপ্রত্যাশিত হতে পারে।
AMA প্রশ্নোত্তর পর্বের সময়, অল্টম্যান নিজেও ওপেন সোর্স AI যুদ্ধে ভুল পক্ষ নেওয়ার জন্য গভীরভাবে অনুতপ্ত হয়েছিলেন এবং DeepSeek এর শক্তিশালী সুবিধাগুলি স্বীকার করতে হয়েছিল।
যা অনেক লোককে অবাক করেছিল তা হল যে অল্টম্যান এমনকি বলেছিলেন যে ওপেনএআই এর নেতৃত্ব আগের মতো শক্তিশালী ছিল না।
নিচের সমস্ত ক্লাসিক উত্তর আমরা অল্টম্যান থেকে সংকলিত করেছি।
প্রশ্ন: সপ্তাহের বড় বিষয় নিয়ে কথা বলি: ডিপসিক। এটি স্পষ্টতই একটি খুব চিত্তাকর্ষক মডেল, এবং আমি জানি এটি সম্ভবত অন্যান্য LLM-এর আউটপুটগুলির উপরে প্রশিক্ষিত ছিল। এটি কীভাবে ভবিষ্যতের মডেলগুলির জন্য আপনার পরিকল্পনা পরিবর্তন করবে?
অল্টম্যান: এটি সত্যিই একটি খুব চিত্তাকর্ষক মডেল! আমরা আরও ভালো মডেল তৈরি করব, কিন্তু আমরা আগের বছরের মতো এত বড় নেতৃত্ব রাখতে পারব না।
প্রশ্ন: আপনি কি মনে করেন পুনরাবৃত্ত স্ব-উন্নতি একটি ধীরে ধীরে প্রক্রিয়া বা হঠাৎ টেক অফ হবে?
অল্টম্যান: ব্যক্তিগতভাবে, আমি মনে করি যে আমি কয়েক বছর আগের তুলনায় এআই দ্রুত অগ্রগতি করতে পারে বলে মনে করি। হয়তো এই বিষয়ে কিছু লেখার সময় এসেছে...
প্রশ্ন: মডেলটি যে সমস্ত টোকেন সম্পর্কে চিন্তা করে, আমরা কি সেগুলি দেখতে পারি?
অল্টম্যান: হ্যাঁ, আমরা শীঘ্রই আরও সহায়ক এবং বিস্তারিত সংস্করণ দেখাব। আপডেটের জন্য R1 কে ধন্যবাদ।
কেভিন ওয়েইল, চিফ প্রোডাক্ট অফিসার: আমরা এখন যা করি তার চেয়ে বেশি দেখানোর জন্য কাজ করছি - এটি শীঘ্রই ঘটবে। আমরা সবকিছু দেখাব কি না তা নির্ধারণ করা বাকি আছে। সমস্ত চিন্তা চেইন (CoT) দেখানো প্রতিযোগী মডেল পাতনের দিকে পরিচালিত করবে, কিন্তু আমরা এটাও জানি যে ব্যবহারকারীরা (অন্তত উন্নত ব্যবহারকারীরা) এটি দেখতে চায়, তাই আমরা একটি ভাল ভারসাম্য খুঁজে পাব।
প্রশ্ন: o3 এর সম্পূর্ণ সংস্করণ কখন উপলব্ধ হবে?
অল্টম্যান: আমি অনুমান করব এটি কয়েক সপ্তাহের বেশি হবে, তবে কয়েক মাসের বেশি নয়।
প্রশ্ন: ভয়েস মোডে একটি আপডেট হবে? এটি কি সম্ভাব্যভাবে GPT-5o-এর জন্য একটি ফোকাস? GPT-5o এর জন্য রুক্ষ টাইমলাইন কি?
অল্টম্যান: হ্যাঁ, উন্নত ভয়েস মোডে একটি আপডেট আসছে! আমি মনে করি আমরা এটিকে শুধু GPT-5 বলব, GPT-5o নয়। এখনও কোন নির্দিষ্ট সময়রেখা নেই।
প্রশ্ন: আপনি কি কিছু মডেল ওজন প্রকাশ এবং কিছু গবেষণা প্রকাশ করার কথা বিবেচনা করবেন?
অল্টম্যান: হ্যাঁ, আমরা এটি নিয়ে আলোচনা করছি। আমি ব্যক্তিগতভাবে মনে করি আমরা এই সমস্যাটির ভুল দিকে আছি এবং একটি ভিন্ন ওপেন সোর্স কৌশল নিয়ে আসা দরকার; ওপেনএআই-এর সকলেই এই দৃষ্টিভঙ্গি ভাগ করে না এবং এই মুহূর্তে এটি আমাদের সর্বোচ্চ অগ্রাধিকার নয়।
আরও একটি প্রশ্ন সেট:
- আমরা নিয়মিত প্লাস প্রোগ্রামে অপারেটর অফার করার কতটা কাছাকাছি?
- রোবোটিক্স বিভাগের শীর্ষ অগ্রাধিকার কি?
- ট্রিলিয়াম, সেরিব্রাস ইত্যাদির মতো আরও বিশেষায়িত চিপস/টিপিইউ সম্পর্কে ওপেনএআই কেমন অনুভব করে? OpenAI কি এই দিকে মনোযোগ দিচ্ছে?
- AGI এবং ASI-তে ভবিষ্যতের ঝুঁকির বিরুদ্ধে হেজ করার জন্য কী বিনিয়োগ করা হচ্ছে?
- আপনার সবচেয়ে স্মরণীয় ছুটি কি ছিল?
অল্টম্যান:
- কয়েক মাস
- একটি ছোট স্কেলে সত্যিই ভাল রোবট তৈরি করতে এবং অভিজ্ঞতা থেকে শিখতে
- GB200 বর্তমানে বীট করা কঠিন!
- একটি ভাল পছন্দ হবে আপনার অভ্যন্তরীণ অবস্থার উন্নতি করা - স্থিতিস্থাপকতা, অভিযোজনযোগ্যতা, শান্ত, আনন্দ ইত্যাদি।
- এটা নির্বাচন করা কঠিন! তবে প্রথম দুটি যা মনে আসে: দক্ষিণ-পূর্ব এশিয়ায় ব্যাকপ্যাকিং বা আফ্রিকার একটি সাফারি
প্রশ্ন: আপনি কি প্লাস সিরিজের দাম বাড়ানোর পরিকল্পনা করছেন?
অল্টম্যান: আসলে, আমি ধীরে ধীরে এটি কমাতে চাই।
প্রশ্ন: ধরুন এটি এখন 2030 সাল, এবং আপনি এইমাত্র একটি সিস্টেম তৈরি করেছেন যেটিকে বেশিরভাগ লোকেরা AGI বলবে। এটি সমস্ত বেঞ্চমার্ক পরীক্ষায় শ্রেষ্ঠত্ব অর্জন করে এবং গতি এবং কর্মক্ষমতার দিক থেকে আপনার সেরা প্রকৌশলী এবং গবেষকদের ছাড়িয়ে যায়। এরপর কি? "ওয়েবসাইটে এটি স্থাপন করা এবং এটি একটি পরিষেবা হিসাবে অফার করা" ছাড়াও, আপনার কি অন্য কোন পরিকল্পনা আছে?
অল্টম্যান: সবচেয়ে গুরুত্বপূর্ণ প্রভাব, আমার মতে, বৈজ্ঞানিক আবিষ্কারকে ত্বরান্বিত করা হবে, যা আমি মনে করি সেই ফ্যাক্টর যা জীবনের মান উন্নয়নে সবচেয়ে বেশি অবদান রাখবে।
4o ইমেজ প্রজন্ম, শীঘ্রই আসছে
পরবর্তীতে, অন্যান্য OpenAI সদস্যদের প্রতিক্রিয়া যোগ করা হয়েছে।
প্রশ্ন: আপনি কি এখনও 4o ইমেজ জেনারেটর চালু করার পরিকল্পনা করছেন?
কেভিন ওয়েইল, প্রধান পণ্য কর্মকর্তা: হ্যাঁ! এবং আমি মনে করি অপেক্ষা করা মূল্যবান।
প্রশ্নঃ দারুণ! একটি মোটামুটি সময়সূচী আছে?
কেভিন ওয়েইল, প্রধান পণ্য কর্মকর্তা: আপনি আমাকে সমস্যায় পড়তে বলছেন। হয়তো কয়েক মাস।
এবং আরেকটি অনুরূপ প্রশ্ন।
প্রশ্ন: আমরা কখন ChatGPT-5 দেখার আশা করতে পারি?
কেভিন ওয়েইল, চিফ প্রোডাক্ট অফিসার: o-17 মাইক্রো এবং GPT-(π+1) এর কিছুক্ষণ পরে।
এবং আরেকটি প্রশ্ন আসে:
- আমরা কি অন্য ধরনের এজেন্ট আশা করতে পারি?
- এবং বিনামূল্যে ব্যবহারকারীদের জন্য একটি এজেন্ট প্রদান করে, যা গ্রহণকে ত্বরান্বিত করতে পারে...
- DALL·E এর নতুন সংস্করণে কোনো আপডেট আছে?
- একটি শেষ প্রশ্ন, এবং এটি সবাই জিজ্ঞাসা করে... AGI কখন বাস্তবায়িত হবে?
কেভিন ওয়েইল, প্রধান পণ্য কর্মকর্তা:
- আরও এজেন্ট: খুব, খুব শীঘ্রই। আমি মনে করি আপনি খুশি হবেন.
- 4o এর উপর ভিত্তি করে ইমেজ জেনারেশন: কয়েক মাসের মধ্যে, আমি এটি ব্যবহার করার জন্য আপনার জন্য অপেক্ষা করতে পারি না। এটা দারুণ.
- এজিআই: হ্যাঁ
প্রশ্ন: আপনি কি যুক্তি মডেলে ফাইল সংযুক্তি কার্যকারিতা যোগ করার পরিকল্পনা করছেন?
শ্রীনিবাস নারায়ণন, ভিপি ইঞ্জিনিয়ারিং: এটি উন্নয়নে রয়েছে। ভবিষ্যতে, যুক্তি মডেল অনুসন্ধান ফাংশন সহ বিভিন্ন সরঞ্জাম ব্যবহার করতে সক্ষম হবে।
কেভিন ওয়েইল, চিফ প্রোডাক্ট অফিসার: শুধু বলার জন্য, আমি যুক্তির মডেলটি সরঞ্জামগুলি ব্যবহার করতে সক্ষম হওয়ার জন্য অপেক্ষা করতে পারি না
প্রশ্ন: সত্যিই। যখন আপনি এই সমস্যাটি সমাধান করবেন, তখন কিছু খুব কার্যকর AI অ্যাপ্লিকেশন দৃশ্যপট খুলে যাবে। কল্পনা করুন যে এটি আপনার 500GB কাজের নথির বিষয়বস্তু বুঝতে সক্ষম হবে।
আপনি যখন একটি ইমেলের উত্তর দিতে চলেছেন, তখন আপনার ইমেল অ্যাপের পাশে একটি প্যানেল খুলবে যা ক্রমাগতভাবে এই ব্যক্তির সাথে সম্পর্কিত সমস্ত তথ্য বিশ্লেষণ করে, যার মধ্যে আপনার সম্পর্ক, আলোচিত বিষয়, অতীতের কাজ ইত্যাদি। সম্ভবত আপনার কোনো নথি থেকে কিছু 'দীর্ঘদিন ভুলে গেছি পতাকাঙ্কিত করা হবে কারণ এটি বর্তমান আলোচনার সাথে অত্যন্ত প্রাসঙ্গিক। আমি এই বৈশিষ্ট্যটি খুব খারাপভাবে চাই।
শ্রীনিবাস নারায়ণন, ভিপি ইঞ্জিনিয়ারিং: আমরা প্রসঙ্গটির দৈর্ঘ্য বাড়ানোর জন্য কাজ করছি। এখনো কোনো দৃঢ় তারিখ/ঘোষণা নেই।
প্রশ্ন: ওপেনএআই-এর ভবিষ্যতের জন্য স্টারগেট প্রকল্প কতটা গুরুত্বপূর্ণ? কেভিন ওয়েইল, চিফ প্রোডাক্ট অফিসার: খুবই গুরুত্বপূর্ণ। আমরা যা দেখেছি তা থেকে বোঝা যায় যে আমাদের যত বেশি কম্পিউট পাওয়ার আছে, তত ভালো মডেল আমরা তৈরি করতে পারি এবং আরও মূল্যবান পণ্য তৈরি করতে পারি।
আমরা এই মুহূর্তে দুটি মাত্রায় মডেল স্কেলিং করছি — বৃহত্তর প্রিট্রেনিং এবং আরও রিইনফোর্সমেন্ট লার্নিং (RL)/“স্ট্রবেরি” প্রশিক্ষণ — উভয়ের জন্যই গণনা সংস্থান প্রয়োজন।
কয়েক মিলিয়ন ব্যবহারকারীদের পরিবেশন করার জন্যও গণনা সংস্থান প্রয়োজন! এবং যেহেতু আমরা আরও বুদ্ধিমান এজেন্ট পণ্যগুলির দিকে এগিয়ে যাচ্ছি যেগুলি আপনার জন্য ক্রমাগত কাজ করতে পারে, এর জন্যও গণনা সংস্থানগুলির প্রয়োজন৷ সুতরাং আপনি স্টারগেটকে আমাদের কারখানা হিসাবে ভাবতে পারেন, যেখানে বিদ্যুৎ/জিপিইউগুলি আশ্চর্যজনক পণ্যগুলিতে রূপান্তরিত হয়।
প্রশ্ন: অভ্যন্তরীণভাবে, আপনি এখন কোন মডেল ব্যবহার করছেন? o4, o5 বা o6? o3 এর তুলনায় এই অভ্যন্তরীণ মডেলগুলি কতটা স্মার্ট?
মিশেল পোক্রাস, API গবেষণার প্রধান: আমরা গণনা হারিয়েছি।
প্রশ্ন: উন্নত ভয়েস বৈশিষ্ট্যগুলি ব্যবহার করার সময় দয়া করে আমাদের পাঠ্য/ক্যানভাসের সাথে যোগাযোগ করার অনুমতি দিন। আমি এটির সাথে কথা বলতে সক্ষম হতে চাই এবং এটিকে পুনরাবৃত্তিমূলকভাবে নথি সংশোধন করতে চাই।
কেভিন ওয়েইল, প্রধান পণ্য কর্মকর্তা: হ্যাঁ! আমাদের কাছে অনেকগুলি দুর্দান্ত সরঞ্জাম রয়েছে যা তুলনামূলকভাবে স্বাধীনভাবে তৈরি করা হয়েছে – লক্ষ্য হল সেই সরঞ্জামগুলিকে যত তাড়াতাড়ি সম্ভব আপনার হাতে তুলে দেওয়া।
পরবর্তী ধাপ হল এই সমস্ত বৈশিষ্ট্যগুলিকে একীভূত করা যাতে আপনি এমন একটি মডেলের সাথে কথা বলতে পারেন, যা একই সাথে অনুসন্ধান এবং কারণ খুঁজে বের করতে পারে এবং একটি ক্যানভাস তৈরি করতে পারে যা পাইথন চালাতে পারে। সমস্ত সরঞ্জামকে একসাথে আরও ভালভাবে কাজ করতে হবে। এবং যাইহোক, সমস্ত মডেলের সম্পূর্ণ সরঞ্জাম অ্যাক্সেস প্রয়োজন (ও-সিরিজ মডেলগুলি বর্তমানে সমস্ত সরঞ্জাম ব্যবহার করতে পারে না), যা বাস্তবায়িতও করা হবে।
প্রশ্ন: ও-সিরিজ মডেলগুলি কখন ChatGPT-তে মেমরি ফাংশন সমর্থন করবে?
মিশেল পোক্রাস, এপিআই রিসার্চের প্রধান: এটি উন্নয়নে রয়েছে! ও-সিরিজ মডেলগুলির সাথে আমাদের সমস্ত বৈশিষ্ট্য একত্রিত করা আমাদের শীর্ষ অগ্রাধিকার।
প্রশ্ন: 4o-তে কি কোনো বড় উন্নতি হবে? আমি সত্যিই কাস্টম জিপিটি পছন্দ করি এবং এটিকে আপগ্রেড করা গেলে এটি দুর্দান্ত হবে, বা যদি আমরা কাস্টম জিপিটি (যেমন o3 মিনি) তে কোন মডেলটি ব্যবহার করতে পারি তা চয়ন করতে পারি।
মিশেল পোক্রাস, API রিসার্চের প্রধান: হ্যাঁ, আমরা এখনও 4o সিরিজ শেষ করিনি!