جھلکیاں

  • LLMs کا جادو یہ ہے کہ وہ بہت لچکدار ہوتے ہیں، بہت سے مختلف حالات کے مطابق ڈھال سکتے ہیں، اور بنیادی ذہانت رکھتے ہیں۔
  • ہم سمجھتے ہیں کہ وقت گزرنے کے ساتھ ساتھ، UI اور UX زیادہ سے زیادہ قدرتی زبان پر مبنی ہوتے جائیں گے، کیونکہ ایجنٹ کا نظام یہی سوچتا ہے، یا یہ بنیادی طور پر بڑے لینگویج ماڈلز (LLMs) کی تربیت کی بنیاد ہے۔
  • اگر آپ چاہتے ہیں کہ کوئی AI ایجنٹ کو قبول کرے، تو وہ دراصل "ایمان کی چھلانگ" کی ڈگری لے رہے ہیں کیونکہ بہت سے لوگوں کے لیے، یہ ایک بہت ہی ناواقف فیلڈ ہے۔

AI ایجنٹ کسٹمر کے تجربے کو نئی شکل دیتا ہے۔

جیسی ژانگ: ایجنٹ اصل میں کیسے بنایا جاتا ہے؟ ہمارا خیال یہ ہے کہ وقت گزرنے کے ساتھ، یہ قدرتی زبان پر مبنی ایجنٹ کی طرح زیادہ ہوتا جائے گا کیونکہ اس طرح بڑے لینگویج ماڈلز (LLMs) کو تربیت دی جاتی ہے۔

طویل مدتی میں، اگر آپ کے پاس کوئی انتہائی ذہین ایجنٹ ہے جو دراصل ایک انسان کی طرح ہے، تو آپ اسے چیزیں دکھا سکتے ہیں، اسے سمجھا سکتے ہیں، اسے رائے دے سکتے ہیں، اور یہ اس کے ذہن میں موجود معلومات کو اپ ڈیٹ کر دے گا۔

آپ تصور کرسکتے ہیں کہ ایک بہت ہی قابل انسانی ٹیم ممبر ہے۔ جب وہ پہلی بار شامل ہوتے ہیں تو آپ انہیں کچھ سکھاتے ہیں، وہ کام کرنے لگتے ہیں، اور پھر آپ انہیں رائے دیتے ہیں اور انہیں نئی معلومات دکھاتے ہیں۔

آخرکار، یہ اس سمت میں ترقی کرے گا – یہ زیادہ گفتگو کرنے والا اور فطری زبان پر مبنی ہو جائے گا، اور لوگوں کا ایک دوسرے کے ساتھ بات چیت کا طریقہ زیادہ فطری ہو جائے گا۔ اور لوگ اب ان پیچیدہ فیصلے والے درختوں کو ضروریات کو پورا کرنے کے لیے استعمال نہیں کریں گے، جو کام کر سکتے ہیں لیکن گرنے کا خطرہ رکھتے ہیں۔

ماضی میں، ہمیں یہ کرنا پڑا کیونکہ ہمارے پاس زبان کا بڑا ماڈل نہیں تھا۔ لیکن اب، ایجنٹ کی مسلسل پیشرفت کے ساتھ، صارف کا تجربہ (UX) اور یوزر انٹرفیس (UI) مزید بات چیت کرنے والا ہو جائے گا۔

ڈیرک ہیرس: سب کو ہیلو، A16z AI پوڈکاسٹ میں خوش آمدید۔ میں ڈیرک ہیرس ہوں، اور آج میرے ساتھ ڈیکاگون کے شریک بانی اور سی ای او جیسی ژانگ اور a16z میں ایک پارٹنر کمبرلی ٹین شامل ہوں گے۔ کمبرلی بحث کو معتدل کریں گے، اور جیسی ڈیکاگن اور اس کی مصنوعات بنانے کے اپنے تجربے کا اشتراک کریں گے۔

اگر آپ اس کے بارے میں زیادہ نہیں جانتے ہیں تو، Decagon ایک سٹارٹ اپ ہے جو کسٹمر سپورٹ میں مدد کے لیے کاروباری اداروں کو AI ایجنٹ فراہم کرتا ہے۔ یہ ایجنٹس ایک API کال کے لیے نہ تو چیٹ بوٹس ہیں اور نہ ہی LLM ریپر، بلکہ انتہائی حسب ضرورت جدید ایجنٹ ہیں جو کمپنی کی مخصوص ضروریات کی بنیاد پر پیچیدہ ورک فلو کو سنبھال سکتے ہیں۔

یہ بتانے کے علاوہ کہ انہوں نے Decagon کیوں بنایا اور مختلف LLM اور کسٹمر ماحول کو سنبھالنے کے لیے اسے کس طرح بنایا گیا ہے، Jesse ایک کاروباری ماڈل کے فوائد کے بارے میں بھی بات کرتا ہے جو ہر گفتگو کے لیے چارج کرتا ہے، اور کس طرح AI ایجنٹس کسٹمر سپورٹ لیڈرز کی مطلوبہ مہارتوں کو تبدیل کریں گے۔

یہ بات بھی قابل ذکر ہے کہ کمبرلی نے حال ہی میں "RIP to RPA، The Rise of Intelligent Automation" کے عنوان سے ایک بلاگ پوسٹ لکھی ہے، جس پر ہم اس ایپی سوڈ میں مختصراً گفتگو کریں گے۔

یہ سمجھنے کے لیے ایک بہترین نقطہ آغاز ہے کہ کاروباری عمل میں آٹومیشن کس طرح شروع ہو رہی ہے، اور ہم شو نوٹس میں ایک لنک فراہم کریں گے۔ اور آخر میں، ایک یاد دہانی کے طور پر، اس مضمون کا مواد صرف معلوماتی مقاصد کے لیے ہے اور اسے قانونی، کاروبار، ٹیکس یا سرمایہ کاری کے مشورے پر غور نہیں کیا جانا چاہیے، اور نہ ہی اس کا استعمال کسی سرمایہ کاری یا سیکیورٹی کا جائزہ لینے کے لیے کیا جانا چاہیے، اور یہ کسی بھی a16z فنڈ کے سرمایہ کار یا ممکنہ سرمایہ کار کے لیے نہیں ہے۔

جیسی ژانگ: اپنا مختصر تعارف۔ میں بولڈر میں پیدا ہوا اور پرورش پایا، اور میں نے بچپن میں ریاضی کے بہت سے مقابلوں میں حصہ لیا۔ میں نے ہارورڈ میں کمپیوٹر سائنس کی تعلیم حاصل کی، اور پھر ایک کمپنی شروع کی جسے a16z کی حمایت حاصل تھی۔ ہمیں آخر کار Niantic نے حاصل کر لیا۔

پھر ہم نے ڈیکاگن بنانا شروع کیا۔ ہمارا کاروبار کسٹمر سروس کے لیے AI ایجنٹس بنا رہا ہے۔ شروع میں، ہم نے ایسا اس لیے کیا کیونکہ ہم کچھ ایسا کرنا چاہتے تھے جو ہمارے دل کے بہت قریب ہو۔

بلاشبہ، کسٹمر سروس میں AI ایجنٹوں کے کردار کے بارے میں کسی کو سکھانے کی ضرورت نہیں ہے، ٹھیک ہے؟ ہم سب ایئر لائنز، ہوٹلوں وغیرہ کے ساتھ فون پر رہے ہیں، اور ہولڈ پر انتظار کر رہے ہیں۔ تو وہاں سے خیال آیا۔

ہم نے بہت سارے صارفین سے بات کی تاکہ یہ معلوم کیا جا سکے کہ ہمیں کس قسم کی پروڈکٹ تیار کرنی چاہیے۔ ایک چیز جو ہمارے لیے نمایاں تھی وہ یہ تھی کہ جیسا کہ ہم نے AI ایجنٹس کے بارے میں مزید معلومات حاصل کیں، ہم نے یہ سوچنا شروع کیا کہ مستقبل کیسا ہو گا جب ان میں سے بہت سارے ہوں گے۔ میرے خیال میں ہر ایک کو یقین ہے کہ مستقبل میں بہت سارے AI ایجنٹس ہوں گے۔

ہم اس بارے میں سوچتے ہیں کہ اے آئی ایجنٹس کے ارد گرد کام کرنے والے ملازمین کیا کریں گے؟ ان کے پاس کس قسم کے اوزار ہوں گے؟ وہ ان ایجنٹوں کو کیسے کنٹرول یا دیکھیں گے جن کے ساتھ وہ کام کرتے ہیں یا ان کا نظم کرتے ہیں؟

تو یہ اس کا بنیادی ہے کہ ہم نے اس سوال کے ارد گرد کمپنی کیسے بنائی۔ میرے خیال میں یہ وہی چیز ہے جو ہمیں اس وقت الگ کرتی ہے، کیونکہ ہم ان AI ایجنٹوں کو مختلف ٹولز فراہم کرتے ہیں تاکہ ہم ان لوگوں کی مدد کریں جن کے ساتھ ہم کام کرتے ہیں اور ان ایجنٹوں کو تشکیل دیتے ہیں تاکہ وہ اب "بلیک باکس" نہ رہیں۔ اس طرح ہم اپنا برانڈ بناتے ہیں۔

ڈیرک ہیرس: آپ کو کس چیز نے متاثر کیا، کیوں کہ آپ کی آخری کمپنی ایک صارف کا سامنا کرنے والی ویڈیو کمپنی تھی، انٹرپرائز سافٹ ویئر میں جانے کے لیے؟

جیسی ژانگ: زبردست سوال۔ میرے خیال میں جب کسی موضوع کو منتخب کرنے کی بات آتی ہے تو بانی اکثر "موضوع کی آگناسٹک" ہوتے ہیں، کیونکہ حقیقت میں، جب آپ کسی نئے شعبے سے رجوع کرتے ہیں، تو آپ عام طور پر بہت سادہ مزاج ہوتے ہیں۔ لہذا چیزوں کو ایک نئے نقطہ نظر سے دیکھنے کا ایک فائدہ ہے۔ لہذا جب ہم اس کے بارے میں سوچ رہے تھے، تو تقریباً کوئی موضوع کی پابندیاں نہیں تھیں۔

مجھے لگتا ہے کہ زیادہ مقداری پس منظر والے لوگوں کے لیے یہ ایک بہت عام نمونہ ہے، میں خود بھی شامل ہوں۔ صارفین کی مصنوعات کو آزمانے کے بعد، آپ انٹرپرائز سافٹ ویئر کی طرف زیادہ توجہ مرکوز کرتے ہیں کیونکہ انٹرپرائز سافٹ ویئر میں زیادہ ٹھوس مسائل ہوتے ہیں۔

آپ کے پاس حقیقی ضروریات اور بجٹ اور اس جیسی چیزوں کے ساتھ حقیقی صارفین ہیں، اور آپ ان کے لیے مسائل کو بہتر اور حل کر سکتے ہیں۔ صارفین کی مارکیٹ بھی بہت پرکشش ہے، لیکن یہ تجربات سے چلنے کے بجائے وجدان پر مبنی ہے۔ میرے لیے ذاتی طور پر، انٹرپرائز سافٹ ویئر ایک بہتر فٹ ہے۔

کمبرلی ٹین: سب سے پہلے، ہم اس سوال کے ساتھ شروع کر سکتے ہیں: سب سے عام سپورٹ کیٹیگریز کون سی ہیں جن کے ساتھ ڈیکاگن آج ڈیل کرتا ہے؟ کیا آپ ان مسائل کو حل کرنے کے لیے بڑے لینگوئج ماڈلز (LLMs) کو کس طرح استعمال کرتے ہیں اور اب آپ کیا کر سکتے ہیں جو آپ پہلے نہیں کر سکتے تھے اس کی وضاحت کر سکتے ہیں؟

جیسی ژانگ: اگر آپ پچھلی آٹومیشن پر نظر ڈالیں تو، آپ نے فیصلہ کرنے والے درختوں کا استعمال کچھ آسان کرنے کے لیے کیا ہوگا، اس بات کا تعین کرنے کے لیے کہ کون سا راستہ اختیار کرنا ہے۔ لیکن ہم سب نے چیٹ بوٹس استعمال کیے ہیں، اور یہ کافی مایوس کن تجربہ ہے۔

اکثر آپ کے سوال کا جواب فیصلہ کن درخت سے پوری طرح سے نہیں دیا جا سکتا۔ لہذا آپ کو ایک سوال کے راستے پر بھیج دیا جائے گا جو سوال سے متعلق ہے لیکن اس سے بالکل میل نہیں کھاتا ہے۔ اب، ہمارے پاس بڑے لینگویج ماڈل (LLMs) ہیں۔ LLMs کا جادو یہ ہے کہ وہ بہت لچکدار ہوتے ہیں، بہت سے مختلف حالات کے مطابق ڈھال سکتے ہیں، اور بنیادی ذہانت رکھتے ہیں۔

جب آپ اسے کسٹمر سپورٹ پر لاگو کرتے ہیں، یا جب کوئی گاہک کوئی سوال پوچھتا ہے، تو آپ مزید ذاتی نوعیت کی سروس فراہم کر سکتے ہیں۔ یہ پہلا نکتہ ہے، پرسنلائزیشن کی سطح بہت بہتر ہوئی ہے۔ یہ اعلی میٹرکس کو غیر مقفل کرتا ہے۔ آپ مزید مسائل حل کر سکتے ہیں، گاہک زیادہ مطمئن ہیں، اور گاہک کی اطمینان میں اضافہ ہوتا ہے۔

اگلا فطری مرحلہ یہ ہے: اگر آپ کے پاس یہ ذہانت ہے، تو آپ کو ان کاموں میں سے زیادہ کرنے کے قابل ہونا چاہیے جو انسان کر سکتے ہیں۔ وہ چیزیں جو انسان کر سکتے ہیں وہ یہ ہیں کہ وہ حقیقی وقت میں ڈیٹا کھینچ سکتے ہیں، وہ کارروائی کر سکتے ہیں، اور وہ متعدد مراحل سے استدلال کر سکتے ہیں۔ اگر کوئی گاہک نسبتاً پیچیدہ سوال پوچھتا ہے، تو شاید "میں یہ اور وہ کرنا چاہتا ہوں،" اور AI صرف پہلے سوال کو ہینڈل کرنے کے لیے تیار ہے۔ ایل ایل ایم اس بات کو پہچاننے کے لیے کافی ہوشیار ہے کہ یہاں دو سوالات ہیں۔ سب سے پہلے، یہ پہلا مسئلہ حل کرے گا، اور پھر دوسرے مسئلے کو حل کرنے میں آپ کی مدد کرے گا۔

ایل ایل ایم کے ساتھ آنے سے پہلے، یہ بنیادی طور پر ناممکن تھا۔ لہٰذا اب ہم ایک قدم تبدیلی دیکھ رہے ہیں کہ ٹیکنالوجی کیا کرنے کی صلاحیت رکھتی ہے، اور وہ ایل ایل ایم کی بدولت ہے۔

کمبرلی ٹین: اس تناظر میں، آپ AI ایجنٹ کی تعریف کیسے کریں گے؟ جیسا کہ لفظ "ایجنٹ" بڑے پیمانے پر استعمال ہوتا ہے، میں جاننا چاہتا ہوں کہ Decagon کے تناظر میں اس کا اصل مطلب کیا ہے۔

جیسی ژانگ: میں یہ کہوں گا کہ ایجنٹ ایک ایسے نظام سے زیادہ مراد کرتا ہے جہاں ایک سے زیادہ LLM (بڑے زبان کا ماڈل) سسٹم مل کر کام کرتے ہیں۔ آپ کے پاس LLM کی درخواست ہے، جس میں بنیادی طور پر فوری بھیجنا اور جواب حاصل کرنا شامل ہے۔ ایک ایجنٹ کے لیے، آپ اس طرح کی متعدد درخواستوں کو جوڑنے کے قابل ہونا چاہتے ہیں، شاید بار بار بھی۔

مثال کے طور پر، آپ کے پاس ایک LLM کال ہے جو اس بات کا تعین کرتی ہے کہ پیغام کو کیسے ہینڈل کرنا ہے، اور پھر یہ دوسری کالز کو متحرک کر سکتا ہے جو مزید ڈیٹا کھینچتی ہیں، کارروائیاں کرتی ہیں، اور صارف کے کہنے پر اعادہ کرتی ہیں، شاید فالو اپ سوالات بھی پوچھیں۔ لہذا ہمارے لیے، ایجنٹ کو تقریباً LLM کالز، API کالز، یا دیگر منطق کے نیٹ ورک کے طور پر سمجھا جا سکتا ہے جو ایک بہتر تجربہ فراہم کرنے کے لیے مل کر کام کرتے ہیں۔

کمبرلی ٹین: اس موضوع پر، شاید ہم ایجنٹ کے بنیادی ڈھانچے کے بارے میں مزید بات کر سکتے ہیں جو آپ نے اصل میں بنایا ہے۔ میرے خیال میں ایک بہت ہی دلچسپ نکتہ یہ ہے کہ مارکیٹ میں AI ایجنٹوں کے بہت سے مظاہرے موجود ہیں، لیکن میرے خیال میں ان کی بہت کم مثالیں ہیں جو حقیقت میں پیداواری ماحول میں مستحکم طور پر چل سکتی ہیں۔ اور باہر سے یہ جاننا مشکل ہے کہ کیا اصلی ہے اور کیا نہیں۔

تو آپ کی رائے میں، آج کے AI ایجنٹس کے کون سے پہلو اچھی کارکردگی کا مظاہرہ کر رہے ہیں، اور کن پہلوؤں کو اب بھی زیادہ مضبوط اور قابل اعتماد بنانے کے لیے تکنیکی پیش رفت کی ضرورت ہے؟

جیسی ژانگ: میرا نقطہ نظر اصل میں تھوڑا مختلف ہے. اس بات کا تعین کرنے کے درمیان فرق کہ آیا ایک AI ایجنٹ صرف ایک ڈیمو ہے یا "واقعی کام کر رہا ہے" مکمل طور پر ٹیکنالوجی کے اسٹیک میں نہیں ہے، کیونکہ میرے خیال میں زیادہ تر لوگ تقریباً وہی ٹیکنالوجی استعمال کر رہے ہوں گے۔ میرا خیال ہے کہ ایک بار جب آپ اپنی کمپنی کی ترقی میں مزید آگے بڑھیں گے، مثال کے طور پر، ہماری کمپنی کو قائم ہوئے ایک سال سے زیادہ کا عرصہ ہو گیا ہے، آپ کوئی ایسی خاص چیز بنائیں گے جو آپ کے استعمال کے معاملے کے مطابق ہو۔

لیکن حتمی تجزیہ میں، ہر کوئی ایک ہی ماڈل تک رسائی حاصل کرسکتا ہے اور اسی طرح کی ٹیکنالوجی کا استعمال کرسکتا ہے۔ میرے خیال میں اس بات کا سب سے بڑا فرق ہے کہ آیا کوئی AI ایجنٹ مؤثر طریقے سے کام کر سکتا ہے دراصل استعمال کے معاملے کی صورت میں ہے۔ شروع میں یہ جاننا مشکل ہے، لیکن پیچھے مڑ کر دیکھیں تو آپ کو معلوم ہوگا کہ AI ایجنٹ کے لیے دو صفات ہیں جو مظاہرے سے آگے بڑھ کر عملی اطلاق میں داخل ہونے کے لیے بہت اہم ہیں۔

پہلا یہ کہ آپ جس استعمال کے معاملے کو حل کرتے ہیں وہ قابل مقدار ROI (سرمایہ کاری پر واپسی) کا ہونا ضروری ہے۔ یہ بہت اہم ہے، کیونکہ اگر ROI کی مقدار درست نہیں کی جا سکتی ہے، تو لوگوں کو اس بات پر قائل کرنا مشکل ہو جائے گا کہ وہ آپ کی پروڈکٹ کو استعمال کریں اور اس کی ادائیگی کریں۔ ہمارے معاملے میں، مقداری اشارے یہ ہے: آپ کتنے فیصد سپورٹ کی درخواستوں کو حل کرتے ہیں؟ چونکہ یہ نمبر واضح ہے، لوگ اسے سمجھ سکتے ہیں - اوہ، ٹھیک ہے، اگر آپ مزید حل کرتے ہیں، تو میں اس نتیجے کا اپنے موجودہ اخراجات اور گزارے ہوئے وقت سے موازنہ کر سکتا ہوں۔ لہذا، اگر یہ اشارے موجود ہیں، تو ایک اور اشارے جو ہمارے لیے بہت اہم ہے وہ ہے گاہک کی اطمینان۔ کیونکہ ROI کو آسانی سے مقدار میں لگایا جا سکتا ہے، لوگ واقعی اسے اپنائیں گے۔

دوسرا عنصر یہ ہے کہ استعمال کے معاملات بتدریج زیادہ مشکل ہونے چاہئیں۔ یہ بھی بہت مشکل ہو گا اگر آپ کو شروع سے ہی مافوق الفطرت ہونے کے لیے کسی ایجنٹ کی ضرورت ہو، تقریباً 100% استعمال کے معاملات کو حل کرنا۔ کیونکہ جیسا کہ ہم جانتے ہیں، LLMs غیر مقررہ ہیں، آپ کے پاس کسی قسم کا ہنگامی منصوبہ ہونا ضروری ہے۔ خوش قسمتی سے، سپورٹ کے استعمال کے معاملات کی ایک بڑی خصوصیت ہے، اور وہ یہ ہے کہ آپ ہمیشہ کسی انسان تک پہنچ سکتے ہیں۔ یہاں تک کہ اگر آپ صرف آدھے مسائل کو حل کرسکتے ہیں، تب بھی یہ لوگوں کے لیے بہت قیمتی ہے۔

تو میں سمجھتا ہوں کہ سپورٹ میں یہ خصوصیت ہے جو اسے AI ایجنٹ کے لیے بہت موزوں بناتی ہے۔ میرے خیال میں ایسے بہت سے دوسرے شعبے ہیں جہاں لوگ متاثر کن ڈیمو بنا سکتے ہیں جہاں آپ کو یہ سمجھنے کے لیے قریب سے دیکھنے کی ضرورت نہیں ہے کہ AI ایجنٹ کیوں کارآمد ہوگا۔ لیکن اگر اسے شروع سے ہی کامل ہونا ہے، تو یہ بہت مشکل ہے۔ اگر ایسا ہے تو، تقریباً کوئی بھی اسے آزمانا یا استعمال نہیں کرنا چاہے گا کیونکہ اس کی خرابی کے نتائج بہت سنگین ہو سکتے ہیں - مثال کے طور پر، سیکورٹی کے لحاظ سے۔

مثال کے طور پر، جب لوگ نقالی کرتے ہیں، تو ان کے پاس ہمیشہ یہ کلاسک خیال ہوتا ہے: "اوہ، یہ بہت اچھا ہوگا اگر LLM اسے پڑھ سکے۔" لیکن یہ تصور کرنا مشکل ہے کہ کوئی کہے، "ٹھیک ہے، اے آئی ایجنٹ، اس کے لیے جاؤ۔ مجھے یقین ہے کہ آپ یہ کر سکتے ہیں۔" کیونکہ اگر یہ غلطی کرتا ہے تو اس کے نتائج بہت سنگین ہوسکتے ہیں۔

جیسی ژانگ: یہ عام طور پر ہمارے گاہکوں کی طرف سے فیصلہ کیا جاتا ہے، اور حقیقت میں ہم اختلافات کی ایک بہت وسیع رینج دیکھتے ہیں. ایک انتہا پر، کچھ لوگ واقعی اپنے ایجنٹ کو انسان کی طرح بناتے ہیں، اس لیے وہاں ایک انسانی اوتار، ایک انسانی نام ہے، اور ردعمل بہت فطری ہیں۔ دوسری طرف، ایجنٹ صرف یہ کہتا ہے کہ یہ AI ہے اور صارف پر یہ واضح کرتا ہے۔ میرے خیال میں ہم جن مختلف کمپنیوں کے ساتھ کام کرتے ہیں ان کی اس پر مختلف پوزیشنیں ہیں۔

عام طور پر، اگر آپ ریگولیٹڈ انڈسٹری میں ہیں، تو آپ کو یہ واضح کرنا ہوگا۔ مجھے اب جو چیز دلچسپ لگتی ہے وہ یہ ہے کہ کسٹمر کا رویہ بدل رہا ہے۔ کیونکہ ہمارے بہت سے صارفین کو سوشل میڈیا پر بہت زیادہ تاثرات مل رہے ہیں، جیسے، "اوہ مائی گاڈ، یہ پہلا چیٹ تجربہ ہے جس کی میں نے کبھی کوشش کی ہے جو حقیقت میں بہت حقیقی محسوس ہوتا ہے،" یا "یہ صرف جادو ہے۔" اور یہ ان کے لیے بہت اچھا ہے، کیونکہ اب ان کے گاہک سیکھ رہے ہیں، ارے، اگر یہ AI کا تجربہ ہے، تو یہ حقیقت میں انسان سے بہتر ہو سکتا ہے۔ ماضی میں ایسا نہیں تھا، کیونکہ ہم میں سے اکثر کو ماضی میں اس قسم کا فون کسٹمر سروس کا تجربہ رہا ہے: "ٹھیک ہے، AI، AI، AI…"

کمبرلی ٹین: آپ نے چند بار ذاتی نوعیت کے تصور کا ذکر کیا۔ ہر کوئی ایک ہی بنیادی ٹیکنالوجی کے فن تعمیر کا استعمال کر رہا ہے، لیکن معاون خدمات کے لحاظ سے ان کی ذاتی نوعیت کی مختلف ضروریات ہیں۔ کیا آپ اس کے بارے میں بات کر سکتے ہیں؟ خاص طور پر، آپ کس طرح پرسنلائزیشن حاصل کرتے ہیں تاکہ لوگ آن لائن کہہ سکیں، "میرے خدا، یہ سب سے بہترین تعاون کا تجربہ ہے جو میں نے کبھی کیا ہے"؟

جیسی ژانگ: ہمارے لیے، پرسنلائزیشن صارف کے لیے حسب ضرورت سے آتی ہے۔ آپ کو صارف کے پس منظر کی معلومات کو سمجھنے کی ضرورت ہے، جو اضافی سیاق و سباق کی ضرورت ہے۔ دوم، آپ کو ہمارے صارفین کی کاروباری منطق کو بھی سمجھنا ہوگا۔اگر آپ دونوں کو یکجا کرتے ہیں، تو آپ ایک بہت اچھا تجربہ فراہم کر سکتے ہیں۔

ظاہر ہے، یہ آسان لگتا ہے، لیکن حقیقت میں تمام مطلوبہ سیاق و سباق حاصل کرنا بہت مشکل ہے۔ لہٰذا، ہمارا زیادہ تر کام اس بات پر ہے کہ صحیح پرائمٹیو اجزاء کو کیسے بنایا جائے تاکہ جب کوئی صارف ہمارے سسٹم کو تعینات کرے، تو وہ آسانی سے فیصلہ کر سکے، "ٹھیک ہے، یہ وہ کاروباری منطق ہے جو ہم چاہتے ہیں۔" مثال کے طور پر، پہلے آپ کو یہ چار مراحل کرنے کی ضرورت ہے، اور اگر تیسرا مرحلہ ناکام ہو جاتا ہے، تو آپ کو پانچویں مرحلے پر جانے کی ضرورت ہے۔

آپ AI کو یہ بہت آسانی سے سکھانے کے قابل ہونا چاہتے ہیں، لیکن اسے معلومات تک رسائی بھی دیں جیسے، "یہ صارف کے اکاؤنٹ کی تفصیلات ہے۔ اگر آپ کو مزید معلومات درکار ہوں تو آپ ان APIs کو کال کر سکتے ہیں۔ یہ پرتیں ماڈل کے اوپر ایک کوآرڈینیشن پرت ہیں، اور ایک طرح سے، وہ ایجنٹ کو واقعی قابل استعمال بناتی ہیں۔

کمبرلی ٹین: ایسا لگتا ہے کہ اس معاملے میں، آپ کو کاروباری نظام تک بہت زیادہ رسائی کی ضرورت ہے۔ آپ کو صارفین کے بارے میں بہت کچھ جاننے کی ضرورت ہے، اور آپ کو شاید یہ جاننے کی ضرورت ہے کہ گاہک دراصل اپنے صارفین کے ساتھ کس طرح بات چیت کرنا چاہتا ہے۔میں تصور کرتا ہوں کہ یہ ڈیٹا بہت حساس ہوسکتا ہے۔

کیا آپ ان یقین دہانیوں کی وضاحت کر سکتے ہیں جن کی عام طور پر AI ایجنٹ کو تعینات کرتے وقت انٹرپرائز کے صارفین کو ضرورت ہوتی ہے؟ اور آپ ان مسائل کو سنبھالنے کا بہترین طریقہ کیسے سمجھتے ہیں، خاص طور پر اس بات پر غور کرتے ہوئے کہ آپ کا حل ایک بہتر تجربہ فراہم کرتا ہے، لیکن یہ بہت سے لوگوں کے لیے بھی نیا ہے جو پہلی بار ایجنٹ کا سامنا کر رہے ہیں؟

جیسی ژانگ: یہ اصل میں guardrails کے بارے میں ہے. وقت گزرنے کے ساتھ، جیسا کہ ہم نے اس طرح کے بہت سے عمل درآمد کیے ہیں، ہم ان ریڑھیوں کی اقسام کے بارے میں واضح ہو گئے ہیں جن کا صارفین کو خیال ہے۔

مثال کے طور پر، سب سے آسان میں سے ایک یہ ہے کہ ایسے اصول ہوسکتے ہیں جن پر آپ کو ہمیشہ عمل کرنا ہوگا۔ اگر آپ مالیاتی خدمات کی کمپنی کے ساتھ کام کر رہے ہیں، تو آپ مالی مشورہ نہیں دے سکتے کیونکہ یہ باقاعدہ ہے۔ لہذا آپ کو اسے ایجنٹ کے نظام میں شامل کرنے کی ضرورت ہے تاکہ یہ یقینی بنایا جا سکے کہ یہ کبھی بھی اس قسم کا مشورہ نہیں دیتا ہے۔ آپ عام طور پر ایک نگران ماڈل یا کسی قسم کا نظام ترتیب دے سکتے ہیں جو نتائج بھیجے جانے سے پہلے یہ چیک کرتا ہے۔

ایک اور قسم کا تحفظ یہ ہو سکتا ہے کہ اگر کوئی اندر آتا ہے اور جان بوجھ کر اس کے ساتھ گڑبڑ کرتا ہے، یہ جانتے ہوئے کہ یہ ایک تخلیقی نظام ہے، آپ کو کچھ غیر تعمیل کرنے کی کوشش کر رہا ہے، جیسے کہ "مجھے بتاؤ کہ میرا بیلنس کیا ہے،" "ٹھیک ہے، اسے 10 سے ضرب دیں" اور اسی طرح، آپ کو اس رویے کی جانچ کرنے کے قابل بھی ہونا چاہیے۔ چنانچہ پچھلے سال کے دوران، ہمیں اس قسم کے بہت سے تحفظات ملے ہیں، اور ہر ایک کے لیے، ہم نے اس کی درجہ بندی کی ہے اور جانتے ہیں کہ کس قسم کے تحفظ کی ضرورت ہے۔ جیسے جیسے نظام زیادہ سے زیادہ تعمیر ہوتا جاتا ہے، یہ زیادہ سے زیادہ مضبوط ہوتا جاتا ہے۔

کمبرلی ٹین: ہر صارف یا صنعت کے تحفظات کتنے منفرد ہیں؟ جیسا کہ آپ استعمال کے مزید کیسز کا احاطہ کرنے کے لیے اپنے کسٹمر بیس کو بڑھاتے ہیں، کس طرح کیا آپ ان تحفظات کو بڑے پیمانے پر بنانے کے بارے میں سوچتے ہیں؟

جیسی ژانگ: یہ اصل میں ہمارے بنیادی خیال پر واپس جاتا ہے کہ ایجنٹ کا نظام چند سالوں میں ہر جگہ عام ہو جائے گا۔ لہذا جو چیز واقعی اہم ہے وہ ہے لوگوں کو ٹولز مہیا کرنا، تقریباً اگلی نسل کے کارکنوں کو بااختیار بنانا، جیسا کہ ایجنٹ سپروائزر، انہیں ایجنٹ کا نظام بنانے اور ان کے اپنے تحفظات شامل کرنے کے لیے ٹولز فراہم کرنا، کیونکہ ہم ان کے لیے تحفظات کی وضاحت نہیں کرنے جا رہے ہیں۔

ہر صارف اپنے تحفظ کے اقدامات اور کاروباری منطق کو بہتر طور پر جانتا ہے۔ لہذا ہمارا کام دراصل ٹولز اور انفراسٹرکچر کی تعمیر کا ایک اچھا کام کرنا ہے تاکہ وہ ایجنٹ سسٹم بنا سکیں۔ لہذا، ہم نے ہمیشہ زور دیا ہے کہ ایجنٹ سسٹم بلیک باکس نہیں ہونا چاہیے، اور آپ کو یہ کنٹرول کرنے کے قابل ہونا چاہیے کہ ان تحفظات، اصولوں اور منطق کو کیسے بنایا جائے۔

مجھے لگتا ہے کہ شاید یہ اب تک کا ہمارا سب سے مختلف پہلو ہے۔ ہم نے ان ٹولز میں بہت زیادہ کوششیں کی ہیں اور تخلیقی طریقے نکالے ہیں تاکہ ایسے لوگوں کو اجازت دی جا سکے جن کے پاس بہت زیادہ تکنیکی پس منظر نہ ہو، یا یہاں تک کہ AI ماڈلز کے کام کرنے کے بارے میں گہری سمجھ نہ ہو، وہ اب بھی ان کارروائیوں کو داخل کرنے کے لیے جو وہ چاہتے ہیں کہ AI ایجنٹ سسٹم میں انجام دے۔

مجھے لگتا ہے کہ اگلے چند سالوں میں یہ تیزی سے اہم صلاحیت بننے جا رہی ہے۔ جب لوگ اسی طرح کے ٹولز کا جائزہ لے رہے ہوں تو یہ سب سے اہم معیارات میں سے ایک ہونا چاہئے، کیونکہ آپ وقت کے ساتھ ساتھ ان سسٹمز کو مسلسل بہتر اور بہتر بنانے کے قابل ہونا چاہتے ہیں۔

فطری زبان سے چلنے والی کاروباری منطق

ڈیرک ہیرس: کسی بھی قسم کی آٹومیشن، اور خاص طور پر اس ایجنٹ سسٹم کے استعمال کے لیے گاہک یا کاروبار کیا تیاری کر سکتے ہیں؟ مثال کے طور پر، وہ اپنے ڈیٹا سسٹمز، سافٹ ویئر فن تعمیر یا کاروباری منطق کو اس طرح کے سسٹمز کو سپورٹ کرنے کے لیے کیسے ڈیزائن کر سکتے ہیں؟

کیونکہ میں محسوس کرتا ہوں کہ پہلے تو بہت ساری AI ٹکنالوجی نئی ہے، لیکن جب بات موجودہ میراثی نظاموں کی ہو، تو اسے اکثر بہت زیادہ افراتفری کا سامنا کرنا پڑتا ہے۔

جیسی ژانگ: اگر کوئی ابھی شروع سے تعمیر کر رہا ہے، تو بہت سارے بہترین طریقے ہیں جو آپ کے کام کو آسان بنا سکتے ہیں۔ مثال کے طور پر، اپنے علم کی بنیاد کو کس طرح تشکیل دیا جائے۔ ہم نے ان میں سے کچھ کے بارے میں لکھا ہے، اور کچھ ایسے طریقے متعارف کرائے ہیں جو AI کے لیے معلومات کو ہضم کرنا اور اس کی درستگی کو بہتر بنا سکتے ہیں۔ ایک خاص تجویز یہ ہے کہ علم کی بنیاد کو ماڈیولر حصوں میں تقسیم کیا جائے، بجائے اس کے کہ ایک سے زیادہ جوابات کے ساتھ ایک بڑا مضمون ہو۔

API کو ترتیب دیتے وقت، آپ انہیں ایجنٹ سسٹم کے لیے زیادہ موزوں بنا سکتے ہیں، اور اجازتوں اور آؤٹ پٹ کو اس طریقے سے ترتیب دے سکتے ہیں جس سے ایجنٹ سسٹم کے لیے جواب تلاش کرنے کے لیے بہت زیادہ حساب لگائے بغیر معلومات کو ہضم کرنا آسان ہو جائے۔ یہ کچھ حکمت عملی کے اقدامات ہیں جو اٹھائے جا سکتے ہیں، لیکن میں یہ نہیں کہوں گا کہ ایجنٹ سسٹم کو استعمال کرنے کے لیے کچھ بھی کرنا ضروری ہے۔

ڈیرک ہیرس: اچھی دستاویزات ہمیشہ اہم ہوتی ہیں، بنیادی طور پر یہ معلومات کو مؤثر طریقے سے ترتیب دینے کے بارے میں ہے۔

کمبرلی ٹین: ایسا لگتا ہے کہ اگر آپ لوگوں کو یہ سکھانے کی کوشش کرتے ہیں کہ ایجنٹ سسٹم کو اس طریقے سے کام کرنے کی ہدایت کیسے کی جائے جو ان کے صارفین یا مخصوص استعمال کے معاملات کے مطابق ہو، تو UI اور UX ڈیزائن کے ساتھ بہت زیادہ تجربہ کرنے کی ضرورت ہو سکتی ہے، یا آپ کو اس بالکل نئے فیلڈ میں نئی پگڈنڈی کو چمکانا پڑے گا، کیونکہ یہ روایتی سافٹ ویئر سے بہت مختلف ہے۔

میں متجسس ہوں، آپ اس کے بارے میں کیسے سوچتے ہیں؟ ایجنٹ کی پہلی دنیا میں UI اور UX کیسا ہونا چاہئے؟ آپ کے خیال میں اگلے چند سالوں میں یہ کیسے بدلے گا؟

جیسی ژانگ: میں یہ نہیں کہوں گا کہ ہم نے یہ مسئلہ حل کر لیا ہے۔ میرے خیال میں ہمیں ایک مقامی بہترین چیز مل گئی ہے جو ہمارے موجودہ صارفین کے لیے کام کرتی ہے، لیکن یہ ہمارے اور بہت سے دوسرے لوگوں کے لیے ابھی بھی تحقیق کا ایک جاری علاقہ ہے۔

بنیادی مسئلہ اس پر واپس چلا جاتا ہے جس کا ہم نے پہلے ذکر کیا ہے، جو کہ آپ کے پاس ایجنٹ سسٹم ہے۔ سب سے پہلے، آپ کیسے واضح طور پر دیکھ سکتے ہیں کہ یہ کیا کر رہا ہے اور کیسے فیصلے کر رہا ہے؟ پھر، آپ اس معلومات کو یہ فیصلہ کرنے کے لیے کیسے استعمال کر سکتے ہیں کہ کس چیز کو اپ ڈیٹ کرنے کی ضرورت ہے اور AI کو کیا فیڈ بیک دینا چاہیے؟ یہ وہ جگہیں ہیں جہاں UI عناصر اکٹھے ہوتے ہیں، خاص طور پر دوسرا حصہ۔

ہمارا خیال ہے کہ وقت کے ساتھ ساتھ، UI اور UX زیادہ سے زیادہ فطری زبان پر مبنی ہو جائیں گے، کیونکہ ایجنٹ کا نظام ایسا ہی سوچتا ہے، یا یہ بنیادی طور پر بڑے لینگویج ماڈلز (LLMs) کو تربیت دینے کی بنیاد ہے۔

انتہائی حد تک، اگر آپ کے پاس کوئی انتہائی ذہین ایجنٹ ہے جو بنیادی طور پر ایک انسان کی طرح سوچتا ہے، تو آپ اسے چیزیں دکھا سکتے ہیں، اسے چیزوں کی وضاحت کر سکتے ہیں، اسے رائے دے سکتے ہیں، اور یہ اپنے "ذہن" میں اپ ڈیٹ ہو جائے گا۔ آپ تصور کر سکتے ہیں کہ ایک بہت ہی قابل شخص کو آپ کی ٹیم میں شامل کیا جائے، آپ اسے کچھ سکھائیں، وہ کام کرنے لگتا ہے، اور پھر آپ اسے فیڈ بیک دیتے رہتے ہیں، آپ اسے نئی چیزیں، نئی دستاویزات، خاکے وغیرہ دکھا سکتے ہیں۔

میرے خیال میں انتہائی صورت میں، یہ اس سمت میں ترقی کرے گا: چیزیں زیادہ گفتگو کرنے والی، زیادہ فطری زبان پر مبنی ہو جاتی ہیں، اور لوگ پیچیدہ فیصلوں کے درختوں کے ساتھ نظام بنانا بند کر دیتے ہیں جیسا کہ وہ پہلے کرتے تھے، جو آپ چاہتے ہیں اسے حاصل کرتے ہیں، لیکن یہ نقطہ نظر آسانی سے ٹوٹ سکتا ہے۔ ہمیں یہ کرنا پڑتا تھا کیونکہ اس وقت ایل ایل ایم نہیں تھے، لیکن اب جب کہ ایجنٹ سسٹم زیادہ سے زیادہ طاقتور ہو رہے ہیں، UI اور UX زیادہ بات چیت کرنے والے بن جائیں گے۔

کمبرلی ٹین: تقریباً ڈیڑھ سال قبل، جب ڈیکاگون نے پہلی بار آغاز کیا، تو ایک عام خیال تھا کہ LLM استعمال کے بہت سے معاملات پر بہت لاگو ہوتا ہے، لیکن درحقیقت یہ صرف ایک قسم کا "GPT ریپر" تھا، جہاں کمپنیاں صرف ایک API کے ذریعے بنیادی ماڈل کو کال کر سکتی ہیں اور فوری طور پر اپنے سپورٹ کے مسائل کو حل کر سکتی ہیں۔

لیکن ظاہر ہے، چونکہ کمپنیاں براہ راست اس راستے پر جانے کے بجائے ڈیکاگن جیسے حل استعمال کرنے کا انتخاب کرتی ہیں، یہ پتہ چلتا ہے کہ ایسا نہیں ہے۔ میں سوچ رہا تھا کہ کیا آپ بتا سکتے ہیں کہ ایسا کیوں ہے۔ اندرونی طور پر تعمیر کے چیلنجوں کو کس چیز نے توقع سے زیادہ پیچیدہ بنا دیا؟ تصور کے بارے میں انہیں کیا غلط فہمیاں تھیں؟

جیسی ژانگ: "GPT ریپر" ہونے میں کوئی حرج نہیں ہے، آپ کہہ سکتے ہیں کہ Purcell AWS ریپر ہے یا اس جیسا کچھ۔ عام طور پر، جب لوگ اس اصطلاح کو استعمال کرتے ہیں، تو اس کا مطلب کچھ توہین آمیز ہوتا ہے۔

میرا ذاتی خیال یہ ہے کہ اگر آپ ایجنٹ سسٹم بنا رہے ہیں، تو تعریف کے مطابق آپ یقینی طور پر LLM کو بطور ٹول استعمال کرنے جا رہے ہیں۔ لہذا آپ اصل میں کسی ایسی چیز کے اوپر تعمیر کر رہے ہیں جو پہلے سے موجود ہے، جیسا کہ آپ عام طور پر AWS یا GCP پر تعمیر کرتے ہیں۔

لیکن اصل مسئلہ جس کا آپ سامنا کر سکتے ہیں وہ یہ ہے کہ اگر آپ جو سافٹ ویئر LLM کے اوپر بناتے ہیں وہ فرق کرنے کے لیے اتنا "بھاری" یا پیچیدہ نہیں ہے۔

پیچھے مڑ کر دیکھیں، ہمارے لیے، ہم جو بیچتے ہیں وہ بنیادی طور پر سافٹ ویئر ہے۔ ہم دراصل ایک باقاعدہ سافٹ ویئر کمپنی کی طرح ہیں، سوائے اس کے کہ ہم LLM کو سافٹ ویئر کے حصے کے طور پر اور ایک ٹول کے طور پر استعمال کرتے ہیں۔ لیکن جب لوگ اس قسم کی مصنوعات خریدتے ہیں، تو وہ بنیادی طور پر خود سافٹ ویئر چاہتے ہیں۔ وہ ایسے ٹولز چاہتے ہیں جو AI کی نگرانی کر سکیں، جو AI کی ہر گفتگو کی تفصیلات کو گہرائی میں کھود سکیں، جو تاثرات دے سکیں، جو نظام کو مسلسل بنا اور ایڈجسٹ کر سکیں۔

تو یہ ہمارے سافٹ ویئر کا بنیادی حصہ ہے۔ یہاں تک کہ خود ایجنٹ سسٹم کے ساتھ بھی، لوگوں کو یہ مسئلہ درپیش ہے کہ ڈیمو کرنا اچھا ہے، لیکن اگر آپ اسے پروڈکشن کے لیے تیار اور واقعی گاہک کا سامنا کرنا چاہتے ہیں، تو آپ کو بہت سے دیرینہ مسائل کو حل کرنا ہوگا، جیسے کہ "وہم" کے رجحان کو روکنا اور برے اداکاروں سے نمٹنا جو تباہی پھیلانے کی کوشش کرتے ہیں۔ ہمیں یہ بھی یقینی بنانا ہے کہ تاخیر کافی کم ہے، لہجہ مناسب ہے، وغیرہ۔

ہم نے بہت ساری ٹیموں سے بات کی، اور انہوں نے کچھ تجربات کیے، ایک ابتدائی ورژن بنایا، اور پھر انہیں احساس ہوگا، "اوہ، واقعی، ہم وہ نہیں بننا چاہتے جو بعد کے مراحل میں ان تفصیلات کو بناتے رہیں۔" وہ وہ بھی نہیں بننا چاہتے تھے جو کسٹمر سروس ٹیم میں نئی منطق شامل کرتے رہیں۔ لہذا اس مقام پر، دوسروں کے ساتھ تعاون کرنے کا انتخاب کرنا زیادہ مناسب معلوم ہوتا ہے۔

کمبرلی ٹین: آپ نے کچھ طویل المدتی مسائل کا ذکر کیا، جیسے برے اداکاروں سے نمٹنے کی ضرورت وغیرہ۔مجھے یقین ہے کہ AI ایجنٹ کے استعمال پر غور کرنے والے بہت سے سامعین LLMs کے متعارف ہونے کے بعد پیدا ہونے والے سیکیورٹی حملے کے نئے راستوں کے بارے میں فکر مند ہیں، یا ایجنٹ کے نظام کے متعارف ہونے کے بعد پیدا ہونے والے نئے سیکیورٹی خطرات کے بارے میں فکر مند ہیں۔ ان مسائل کے بارے میں آپ کا کیا خیال ہے؟ اور اس سے نمٹنے کے دوران اعلی درجے کی انٹرپرائز سیکیورٹی کو یقینی بنانے کے بہترین طریقے کیا ہیں۔ ایجنٹ?

جیسی ژانگ: حفاظت کے لحاظ سے، کچھ واضح اقدامات کیے جا سکتے ہیں، جن کا میں نے پہلے ذکر کیا، جیسے حفاظتی اقدامات کی ضرورت۔ بنیادی مسئلہ یہ ہے کہ ایل ایل ایم کے بارے میں لوگوں کے خدشات یہ ہیں کہ وہ تعیین پسند نہیں ہیں۔

لیکن اچھی خبر یہ ہے کہ آپ حقیقت میں زیادہ تر حساس اور پیچیدہ کارروائیوں کو ایک تعییناتی دیوار کے پیچھے رکھ سکتے ہیں، اور حساب اس وقت ہوتا ہے جب وہ API کو کال کرتا ہے۔ لہذا آپ اسے سنبھالنے کے لیے LLM پر مکمل انحصار نہیں کرتے ہیں، اور اس سے بہت ساری بنیادی پریشانیوں سے بچ جاتا ہے۔

لیکن اب بھی ایسے حالات موجود ہیں جہاں، مثال کے طور پر، کوئی برا اداکار مداخلت کرتا ہے یا کوئی نظام کو فریب دینے کی کوشش کرتا ہے۔ ہم نے مشاہدہ کیا ہے کہ بہت سے بڑے گاہکوں میں جن کے ساتھ ہم کام کرتے ہیں، ان کی سیکیورٹی ٹیمیں داخل ہوں گی اور بنیادی طور پر ہماری مصنوعات پر ایک "ریڈ ٹیم" ٹیسٹ کریں گی، کمزوریوں کو تلاش کرنے کی کوشش کرنے کے لیے سسٹم پر مختلف ممکنہ حملوں کو شروع کرنے میں ہفتوں تک لگاتار گزاریں گی۔ جیسے جیسے AI ایجنٹ زیادہ سے زیادہ مقبول ہوتا جا رہا ہے، ہم اسے زیادہ سے زیادہ کثرت سے ہوتے دیکھ سکتے ہیں، کیونکہ یہ جانچنے کا ایک بہترین طریقہ ہے کہ آیا کوئی نظام موثر ہے۔ یہ ایک ریڈ ٹیم ٹیسٹ کے ذریعے اس پر کچھ پھینکنا ہے اور یہ دیکھنا ہے کہ آیا یہ دفاع کو توڑ سکتا ہے۔

ایسے سٹارٹ اپس بھی ہیں جو ریڈ ٹیم ٹولز تیار کر رہے ہیں یا لوگوں کو خود اس قسم کے ٹیسٹ کرنے کے قابل بنا رہے ہیں، جو ایک رجحان ہے جو ہم ابھی دیکھ رہے ہیں۔ بہت ساری کمپنیاں جن کے ساتھ ہم کام کرتے ہیں، سیلز سائیکل کے بعد کے مرحلے میں، ان کی سیکیورٹی ٹیم ہوگی، یا کسی بیرونی ٹیم کے ساتھ کام کریں گے، سسٹم کا دباؤ ٹیسٹ کریں گے۔ ہمارے لیے، اس قسم کے ٹیسٹ پاس کرنے کے قابل ہونا ضروری ہے۔ تو، بالآخر، یہ وہی ہے جو نیچے آتا ہے.

ڈیرک ہیرس: کیا یہ وہ چیز ہے جو آپ اپنے صارفین کو کرنے کی ترغیب دیتے ہیں؟ کیونکہ جب ہم AI پالیسیوں کے بارے میں بات کرتے ہیں، تو ہم ایک اہم پہلو کا ذکر کرتے ہیں، جو کہ ایپلی کیشن پرت ہے، اور ہم اس پر زور دیتے ہیں۔ دی LLM کے صارفین اور ایپلی کیشن چلانے والے لوگوں پر ذمہ داری عائد ہوتی ہے، بجائے اس کے کہ صرف ماڈل کو ہی مورد الزام ٹھہرایا جائے۔ کہنے کا مطلب یہ ہے کہ صارفین کو ریڈ ٹیم ٹیسٹنگ کرنی چاہیے، مخصوص استعمال کے کیسز اور حملے کے راستوں کی نشاندہی کرنی چاہیے، اور یہ تعین کرنا چاہیے کہ کون سی کمزوریوں کو محفوظ رکھنے کی ضرورت ہے، بجائے اس کے کہ وہ پہلے سے ہی OpenAI یا دیگر کمپنیوں کے ذریعے قائم کردہ حفاظتی تحفظ پر بھروسہ کرے۔

جیسی ژانگ: میں پوری طرح متفق ہوں۔ میں یہ بھی سوچتا ہوں کہ نوٹیفکیشن کی ضروریات کی ایک نئی لہر ابھر سکتی ہے، جیسا کہ SOC 2 سرٹیفیکیشن اور HIPAA سرٹیفیکیشن جو اب ہر کوئی کر رہا ہے، جس کی مختلف صنعتوں میں ضرورت ہے۔ عام طور پر، جب آپ ایک عام SaaS پروڈکٹ فروخت کرتے ہیں، تو صارفین کو دخول کی جانچ کی ضرورت ہوگی، اور ہمیں اپنی دخول کی جانچ کی رپورٹ بھی فراہم کرنی ہوگی۔ AI ایجنٹ کے لیے، مستقبل میں اسی طرح کے تقاضے ہو سکتے ہیں، اور کوئی اسے نام دے سکتا ہے، لیکن یہ بنیادی طور پر یہ جانچنے کا ایک نیا طریقہ ہے کہ آیا ایجنٹ کا نظام کافی طاقتور ہے۔

کمبرلی ٹین: ایک چیز جو دلچسپ ہے وہ یہ ہے کہ ظاہر ہے ہر کوئی ان نئے ماڈل کی پیش رفتوں اور تکنیکی پیش رفتوں کے بارے میں بہت پرجوش ہے جو تمام بڑی لیبز کے ذریعے متعارف کرائے جا رہے ہیں۔ ایک AI کمپنی کے طور پر، آپ ظاہر ہے کہ اپنی تحقیق خود نہیں کرتے ہیں، لیکن آپ اس تحقیق سے فائدہ اٹھاتے ہیں اور اس کے ارد گرد بہت سارے سافٹ ویئر بناتے ہیں تاکہ آخری صارف تک پہنچ سکیں۔

لیکن آپ کا کام تیزی سے بدلتی ہوئی ٹیکنالوجی پر مبنی ہے۔ میں متجسس ہوں، ایک اطلاق شدہ AI کمپنی کے طور پر، آپ نئی تکنیکی تبدیلیوں کو کیسے برقرار رکھتے ہیں اور یہ سمجھتے ہیں کہ وہ کمپنی پر کیسے اثر انداز ہوتے ہیں جب کہ آپ کے اپنے پروڈکٹ کے روڈ میپ کی پیشن گوئی کرنے اور صارف کی ضروریات کو بڑھانے کے قابل ہوتے ہیں؟ مزید وسیع طور پر، اسی طرح کے حالات میں AI کمپنیوں کو کون سی حکمت عملی اپنانی چاہیے؟

جیسی ژانگ: آپ اصل میں پورے اسٹیک کو مختلف حصوں میں تقسیم کر سکتے ہیں۔ مثال کے طور پر، اگر آپ ایپلی کیشن لیئر کو دیکھیں تو LLM سب سے نیچے ہے۔ آپ کے پاس بیچ میں کچھ ٹولز ہو سکتے ہیں جو آپ کو LLM کا انتظام کرنے میں مدد کرتے ہیں یا کچھ تشخیص اور اس طرح کی چیزیں کرتے ہیں۔ پھر، سب سے اوپر کا حصہ بنیادی طور پر وہی ہے جو ہم نے بنایا ہے، جو دراصل ایک معیاری SaaS کی طرح ہے۔

لہذا، ہمارا زیادہ تر کام درحقیقت باقاعدہ سافٹ ویئر سے اتنا مختلف نہیں ہے، سوائے اس کے کہ ہمارے پاس ایک اضافی تحقیقی جزو ہے - LLM بہت تیزی سے تبدیل ہوتا ہے۔ ہمیں تحقیق کرنے کی ضرورت ہے کہ وہ کیا کر سکتے ہیں، وہ کس چیز میں اچھے ہیں، اور کسی خاص کام کو انجام دینے کے لیے کون سا ماڈل استعمال کیا جانا چاہیے۔ یہ ایک بڑا مسئلہ ہے کیونکہ OpenAI اور Anthropic دونوں نئی ٹیکنالوجیز شروع کر رہے ہیں، اور Gemini بھی آہستہ آہستہ بہتر ہو رہی ہے۔

لہذا، آپ کو یہ سمجھنے کے لیے اپنا تشخیصی طریقہ کار ہونا چاہیے کہ کون سا ماڈل کس صورت حال میں استعمال کے لیے موزوں ہے۔ کبھی کبھی آپ کو بھی ٹھیک ٹیون کرنے کی ضرورت ہوتی ہے، لیکن سوال یہ ہے کہ: کب ٹھیک کریں؟ فائن ٹیوننگ کب فائدہ مند ہے؟ یہ شاید LLMs سے متعلق اہم تحقیقی مسائل ہیں جن پر ہم توجہ دے رہے ہیں۔ لیکن کم از کم اب تک، ہم محسوس نہیں کرتے کہ SaaS تیزی سے تبدیل ہو رہا ہے، کیونکہ ہم درمیانی پرت پر منحصر نہیں ہیں۔ تو بنیادی طور پر، یہ ایل ایل ایمز ہیں جو بدل رہے ہیں۔ وہ اکثر تبدیل نہیں ہوتے ہیں، اور جب وہ کرتے ہیں، تو یہ عام طور پر ایک اپ گریڈ ہوتا ہے۔ مثال کے طور پر، Claude 3.5 سونیٹ کو کچھ مہینے پہلے اپ ڈیٹ کیا گیا تھا، اور اس وقت ہم نے سوچا، "ٹھیک ہے، کیا ہمیں پرانے کو استعمال کرنے کے بجائے نئے ماڈل پر جانا چاہیے؟"

ہمیں صرف تشخیص کا ایک سلسلہ چلانے کی ضرورت ہے، اور ایک بار جب ہم نئے ماڈل پر چلے جائیں تو ہم اس کے بارے میں مزید نہیں سوچتے کیونکہ آپ پہلے سے ہی نیا ماڈل استعمال کر رہے ہیں۔ پھر، o1 ورژن سامنے آیا، اور صورت حال ایسی ہی تھی۔ اس کے بارے میں سوچیں کہ اسے کہاں استعمال کیا جا سکتا ہے۔ ہمارے معاملے میں، زیادہ تر گاہک کے استعمال کے معاملات میں o1 تھوڑا سا سست ہے، لہذا ہم اسے کچھ پس منظر کے کام کے لیے استعمال کر سکتے ہیں۔ آخر کار، ہمیں صرف ماڈل ریسرچ کے لیے ایک اچھا نظام درکار ہے۔

کمبرلی ٹین: آپ کتنی بار کسی نئے ماڈل کا جائزہ لیتے ہیں اور فیصلہ کرتے ہیں کہ اسے تبدیل کرنا ہے یا نہیں؟

جیسی ژانگ: جب بھی کوئی نیا ماڈل سامنے آتا ہے تو ہم اس کا جائزہ لیتے ہیں۔ آپ کو یہ یقینی بنانا ہوگا کہ اگرچہ نیا ماڈل زیادہ ہوشیار ہے، لیکن یہ آپ کے پہلے سے بنائے گئے استعمال کے کچھ کیسز کو نہیں توڑتا ہے۔ ایسا ہو سکتا ہے۔ مثال کے طور پر، نیا ماڈل مجموعی طور پر زیادہ ہوشیار ہو سکتا ہے، لیکن کچھ انتہائی صورتوں میں، یہ آپ کے ورک فلو میں سے کسی A/B انتخاب پر خراب کارکردگی کا مظاہرہ کرتا ہے۔ اسی کے لیے ہم اندازہ لگاتے ہیں۔

میرے خیال میں مجموعی طور پر، ہم جس قسم کی ذہانت کا سب سے زیادہ خیال رکھتے ہیں وہ ہے جسے میں "ہدایت کی پیروی کرنے کی صلاحیت" کہوں گا۔ ہم چاہتے ہیں کہ مندرجہ ذیل ہدایات پر ماڈل بہتر سے بہتر ہو۔ اگر ایسا ہے، تو یہ یقیناً ہمارے لیے فائدہ مند ہے، اور یہ بہت اچھی بات ہے۔

ایسا لگتا ہے کہ حالیہ تحقیق نے ذہانت کی اس قسم پر زیادہ توجہ مرکوز کی ہے جس میں استدلال شامل ہے، جیسے بہتر پروگرامنگ اور بہتر ریاضیاتی عمل۔ اس سے ہماری مدد بھی ہوتی ہے، لیکن یہ اتنا اہم نہیں ہے جتنا کہ قابلیت کے بعد ہدایات میں بہتری۔

کمبرلی ٹین: ایک بہت ہی دلچسپ نکتہ جس کا آپ نے ذکر کیا، اور میں سمجھتا ہوں کہ یہ ڈیکاگن کے لیے بھی بہت منفرد ہے، وہ یہ ہے کہ آپ نے گھر میں بہت زیادہ تشخیصی انفراسٹرکچر بنایا ہے تاکہ یہ یقینی بنایا جا سکے کہ آپ کو معلوم ہے کہ ہر ماڈل آپ کے فراہم کردہ ٹیسٹوں کے سیٹ کے تحت کس طرح کارکردگی کا مظاہرہ کر رہا ہے۔

کیا آپ اس کی وضاحت کر سکتے ہیں؟ یہ اندرون ملک تشخیص کا بنیادی ڈھانچہ کتنا اہم ہے، اور خاص طور پر یہ آپ کو اور آپ کے صارفین کو ایجنٹ کی کارکردگی پر اعتماد کیسے دیتا ہے؟ کیونکہ ان میں سے کچھ تشخیص گاہک کے سامنے بھی ہیں۔

جیسی ژانگ: میرے خیال میں یہ بہت اہم ہے، کیونکہ اس تشخیص کے بنیادی ڈھانچے کے بغیر، ہمارے لیے جلدی سے اعادہ کرنا بہت مشکل ہوگا۔

اگر آپ محسوس کرتے ہیں کہ ہر تبدیلی میں کسی چیز کے ٹوٹنے کا زیادہ امکان ہے، تو آپ جلدی تبدیلیاں نہیں کریں گے۔ لیکن اگر آپ کے پاس تشخیص کا طریقہ کار ہے، تو جب کوئی بڑی تبدیلی آتی ہے، کوئی ماڈل اپ ڈیٹ ہوتا ہے، یا کوئی نئی چیز آتی ہے، تو آپ اس کا براہ راست تمام تشخیصی ٹیسٹوں سے موازنہ کر سکتے ہیں۔ اگر تشخیص کے نتائج اچھے ہیں، تو آپ محسوس کر سکتے ہیں: ٹھیک ہے، ہم نے بہتری کی ہے، یا آپ اسے زیادہ فکر کیے بغیر اعتماد کے ساتھ جاری کر سکتے ہیں۔

تو، ہمارے میدان میں، تشخیص کے لیے گاہک سے ان پٹ کی ضرورت ہوتی ہے، کیونکہ گاہک وہ ہوتا ہے جو فیصلہ کرتا ہے کہ کوئی چیز درست ہے یا نہیں۔ بلاشبہ، ہم کچھ اعلیٰ سطحی مسائل کی جانچ کر سکتے ہیں، لیکن عام طور پر صارف مخصوص استعمال کے معاملات فراہم کرتا ہے اور ہمیں بتاتا ہے کہ صحیح جواب کیا ہے، یا اسے کیا ہونا چاہیے، اسے کیا لہجہ برقرار رکھنا چاہیے، اسے کیا کہنا چاہیے۔

تشخیص اسی پر مبنی ہے۔ لہذا ہمیں یہ یقینی بنانا ہوگا کہ ہمارا تشخیصی نظام کافی مضبوط ہے۔ شروع میں، ہم نے اسے خود بنایا تھا، اور اسے برقرار رکھنا اتنا مشکل نہیں ہے۔ ہم یہ بھی جانتے ہیں کہ کچھ تشخیصی کمپنیاں ہیں، اور ہم نے ان میں سے کچھ کو دریافت کیا ہے۔ ہوسکتا ہے کہ کسی وقت، ہم اس پر غور کریں گے کہ آیا انہیں اپنانا ہے، لیکن فی الحال، تشخیصی نظام ہمارے لیے درد کا باعث نہیں ہے۔

کمبرلی ٹین: آج کل ایک بہت مشہور موضوع ملٹی موڈیلیٹی ہے، یعنی AI ایجنٹوں کو ان تمام شکلوں میں بات چیت کرنے کے قابل ہونا چاہیے جو آج انسان استعمال کرتے ہیں، چاہے وہ ٹیکسٹ، ویڈیو، آواز وغیرہ ہو۔ میں جانتا ہوں کہ Decagon کا آغاز ٹیکسٹ پر مبنی ہے۔ آپ کے نقطہ نظر سے، کتنا اہم ہے کثیر موڈالٹی ہے AI ایجنٹوں کو؟ آپ کے خیال میں اس کے مرکزی دھارے یا یہاں تک کہ ایک معیاری بننے کا ٹائم فریم کیا ہے؟

جیسی ژانگ: یہ اہم ہے، اور کمپنی کے نقطہ نظر سے، یہ خاص طور پر مشکل نہیں ہے کہ نئی وضع کو شامل کیا جائے۔ یہ آسان نہیں ہے، لیکن بنیادی بات یہ ہے کہ: اگر آپ دوسرے مسائل کو حل کرتے ہیں، جیسے کہ میں نے جن کا ذکر کیا ہے - مثال کے طور پر، AI بنانا، اس کی نگرانی کرنا اور صحیح منطق کا ہونا - تو پھر ایک نیا طریقہ شامل کرنا سب سے مشکل کام نہیں ہے۔ لہذا ہمارے لیے، تمام طریقوں کا ہونا بہت معنی رکھتا ہے، اور یہ ہماری مارکیٹ کو وسعت دیتا ہے۔ ہم بنیادی طور پر موڈلٹی ایگنوسٹک ہیں، اور ہم ہر ایک طریقہ کار کے لیے اپنا ایجنٹ بناتے ہیں۔

عام طور پر، دو محدود عوامل ہیں: سب سے پہلے، کیا گاہک نیا طریقہ اختیار کرنے کے لیے تیار ہے؟ میرے خیال میں متن کے ساتھ شروع کرنا بہت معنی خیز ہے، کیونکہ یہی وہ طریقہ ہے جسے لوگ سب سے زیادہ فعال طریقے سے اپناتے ہیں، اور یہ ان کے لیے کم خطرہ، نگرانی کرنا آسان اور سمجھنے میں آسان ہے۔ دوسرا بڑا طریقہ آواز ہے۔ ظاہر ہے، میرے خیال میں مارکیٹ میں اب بھی گنجائش موجود ہے، اور صارف کی آواز کی قبولیت کو اب بھی بہتر کرنے کی ضرورت ہے۔ اس وقت، ہم کچھ ابتدائی گود لینے والوں کو دیکھ رہے ہیں جنہوں نے وائس ایجنٹ کو اپنانا شروع کر دیا ہے، جو کہ بہت پرجوش ہے۔ دوسرا پہلو تکنیکی چیلنجز ہے۔ زیادہ تر لوگ اس بات سے اتفاق کریں گے کہ آواز کے لیے بار اونچا سیٹ کیا گیا ہے۔ اگر آپ فون پر کسی سے بات کر رہے ہیں، تو آپ کو بہت مختصر آواز میں تاخیر کی ضرورت ہے۔ اگر آپ کسی کو روکتے ہیں، تو انہیں قدرتی طور پر جواب دینے کی ضرورت ہے۔

چونکہ تقریر کی تاخیر کم ہے، اس لیے آپ کو حساب لگانے کے طریقے میں زیادہ ہوشیار ہونا پڑے گا۔ اگر آپ چیٹ میں ہیں اور جواب دینے کا وقت پانچ سے آٹھ سیکنڈ ہے، تو آپ اسے مشکل سے محسوس کریں گے اور یہ بہت فطری محسوس ہوتا ہے۔ لیکن اگر فون پر جواب دینے میں پانچ سے آٹھ سیکنڈ لگ جائیں تو یہ قدرے غیر فطری محسوس ہوتا ہے۔ لہذا تقریر کے ساتھ زیادہ تکنیکی چیلنجز ہیں۔ جیسے جیسے یہ تکنیکی چیلنجز حل ہو جاتے ہیں اور مارکیٹ میں تقریر کو اپنانے میں دلچسپی بڑھ جاتی ہے، تقریر ایک نئی طرز کے طور پر مرکزی دھارے میں شامل ہو جائے گی۔

ایک کاروباری ماڈل جو اعتماد پر چھلانگ لگاتا ہے۔

کمبرلی ٹین: اس سے پہلے کہ ہم جاری رکھیں، میں AI ایجنٹ کے کاروباری ماڈل کے بارے میں کچھ اور بات کرنا چاہوں گا۔ جب آپ سب سے پہلے تعمیر AI ایجنٹ یا صارفین کے ساتھ ان کے استعمال کردہ سسٹم، وہ جس ڈیٹا پر کارروائی کرتے ہیں، اور ان کے خدشات پر تبادلہ خیال کرتے ہیں، کیا ایسی کوئی چیز تھی جس نے آپ کو حیران کیا؟ کچھ غیر بدیہی یا حیران کن چیزیں کیا ہیں جو ڈیکاگن کو انٹرپرائز صارفین کی بہتر خدمت کرنے کے لیے کرنا پڑیں؟

جیسی ژانگ: میرے خیال میں سب سے حیران کن بات یہ تھی کہ جب ہم نے پہلی بار شروعات کی تو لوگ ہم سے بات کرنے کے لیے کس حد تک تیار تھے۔ سب کے بعد، ہم میں سے صرف دو تھے. ہم دونوں نے پہلے بھی کمپنیاں شروع کی تھیں، اس لیے ہم بہت سے لوگوں کو جانتے تھے، لیکن اس کے باوجود، ہر کاروباری شخص کے لیے، جب آپ حوالہ جاتی بات چیت شروع کرنا چاہتے ہیں، اگر آپ جو کہہ رہے ہیں وہ خاص طور پر مجبور نہیں ہے، تو بات چیت عام طور پر کافی ہلکی ہوتی ہے۔

لیکن جب ہم نے اس استعمال کے معاملے کے بارے میں بات کرنا شروع کی تو مجھے حقیقت میں یہ کافی حیران کن معلوم ہوا کہ لوگ اس کے بارے میں بات کرنے میں کتنے پرجوش تھے۔ کیونکہ خیال بہت واضح لگتا ہے۔ آپ سوچ سکتے ہیں کہ چونکہ یہ اتنا واضح خیال ہے، اس لیے کسی اور نے اسے پہلے ہی کر لیا ہوگا، یا اس کا حل پہلے سے ہی موجود ہوگا، یا کسی اور نے پہلے ہی کسی قسم کا حل نکالا ہوگا۔ لیکن مجھے لگتا ہے کہ ہم نے ایک اچھا لمحہ پکڑا ہے، وہ استعمال کا معاملہ واقعی بڑا ہے اور لوگ واقعی اس کی پرواہ کرتے ہیں۔ جیسا کہ میں نے پہلے ذکر کیا ہے، وہ استعمال کیس واقعی AI ایجنٹ کو لینے اور اسے پیداوار میں آگے بڑھانے کے لیے موزوں ہے، کیونکہ آپ اسے بتدریج لاگو کر سکتے ہیں اور ROI کو ٹریک کرنے کے قابل ہو سکتے ہیں۔

یہ میرے لیے ایک خوشگوار حیرت تھی، لیکن ظاہر ہے کہ اس کے بعد بہت کام کرنا ہے، آپ کو صارفین کے ساتھ کام کرنا ہے، آپ کو پروڈکٹ بنانا ہے، آپ کو یہ معلوم کرنا ہوگا کہ کون سا راستہ اختیار کرنا ہے۔ ابتدائی مرحلے میں، یہ واقعی ایک حیران کن دریافت تھی۔

ڈیرک ہیرس: کمبرلی، مجھے لگتا ہے کہ مجھے اس بلاگ پوسٹ کا ذکر کرنا چاہیے جو آپ نے لکھی ہے، RIP سے RPA، جو کہ بہت سی چیزوں کو چھوتی ہے۔ دی آٹومیشن کے کام اور اسٹارٹ اپ۔کیا آپ کو لگتا ہے کہ کوئی ایسا رجحان ہے جس میں یہ خودکار کام، یا حل اتنے مثالی نہیں ہیں، اس لیے لوگ ہمیشہ بہتر طریقے کی تلاش میں رہتے ہیں؟

کمبرلی ٹین: ہاں، مجھے ایسا لگتا ہے۔ میں چند باتیں کہنا چاہوں گا۔ سب سے پہلے، اگر کوئی آئیڈیا ہر کسی کے لیے واضح ہے، لیکن اسے حل کرنے کے لیے کوئی واضح کمپنی نہیں ہے، یا کوئی بھی کمپنی کی طرف اشارہ کر کے یہ نہیں کہہ رہا ہے کہ "آپ کو اسے استعمال کرنا چاہیے،" تو اس کا مطلب ہے کہ مسئلہ درحقیقت حل نہیں ہوا ہے۔

ایک لحاظ سے، یہ ایک کمپنی کے لیے حل تیار کرنے کا مکمل طور پر کھلا موقع ہے۔ کیونکہ، جیسا کہ آپ نے کہا، ہم شروع سے بطور سرمایہ کار Decagon کی پیروی کر رہے ہیں۔ ہم نے انہیں تخلیقی بھولبلییا پر تشریف لے جاتے دیکھا ہے، اور جب انہوں نے اس سمت جانے کا فیصلہ کیا اور صارفین سے بات کرنا شروع کی، تو یہ واضح ہو گیا کہ تمام صارفین کسی نہ کسی مقامی AI- فعال حل کے لیے بے چین تھے۔ یہ ان مسائل میں سے ایک ہے جس کا میں نے پہلے ذکر کیا ہے، جہاں بہت سے لوگ سمجھتے ہیں کہ یہ صرف ایک GPT ریپر ہے۔ لیکن ڈیکاگون کو شروع سے ہی گاہکوں کی دلچسپی نے ہمیں ابتدائی طور پر یہ احساس دلایا ہے کہ ان میں سے بہت سے مسائل لوگوں کی توقع سے کہیں زیادہ پیچیدہ ہیں۔

میرے خیال میں یہ رجحان پوری صنعتوں میں ہو رہا ہے، چاہے وہ کسٹمر سروس ہو یا مخصوص عمودی حصوں میں پیشہ ورانہ آٹومیشن۔ میرے خیال میں انڈرریٹڈ پوائنٹس میں سے ایک ہے، جیسا کہ جیسی نے پہلے ذکر کیا، خودکار کاموں کی سرمایہ کاری پر واپسی (ROI) کی واضح پیمائش کرنے کے قابل ہونا۔ کیونکہ، اگر آپ کسی کو AI ایجنٹ کو قبول کرنے کے لیے جا رہے ہیں، تو وہ درحقیقت "ایمان کی چھلانگ" کی ڈگری لے رہے ہیں کیونکہ یہ بہت سے لوگوں کے لیے ایک بہت ہی غیر مانوس علاقہ ہے۔

اگر آپ ایک بہت ہی مخصوص عمل کو خودکار کر سکتے ہیں جو یا تو ایک واضح آمدنی پیدا کرنے والا عمل ہو، یا ایسا عمل جو پہلے کاروبار میں رکاوٹ بنتا ہو، یا ایک بڑا لاگت کا مرکز جو گاہک کی ترقی یا آمدنی میں اضافے کے ساتھ یکساں طور پر بڑھتا ہو، تو AI ایجنٹ کے لیے قبولیت حاصل کرنا آسان ہو جائے گا۔ اس طرح کے مسائل کو زیادہ پیداواری عمل میں تبدیل کرنے کی صلاحیت جسے روایتی سافٹ ویئر کی طرح پیمانہ بنایا جا سکتا ہے بہت دلکش ہے۔

کمبرلی ٹین: آگے بڑھنے سے پہلے میرے پاس ایک آخری سوال ہے۔ مجھے یاد ہے جیسی، ہماری پچھلی بحثوں میں، ہمیشہ کہتی تھی کہ سافٹ ویئر یا AI ایجنٹوں کو اپنانے والی کمپنیوں کے لیے سب سے بڑا چیلنج فریب نظر ہو گا۔ لیکن آپ نے ایک بار مجھے بتایا کہ یہ اصل میں بنیادی مسئلہ نہیں ہے۔ کیا آپ اس کی وضاحت کر سکتے ہیں کہ فریب کا تصور کچھ حد تک گمراہ کن کیوں ہے اور لوگ اصل میں کن چیزوں کے بارے میں زیادہ فکر مند ہیں؟

جیسی ژانگ: میرے خیال میں لوگ فریب کی پرواہ کرتے ہیں، لیکن وہ اس قدر کے بارے میں زیادہ فکر مند ہیں جو وہ فراہم کر سکتے ہیں۔ تقریباً تمام کمپنیاں جن پر ہم انہی چند مسائل پر توجہ مرکوز کرتے ہوئے کام کرتے ہیں، تقریباً بالکل ایک جیسے: آپ کتنے فیصد بات چیت کو حل کر سکتے ہیں؟ میرے گاہک کتنے مطمئن ہیں؟ پھر فریب کاری کے مسئلے کو تیسرے زمرے کے طور پر درجہ بندی کیا جاسکتا ہے، یعنی یہ کتنا درست ہے۔ عام طور پر، تشخیص کرتے وقت پہلے دو عوامل زیادہ اہم ہوتے ہیں۔

فرض کریں کہ آپ ایک نئے کاروبار سے بات کر رہے ہیں اور آپ نے پہلے دو عوامل پر بہت اچھا کام کیا ہے، اور آپ کو قیادت اور ٹیم کے سبھی لوگوں کی طرف سے بہت زیادہ تعاون ملا ہے۔ وہ اس طرح ہیں، "اوہ میرے خدا، ہمارے کسٹمر کا تجربہ مختلف ہے۔ اب ہر صارف کا اپنا ذاتی معاون ہے جو کسی بھی وقت ہم سے رابطہ کر سکتا ہے۔ ہم نے انہیں بہت اچھے جوابات دیے ہیں، وہ بہت مطمئن ہیں، اور یہ کثیر لسانی ہے اور 24/7 دستیاب ہے۔" یہ اس کا صرف ایک حصہ ہے، اور آپ نے بہت سارے پیسے بھی بچائے ہیں۔

لہذا ایک بار جب آپ ان اہداف کو حاصل کر لیتے ہیں، تو آپ کو کام کو آگے بڑھانے کے لیے بہت زیادہ سپورٹ اور بہت زیادہ ٹیل ونڈ ملتے ہیں۔ بلاشبہ، وہم کے مسئلے کو بالآخر حل کرنے کی ضرورت ہے، لیکن یہ وہ چیز نہیں ہے جس کے بارے میں وہ سب سے زیادہ فکر مند ہیں۔ وہم کو دور کرنے کا طریقہ وہی ہے جس کا میں نے پہلے ذکر کیا ہے – لوگ آپ کو آزمائیں گے۔ تصور کا ثبوت کا مرحلہ ہوسکتا ہے جہاں آپ حقیقت میں حقیقی گفتگو کرتے ہیں اور ان کے پاس ٹیم کے ارکان ہوتے ہیں اور درستگی کی جانچ کرتے ہیں۔ اگر یہ اچھی طرح سے جاتا ہے، تو یہ عام طور پر گزر جاتا ہے.

اس کے علاوہ، جیسا کہ میں نے پہلے ذکر کیا ہے، آپ حساس معلومات کے لیے کچھ سخت حفاظتی اقدامات ترتیب دے سکتے ہیں، جیسے کہ ضروری نہیں کہ آپ کو حساس مواد کو عام بنانے کی ضرورت ہو۔ لہذا وہم کا مسئلہ زیادہ تر لین دین میں بحث کا ایک نقطہ ہے۔ یہ کوئی غیر اہم موضوع نہیں ہے۔ آپ اس عمل سے گزریں گے، لیکن یہ کبھی بھی بات چیت کا مرکز نہیں ہے۔

کمبرلی ٹین: اب آئیے AI ایجنٹ کے کاروباری ماڈل کی طرف۔ آج، ان AI ایجنٹوں کی قیمتوں کے بارے میں ایک بڑا موضوع ہے۔

تاریخی طور پر، بہت سے SaaS سافٹ ویئر کی قیمت سیٹوں کی تعداد کے حساب سے ہوتی ہے کیونکہ وہ ورک فلو سافٹ ویئر ہیں جو انفرادی ملازمین کو نشانہ بناتے ہیں اور ملازمین کی پیداواری صلاحیت کو بہتر بنانے کے لیے استعمال ہوتے ہیں۔ تاہم، AI ایجنٹ روایتی سافٹ ویئر کی طرح انفرادی ملازمین کی پیداواری صلاحیت سے منسلک نہیں ہے۔

بہت سے لوگوں کا خیال ہے کہ سیٹوں کی تعداد کی بنیاد پر قیمتوں کا تعین کرنے کا طریقہ اب لاگو نہیں ہو سکتا۔ میں تجسس رکھتا ہوں۔ کس طرح آپ نے ابتدائی دنوں میں اس مخمصے کے بارے میں سوچا اور آخر کار آپ نے ڈیکاگن کی قیمت کا فیصلہ کیسے کیا۔ اس کے علاوہ، آپ کے خیال میں سافٹ ویئر کی قیمتوں کا مستقبل کا رجحان کیا ہوگا کیونکہ AI ایجنٹ زیادہ سے زیادہ عام ہوتا جا رہا ہے؟

جیسی ژانگ: اس مسئلے پر ہمارا نظریہ یہ ہے کہ ماضی میں، سافٹ ویئر کی فی سیٹ قیمت تھی کیونکہ اس کا پیمانہ تقریباً ان لوگوں کی تعداد پر مبنی تھا جو سافٹ ویئر استعمال کر سکتے تھے۔ لیکن زیادہ تر AI ایجنٹوں کے لیے، آپ جو قیمت فراہم کرتے ہیں اس کا انحصار اس کو برقرار رکھنے والے افراد کی تعداد پر نہیں ہوتا ہے، بلکہ اس کے کام کی مقدار پر ہوتا ہے۔ یہ اس نکتے سے مطابقت رکھتا ہے جس کا میں نے پہلے ذکر کیا تھا: اگر سرمایہ کاری پر واپسی (ROI) بہت قابل پیمائش ہے، تو کام کی پیداوار کی سطح بھی بہت واضح ہے۔

ہمارا خیال یہ ہے کہ سیٹوں کی تعداد کے لحاظ سے قیمتوں کا تعین یقینی طور پر لاگو نہیں ہوتا ہے۔ آپ کام کے آؤٹ پٹ کی بنیاد پر قیمت لگا سکتے ہیں۔ لہذا، قیمتوں کا جو ماڈل آپ پیش کرتے ہیں وہ یہ ہونا چاہئے کہ جتنا زیادہ کام کیا جائے گا، اتنا ہی زیادہ آپ ادا کریں گے۔

ہمارے لیے، قیمت کے دو واضح طریقے ہیں۔ آپ یا تو بات چیت کی قیمت لگا سکتے ہیں، یا آپ ان گفتگو کی قیمت لگا سکتے ہیں جنہیں AI اصل میں حل کرتا ہے۔ میرے خیال میں ایک دلچسپ سبق جو ہم نے سیکھا ہے وہ یہ ہے کہ زیادہ تر لوگوں نے بات چیت کی قیمتوں کا ماڈل منتخب کیا۔ وجہ یہ ہے کہ حل کے ذریعہ قیمتوں کا تعین کرنے کا بنیادی فائدہ یہ ہے کہ آپ کس چیز کی ادائیگی کرتے ہیں۔ دی AI کرتا ہے۔

لیکن اس کے بعد سوال یہ ہے کہ "حل" کیا سمجھا جاتا ہے؟ سب سے پہلے، کوئی بھی اس کی گہرائی میں نہیں جانا چاہتا، کیونکہ یہ بن جاتا ہے، "اگر کوئی غصے میں آتا ہے اور آپ اسے رخصت کر دیتے ہیں، تو ہم اس کی قیمت کیوں ادا کریں؟"

یہ ایک عجیب صورتحال پیدا کرتا ہے اور AI فراہم کرنے والوں کے لیے مراعات کو بھی قدرے عجیب بنا دیتا ہے، کیونکہ حل کے ذریعے بل کرنے کا مطلب ہے، "ہمیں زیادہ سے زیادہ بات چیت کو حل کرنے اور کچھ لوگوں کو دور کرنے کی ضرورت ہے۔" لیکن بہت سے معاملات ایسے ہیں جہاں مسئلہ کو صرف دور کرنے کے بجائے بڑھانا بہتر ہے، اور صارفین کو اس قسم کی ہینڈلنگ پسند نہیں ہے۔ لہذا، بات چیت کے ذریعے بلنگ زیادہ سادگی اور پیشین گوئی لائے گی۔

کمبرلی ٹین: آپ کے خیال میں قیمتوں کا مستقبل کا ماڈل کب تک چلے گا؟کیونکہ ابھی جب آپ ROI کا ذکر کرتے ہیں، تو یہ عام طور پر ماضی کے اخراجات پر مبنی ہوتا ہے جو شاید مزدوری کے اخراجات کو پورا کرنے کے لیے استعمال کیا گیا ہو۔ جیسے جیسے AI ایجنٹس زیادہ عام ہو جاتے ہیں، کیا آپ سمجھتے ہیں کہ طویل مدتی میں، AI کا موازنہ مزدوری کے اخراجات سے کیا جائے گا اور یہ ایک مناسب معیار ہے؟ اگر نہیں، تو آپ مزدوری کی لاگت سے آگے طویل مدتی قیمتوں کو کیسے دیکھتے ہیں؟

جیسی ژانگ: میرا خیال ہے کہ طویل مدتی میں، AI ایجنٹ کی قیمتوں کا تعین اب بھی بنیادی طور پر مزدوری کے اخراجات سے منسلک ہو سکتا ہے، کیونکہ یہ ایجنٹ کی خوبصورتی ہے – خدمات پر آپ کے پچھلے اخراجات کو اب سافٹ ویئر میں منتقل کیا جا سکتا ہے۔

اخراجات کا یہ حصہ سافٹ ویئر کے اخراجات سے 10 سے 100 گنا زیادہ ہو سکتا ہے، اس لیے بہت ساری لاگت سافٹ ویئر پر منتقل ہو جائے گی۔ لہذا، مزدوری کے اخراجات قدرتی طور پر ایک معیار بن جائیں گے۔ ہمارے صارفین کے لیے، ROI بہت واضح ہے۔ اگر آپ مزدوری کے اخراجات میں X ملین بچا سکتے ہیں، تو اس حل کو اپنانا سمجھ میں آتا ہے۔ لیکن طویل عرصے میں، یہ درمیانی زمین میں ہوسکتا ہے.

کیونکہ یہاں تک کہ کچھ پروڈکٹس جو ہمارے ایجنٹ کے طور پر اچھے نہیں ہیں کم قیمتوں کو قبول کریں گے۔ یہ کلاسک SaaS صورت حال کی طرح ہے، جہاں ہر کوئی مارکیٹ شیئر کے لیے مقابلہ کر رہا ہے۔

کمبرلی ٹین: آپ کے خیال میں موجودہ SaaS کمپنیوں کے لیے مستقبل کیا ہے، خاص طور پر وہ جن کی مصنوعات AI کے لیے مقامی طور پر نہیں بنائی گئی ہیں یا جن کی قیمت فی سیٹ ہے اور اس وجہ سے وہ نتائج پر مبنی قیمتوں کے ماڈل کے مطابق نہیں بن سکتیں؟

جیسی ژانگ: کچھ روایتی کمپنیوں کے لیے، اگر وہ AI ایجنٹ پروڈکٹ لانچ کرنے کی کوشش کرتی ہیں تو یہ واقعی قدرے مشکل ہے کیونکہ وہ سیٹ ماڈل کا استعمال کرتے ہوئے اس کی قیمت نہیں لگا سکتیں۔ اگر آپ کو زیادہ سے زیادہ ایجنٹوں کی ضرورت نہیں ہے، تو موجودہ پروڈکٹ سے آمدنی کو برقرار رکھنا مشکل ہے۔ یہ روایتی کمپنیوں کے لیے ایک مسئلہ ہے، لیکن یہ کہنا مشکل ہے۔ روایتی کمپنیوں کو ہمیشہ ڈسٹری بیوشن چینلز کا فائدہ ہوتا ہے۔ یہاں تک کہ اگر پروڈکٹ نئی کمپنی کی طرح اچھی نہیں ہے، تب بھی لوگ صرف 80% کوالٹی والے نئے سپلائر کو قبول کرنے کی کوششیں خرچ کرنے سے گریزاں ہیں۔

لہذا، سب سے پہلے، اگر آپ ہماری طرح اسٹارٹ اپ ہیں، تو آپ کو یقینی بنانا ہوگا کہ آپ کی پروڈکٹ روایتی پروڈکٹ سے تین گنا بہتر ہے۔ دوسرا، یہ روایتی کمپنیوں اور اسٹارٹ اپ کے درمیان ایک عام مقابلہ ہے۔ روایتی کمپنیاں قدرتی طور پر کم خطرے کو برداشت کرتی ہیں کیونکہ ان کے گاہکوں کی ایک بڑی تعداد ہوتی ہے۔ اگر وہ تیزی سے تکرار میں غلطی کرتے ہیں تو اس سے بہت زیادہ نقصان ہوگا۔ تاہم، سٹارٹ اپ تیزی سے اعادہ کر سکتے ہیں، لہذا تکرار کا عمل خود ایک بہتر پروڈکٹ کا باعث بن سکتا ہے۔ یہ معمول کا چکر ہے۔ ہمارے لیے، ہمیں اپنی ترسیل کی رفتار، مصنوعات کے معیار اور اپنی ٹیم کی کارکردگی پر ہمیشہ فخر رہا ہے۔ یہی وجہ ہے کہ ہم نے موجودہ معاہدہ جیت لیا ہے۔

کمبرلی ٹین: کیا آپ کام کی جگہ پر AI کے مستقبل کے بارے میں کچھ پیش گوئیاں کر سکتے ہیں؟ مثال کے طور پر، یہ ملازمین کی ضروریات یا صلاحیتوں کو کس طرح تبدیل کرے گا، یا انسانی ملازمین اور AI ایجنٹس کس طرح بات چیت کرتے ہیں؟آپ کے خیال میں کام کی جگہ پر کون سے نئے بہترین طرز عمل یا اصول معمول بن جائیں گے کیونکہ AI ایجنٹس زیادہ وسیع ہو جائیں گے؟

جیسی ژانگ: پہلی اور سب سے اہم تبدیلی یہ ہے کہ ہمیں یقین ہے کہ مستقبل میں، ملازمین کام کی جگہ کی تعمیر اور AI ایجنٹوں کے انتظام میں بہت زیادہ وقت گزاریں گے، جیسا کہ AI سپروائزرز کے کردار کی طرح ہے۔ یہاں تک کہ اگر آپ کی پوزیشن باضابطہ طور پر "AI سپروائزر" نہیں ہے، تو آپ اپنا کام کرنے میں جتنا وقت صرف کرتے تھے اس کا ایک بڑا حصہ ان ایجنٹوں کو سنبھالنے میں منتقل ہو جائے گا، کیونکہ ایجنٹ آپ کو بہت زیادہ فائدہ دے سکتے ہیں۔

ہم نے اسے بہت سی تعیناتیوں میں دیکھا ہے جہاں وہ لوگ جو کبھی ٹیم لیڈر تھے اب AI کی نگرانی میں کافی وقت صرف کرتے ہیں، مثال کے طور پر، یہ یقینی بنانے کے لیے کہ اس میں کوئی پریشانی تو نہیں ہے یا ایڈجسٹمنٹ کرنا۔ وہ یہ دیکھنے کے لیے مجموعی کارکردگی کی نگرانی کرتے ہیں کہ آیا ایسے مخصوص شعبے ہیں جن پر توجہ دینے کی ضرورت ہے، اگر علم کی بنیاد میں ایسے خلاء ہیں جو AI کو بہتر بنانے میں مدد کر سکتے ہیں، اور آیا AI ان خلا کو پُر کر سکتا ہے۔

ایجنٹ کے ساتھ کام کرنے سے جو کام آتا ہے اس سے یہ تاثر ملتا ہے کہ مستقبل میں ملازمین AI ایجنٹوں کے ساتھ بات چیت کرنے میں کافی وقت گزاریں گے۔ یہ ہماری کمپنی کا بنیادی تصور ہے، جیسا کہ میں نے پہلے ذکر کیا ہے۔ لہذا، ہماری پوری مصنوعات لوگوں کو ٹولز، تصور، تشریح، اور کنٹرول فراہم کرنے کے ارد گرد بنایا گیا ہے. مجھے لگتا ہے کہ ایک سال کے اندر، یہ ایک بہت بڑا رجحان بن جائے گا۔

کمبرلی ٹین: یہ بہت معنی رکھتا ہے۔ آپ کے خیال میں AI سپروائزرز کو مستقبل میں کن صلاحیتوں کی ضرورت ہوگی؟ اس کردار کے لیے کیا مہارت مقرر ہے؟

جیسی ژانگ: دو پہلو ہیں۔ ایک ہے مشاہدہ اور تشریح، جلدی سمجھنے کی صلاحیت کہ AI کیا کر رہا ہے اور یہ کیسے فیصلے کرتا ہے۔ دوسرا فیصلہ سازی کی صلاحیت، یا عمارت کا حصہ، رائے کیسے دی جائے اور نئی منطق کیسے بنائی جائے۔ میرے خیال میں یہ دونوں ایک ہی سکے کے دو رخ ہیں۔

کمبرلی ٹین: آپ کے خیال میں کون سے کام درمیانی یا طویل مدت میں AI ایجنٹ کی صلاحیتوں سے باہر رہیں گے اور پھر بھی انسانوں کے ذریعہ ان کا صحیح طریقے سے انتظام اور انجام دینے کی ضرورت ہوگی؟

جیسی ژانگ: میرے خیال میں یہ بنیادی طور پر "کمالیت" کی ضرورت پر منحصر ہوگا جس کا میں نے پہلے ذکر کیا ہے۔ بہت سے کام ایسے ہیں جن میں غلطی کی برداشت بہت کم ہے۔ ان صورتوں میں، کوئی بھی AI ٹول ایک مکمل ایجنٹ کے مقابلے میں زیادہ مددگار ہے۔

مثال کے طور پر، کچھ زیادہ حساس صنعتوں میں، جیسے صحت کی دیکھ بھال یا سیکیورٹی، جہاں آپ کو تقریباً کامل ہونا پڑتا ہے، پھر ان شعبوں میں، AI ایجنٹس کم خود مختار ہو سکتے ہیں، لیکن اس کا مطلب یہ نہیں کہ وہ بیکار ہیں۔ میرے خیال میں انداز مختلف ہو گا، ہمارے جیسے پلیٹ فارم میں، آپ دراصل ان ایجنٹوں کو تعینات کر رہے ہیں تاکہ وہ پورا کام خودکار کر سکیں۔

ڈیرک ہیرس: اور یہ سب اس ایپی سوڈ کے لیے ہے۔ اگر آپ کو یہ موضوع دلچسپ یا متاثر کن لگتا ہے، تو براہ کرم ہمارے پوڈ کاسٹ کی درجہ بندی کریں اور مزید لوگوں کے ساتھ اس کا اشتراک کریں۔ہم امید کرتے ہیں کہ آخری ایپی سوڈ سال کے اختتام سے پہلے ریلیز ہو جائے گا اور نئے سال کے لیے مواد کو دوبارہ ترتیب دیا جائے گا۔ سننے کے لیے شکریہ اور چھٹیوں کا موسم بہت اچھا گزرے (اگر آپ تعطیلات کے دوران سن رہے ہیں)۔

اصل ویڈیو: کیا ال ایجنٹ آخر کار کسٹمر سپورٹ کو ٹھیک کر سکتے ہیں۔?

ملتے جلتے پوسٹس

جواب دیں

آپ کا ای میل ایڈریس شائع نہیں کیا جائے گا۔ ضروری خانوں کو * سے نشان زد کیا گیا ہے