हाइलाइट

  • एलएलएम का जादू यह है कि वे बहुत लचीले होते हैं, कई अलग-अलग स्थितियों के अनुकूल ढल सकते हैं, और उनमें बुनियादी बुद्धिमत्ता होती है।
  • हमारा मानना है कि समय के साथ, यूआई और यूएक्स अधिक से अधिक प्राकृतिक भाषा-आधारित बन जाएंगे, क्योंकि एजेंट सिस्टम इसी तरह सोचता है, या यह मूल रूप से बड़े भाषा मॉडल (एलएलएम) के प्रशिक्षण का आधार है।
  • यदि आप चाहते हैं कि कोई व्यक्ति AI एजेंट को स्वीकार करे, तो वे वास्तव में एक हद तक "विश्वास की छलांग" लगा रहे हैं, क्योंकि कई लोगों के लिए यह एक बहुत ही अपरिचित क्षेत्र है।

एआई एजेंट ग्राहक अनुभव को नया रूप देता है

जेसी झांग: हमारा मानना है कि समय के साथ, यह प्राकृतिक भाषा-आधारित एजेंट की तरह बनता जाएगा, क्योंकि इसी तरह बड़े भाषा मॉडल (LLM) को प्रशिक्षित किया जाता है।

दीर्घावधि में, यदि आपके पास एक अति बुद्धिमान एजेंट है जो वास्तव में मानव जैसा है, तो आप उसे चीजें दिखा सकते हैं, समझा सकते हैं, फीडबैक दे सकते हैं, और वह अपने दिमाग में जानकारी को अपडेट कर लेगा।

आप एक बहुत ही सक्षम मानव टीम के सदस्य की कल्पना कर सकते हैं। जब वे पहली बार शामिल होते हैं, तो आप उन्हें कुछ सिखाते हैं, वे काम करना शुरू करते हैं, और फिर आप उन्हें फीडबैक देते हैं और उन्हें नई जानकारी दिखाते हैं।

अंततः, यह इस दिशा में विकसित होगा - यह अधिक संवादात्मक और प्राकृतिक भाषा पर आधारित हो जाएगा, और जिस तरह से लोग एक दूसरे के साथ संवाद करते हैं वह अधिक स्वाभाविक हो जाएगा। और लोग अब आवश्यकताओं को पकड़ने के लिए उन जटिल निर्णय वृक्षों का उपयोग नहीं करेंगे, जो काम कर सकते हैं लेकिन ढहने की संभावना है।

अतीत में, हमें ऐसा करना पड़ा क्योंकि हमारे पास कोई बड़ा भाषा मॉडल नहीं था। लेकिन अब, एजेंट की निरंतर प्रगति के साथ, उपयोगकर्ता अनुभव (UX) और उपयोगकर्ता इंटरफ़ेस (UI) अधिक संवादात्मक हो जाएगा।

डेरिक हैरिस: नमस्कार, A16z AI पॉडकास्ट में आपका स्वागत है। मैं डेरिक हैरिस हूँ, और आज मेरे साथ होंगे डेकागन के सह-संस्थापक और सीईओ जेसी झांग, और a16z में भागीदार किम्बर्ली टैन। किम्बर्ली चर्चा का संचालन करेंगी, और जेसी डेकागन और उसके उत्पादों के निर्माण के अपने अनुभव साझा करेंगे।

अगर आपको इसके बारे में ज़्यादा जानकारी नहीं है, तो बता दें कि डेकागन एक स्टार्टअप है जो कस्टमर सपोर्ट में मदद के लिए व्यवसायों को AI एजेंट प्रदान करता है। ये एजेंट न तो चैटबॉट हैं और न ही किसी एक API कॉल के लिए LLM रैपर, बल्कि अत्यधिक अनुकूलित उन्नत एजेंट हैं जो किसी कंपनी की विशिष्ट ज़रूरतों के आधार पर जटिल वर्कफ़्लो को संभाल सकते हैं।

यह बताने के अलावा कि उन्होंने डेकागन क्यों बनाया और इसे विभिन्न एलएलएम और ग्राहक परिवेशों को संभालने के लिए कैसे तैयार किया गया है, जेसी ने एक ऐसे व्यवसाय मॉडल के लाभों के बारे में भी बात की जो प्रति वार्तालाप शुल्क लेता है, और कैसे एआई एजेंट ग्राहक सहायता नेताओं के लिए आवश्यक कौशल को बदल देंगे।

यह भी उल्लेखनीय है कि किम्बर्ली ने हाल ही में "आरआईपी से आरपीए, इंटेलिजेंट ऑटोमेशन का उदय" शीर्षक से एक ब्लॉग पोस्ट लिखा था, जिसकी इस एपिसोड में हमने संक्षेप में चर्चा की है।

यह समझने के लिए एक बढ़िया शुरुआती बिंदु है कि व्यवसाय प्रक्रियाओं में स्वचालन कैसे आगे बढ़ रहा है, और हम शो नोट्स में एक लिंक प्रदान करेंगे। और अंत में, एक अनुस्मारक के रूप में, इस लेख की सामग्री केवल सूचनात्मक उद्देश्यों के लिए है और इसे कानूनी, व्यवसाय, कर या निवेश सलाह नहीं माना जाना चाहिए, न ही इसका उपयोग किसी निवेश या सुरक्षा का मूल्यांकन करने के लिए किया जाना चाहिए, और यह किसी भी a16z फंड निवेशक या संभावित निवेशक के लिए निर्देशित नहीं है।

जेसी झांग: अपना संक्षिप्त परिचय। मैं बोल्डर में पैदा हुआ और पला-बढ़ा, और मैंने बचपन में बहुत सारी गणित प्रतियोगिताओं और इसी तरह की अन्य गतिविधियों में भाग लिया। मैंने हार्वर्ड में कंप्यूटर विज्ञान का अध्ययन किया, और फिर एक कंपनी शुरू की जिसे a16z का भी समर्थन प्राप्त था। अंततः हमें Niantic द्वारा अधिग्रहित कर लिया गया।

फिर हमने डेकागन का निर्माण शुरू किया। हमारा व्यवसाय ग्राहक सेवा के लिए एआई एजेंट बनाना है। शुरुआत में, हमने ऐसा इसलिए किया क्योंकि हम कुछ ऐसा करना चाहते थे जो हमारे दिल के बहुत करीब हो।

बेशक, ग्राहक सेवा में एआई एजेंट की भूमिका के बारे में किसी को भी सिखाने की ज़रूरत नहीं है, है न? हम सभी एयरलाइनों, होटलों आदि से फ़ोन पर बात करते रहे हैं और प्रतीक्षा करते रहे हैं। तो यह विचार वहीं से आया।

हमने बहुत से ग्राहकों से बात की ताकि पता लगाया जा सके कि हमें किस तरह का उत्पाद बनाना चाहिए। एक बात जो हमारे लिए सबसे महत्वपूर्ण थी, वह यह थी कि जैसे-जैसे हमने AI एजेंटों के बारे में अधिक सीखा, हमने यह सोचना शुरू कर दिया कि जब उनमें से बहुत सारे होंगे तो भविष्य कैसा होगा। मुझे लगता है कि हर कोई मानता है कि भविष्य में बहुत सारे AI एजेंट होंगे।

हम इस बारे में सोचते हैं कि एआई एजेंटों के साथ काम करने वाले कर्मचारी क्या करेंगे? उनके पास किस तरह के उपकरण होंगे? वे जिन एजेंटों के साथ काम करते हैं या उन्हें प्रबंधित करते हैं, उन्हें वे कैसे नियंत्रित या देख पाएंगे?

तो यही वह मूल बात है कि हमने इस सवाल के इर्द-गिर्द कंपनी कैसे बनाई। मुझे लगता है कि यही बात हमें अभी अलग बनाती है, क्योंकि हम इन AI एजेंटों को विभिन्न उपकरण प्रदान करते हैं, ताकि हम जिन लोगों के साथ काम करते हैं, वे इन एजेंटों को बना और कॉन्फ़िगर कर सकें, ताकि वे अब "ब्लैक बॉक्स" न रहें। इसी तरह हम अपना ब्रांड बनाते हैं।

डेरिक हैरिस: चूंकि आपकी पिछली कंपनी उपभोक्ता-केंद्रित वीडियो कंपनी थी, तो आपको एंटरप्राइज सॉफ्टवेयर में कदम रखने की प्रेरणा कहां से मिली?

जेसी झांग: बढ़िया सवाल। मुझे लगता है कि संस्थापक अक्सर विषय चुनने के मामले में "विषय अज्ञेयवादी" होते हैं, क्योंकि वास्तव में, जब आप किसी नए क्षेत्र में जाते हैं, तो आप आमतौर पर काफी भोले होते हैं। इसलिए चीजों को नए दृष्टिकोण से देखने का एक फायदा है। इसलिए जब हम इसके बारे में सोच रहे थे, तो लगभग कोई विषय प्रतिबंध नहीं थे।

मुझे लगता है कि यह उन लोगों के लिए एक बहुत ही सामान्य पैटर्न है, जिनकी पृष्ठभूमि अधिक मात्रात्मक है, जिसमें मैं भी शामिल हूँ। उपभोक्ता उत्पादों को आजमाने के बाद, आप एंटरप्राइज़ सॉफ़्टवेयर की ओर अधिक आकर्षित होते हैं क्योंकि एंटरप्राइज़ सॉफ़्टवेयर में अधिक ठोस समस्याएँ होती हैं।

आपके पास वास्तविक ग्राहक हैं जिनकी वास्तविक ज़रूरतें और बजट और ऐसी ही चीज़ें हैं, और आप उनके लिए समस्याओं को अनुकूलित और हल कर सकते हैं। उपभोक्ता बाज़ार भी बहुत आकर्षक है, लेकिन यह प्रयोग से प्रेरित होने के बजाय अंतर्ज्ञान पर अधिक आधारित है। मेरे लिए व्यक्तिगत रूप से, एंटरप्राइज़ सॉफ़्टवेयर बेहतर विकल्प है।

किम्बर्ली टैन: सबसे पहले, हम इस प्रश्न से शुरुआत कर सकते हैं: डेकागन आज किन सबसे आम सहायता श्रेणियों से निपटता है? क्या आप विस्तार से बता सकते हैं कि आप इन समस्याओं को हल करने के लिए बड़े भाषा मॉडल (एलएलएम) का उपयोग कैसे करते हैं और अब आप क्या कर सकते हैं जो आप पहले नहीं कर सकते थे?

जेसी झांग: यदि आप पिछले स्वचालन पर नज़र डालें, तो आपने कुछ सरल कार्य करने के लिए निर्णय वृक्षों का उपयोग किया होगा, ताकि यह निर्धारित किया जा सके कि कौन सा मार्ग अपनाना है। लेकिन हम सभी ने चैटबॉट का उपयोग किया है, और यह एक बहुत ही निराशाजनक अनुभव है।

अक्सर आपके प्रश्न का उत्तर निर्णय वृक्ष द्वारा पूरी तरह से नहीं दिया जा सकता। इसलिए आप अंततः ऐसे प्रश्न पथ पर निर्देशित हो जाते हैं जो प्रश्न से संबंधित तो होता है लेकिन उससे बिल्कुल मेल नहीं खाता। अब, हमारे पास बड़े भाषा मॉडल (LLM) हैं। LLM का जादू यह है कि वे बहुत लचीले होते हैं, कई अलग-अलग स्थितियों के अनुकूल हो सकते हैं, और उनमें बुनियादी बुद्धिमत्ता होती है।

जब आप इसे ग्राहक सहायता पर लागू करते हैं, या जब कोई ग्राहक कोई प्रश्न पूछता है, तो आप अधिक व्यक्तिगत सेवा प्रदान कर सकते हैं। यह पहला बिंदु है, वैयक्तिकरण के स्तर में बहुत सुधार हुआ है। यह उच्च मीट्रिक को अनलॉक करता है। आप अधिक समस्याओं को हल कर सकते हैं, ग्राहक अधिक संतुष्ट हैं, और ग्राहक संतुष्टि बढ़ जाती है।

अगला स्वाभाविक कदम है: यदि आपके पास यह बुद्धिमत्ता है, तो आपको वे ज़्यादा चीज़ें करने में सक्षम होना चाहिए जो मनुष्य कर सकते हैं। मनुष्य जो चीज़ें कर सकते हैं, वे हैं कि वे वास्तविक समय में डेटा खींच सकते हैं, वे कार्रवाई कर सकते हैं, और वे कई चरणों के माध्यम से तर्क कर सकते हैं। यदि कोई ग्राहक अपेक्षाकृत जटिल प्रश्न पूछता है, तो शायद "मैं यह और वह करना चाहता हूँ," और AI केवल पहले प्रश्न को संभालने के लिए तैयार है। LLM इतना समझदार है कि वह पहचान सकता है कि यहाँ दो प्रश्न हैं। सबसे पहले, यह पहली समस्या को हल करेगा, और फिर दूसरी समस्या को हल करने में आपकी मदद करेगा।

एलएलएम के आने से पहले, यह मूल रूप से असंभव था। इसलिए अब हम देख रहे हैं कि तकनीक क्या करने में सक्षम है, और यह एलएलएम की बदौलत है।

किम्बर्ली टैन: इस संदर्भ में, आप एआई एजेंट को कैसे परिभाषित करेंगे? चूंकि "एजेंट" शब्द का व्यापक रूप से उपयोग किया जाता है, इसलिए मैं उत्सुक हूं कि डेकागन के संदर्भ में इसका वास्तव में क्या अर्थ है।

जेसी झांग: मैं कहूंगा कि एजेंट का मतलब एक ऐसी प्रणाली से है जहां कई LLM (बड़ी भाषा मॉडल) सिस्टम एक साथ काम करते हैं। आपके पास एक LLM इनवोकेशन है, जिसमें मूल रूप से एक प्रॉम्प्ट भेजना और प्रतिक्रिया प्राप्त करना शामिल है। एक एजेंट के लिए, आप कई ऐसे इनवोकेशन को कनेक्ट करने में सक्षम होना चाहते हैं, शायद पुनरावर्ती रूप से भी।

उदाहरण के लिए, आपके पास एक LLM कॉल है जो यह निर्धारित करती है कि संदेश को कैसे संभालना है, और फिर यह अन्य कॉल को ट्रिगर कर सकता है जो अधिक डेटा खींचते हैं, क्रियाएं करते हैं, और उपयोगकर्ता ने जो कहा है उस पर पुनरावृत्ति करते हैं, शायद अनुवर्ती प्रश्न भी पूछते हैं। इसलिए हमारे लिए, एक एजेंट को लगभग LLM कॉल, API कॉल या अन्य तर्क के नेटवर्क के रूप में समझा जा सकता है जो बेहतर अनुभव प्रदान करने के लिए एक साथ काम करते हैं।

किम्बर्ली टैन: इस विषय पर, शायद हम आपके द्वारा वास्तव में बनाए गए एजेंट इंफ्रास्ट्रक्चर के बारे में अधिक बात कर सकते हैं। मुझे लगता है कि एक बहुत ही दिलचस्प बात यह है कि बाजार में एआई एजेंटों के कई प्रदर्शन हैं, लेकिन मुझे लगता है कि उनके बहुत कम उदाहरण हैं जो वास्तव में उत्पादन वातावरण में स्थिर रूप से चल सकते हैं। और बाहर से यह जानना मुश्किल है कि क्या वास्तविक है और क्या नहीं।

तो आपकी राय में, आज के एआई एजेंटों के कौन से पहलू अच्छा प्रदर्शन कर रहे हैं, और किन पहलुओं को अभी भी अधिक मजबूत और विश्वसनीय बनाने के लिए तकनीकी सफलता की आवश्यकता है?

जेसी झांग: मेरा दृष्टिकोण वास्तव में थोड़ा अलग है। यह निर्धारित करने के बीच का अंतर कि क्या एक AI एजेंट केवल एक डेमो है या "वास्तव में काम कर रहा है" पूरी तरह से प्रौद्योगिकी स्टैक में नहीं है, क्योंकि मुझे लगता है कि अधिकांश लोग लगभग एक ही तकनीक का उपयोग कर सकते हैं। मुझे लगता है कि एक बार जब आप अपनी कंपनी के विकास में आगे बढ़ जाते हैं, उदाहरण के लिए, हमारी कंपनी को एक साल से अधिक समय हो गया है, तो आप कुछ बहुत ही विशिष्ट बना लेंगे जो आपके उपयोग के मामले में फिट बैठता है।

लेकिन अंतिम विश्लेषण में, हर कोई एक ही मॉडल का उपयोग कर सकता है और समान तकनीक का उपयोग कर सकता है। मेरा मानना है कि एक एआई एजेंट प्रभावी रूप से काम कर सकता है या नहीं, इसका सबसे बड़ा अंतर वास्तव में उपयोग के मामले के रूप में निहित है। शुरुआत में यह जानना कठिन है, लेकिन पीछे मुड़कर देखने पर, आप पाएंगे कि दो विशेषताएं हैं जो एक एआई एजेंट के लिए प्रदर्शन से आगे बढ़ने और व्यावहारिक अनुप्रयोग में प्रवेश करने के लिए बहुत महत्वपूर्ण हैं।

पहली बात यह है कि आपके द्वारा हल किए जाने वाले उपयोग मामले में मात्रात्मक ROI (निवेश पर प्रतिफल) होना चाहिए। यह बहुत महत्वपूर्ण है, क्योंकि यदि ROI को परिमाणित नहीं किया जा सकता है, तो लोगों को वास्तव में आपके उत्पाद का उपयोग करने और इसके लिए भुगतान करने के लिए राजी करना मुश्किल होगा। हमारे मामले में, मात्रात्मक संकेतक है: आप कितने प्रतिशत समर्थन अनुरोधों का समाधान करते हैं? क्योंकि यह संख्या स्पष्ट है, लोग इसे समझ सकते हैं - ओह, ठीक है, यदि आप अधिक समाधान करते हैं, तो मैं इस परिणाम की तुलना अपने वर्तमान खर्चों और खर्च किए गए समय से कर सकता हूँ। इसलिए, यदि यह संकेतक है, तो एक और संकेतक जो हमारे लिए बहुत महत्वपूर्ण है वह है ग्राहक संतुष्टि। क्योंकि ROI को आसानी से परिमाणित किया जा सकता है, लोग वास्तव में इसे अपनाएंगे।

दूसरा कारक यह है कि उपयोग के मामले क्रमशः अधिक कठिन होने चाहिए। यह भी बहुत मुश्किल होगा यदि आपको शुरू से ही एक ऐसे एजेंट की आवश्यकता हो जो लगभग 100% उपयोग मामलों को हल करने के लिए सुपरह्यूमन हो। क्योंकि जैसा कि हम जानते हैं, LLM गैर-निर्धारक हैं, आपके पास किसी प्रकार की आकस्मिक योजना होनी चाहिए। सौभाग्य से, समर्थन उपयोग मामलों की एक बड़ी विशेषता यह है कि आप हमेशा किसी इंसान को आगे बढ़ा सकते हैं। भले ही आप केवल आधी समस्याओं का समाधान कर सकें, फिर भी यह लोगों के लिए बहुत मूल्यवान है।

इसलिए मुझे लगता है कि समर्थन में यह विशेषता है जो इसे AI एजेंट के लिए बहुत उपयुक्त बनाती है। मुझे लगता है कि ऐसे कई अन्य क्षेत्र हैं जहाँ लोग प्रभावशाली डेमो बना सकते हैं जहाँ आपको यह समझने के लिए बारीकी से देखने की भी ज़रूरत नहीं है कि AI एजेंट क्यों उपयोगी होगा। लेकिन अगर इसे शुरू से ही सही होना है, तो यह बहुत मुश्किल है। अगर ऐसा है, तो लगभग कोई भी इसे आज़माना या इस्तेमाल करना नहीं चाहेगा क्योंकि इसकी अपूर्णता के परिणाम बहुत गंभीर हो सकते हैं - उदाहरण के लिए, सुरक्षा के मामले में।

उदाहरण के लिए, जब लोग सिमुलेशन करते हैं, तो उनके मन में हमेशा यह क्लासिक विचार आता है: "ओह, यह बहुत अच्छा होगा यदि LLM इसे पढ़ सके।" लेकिन किसी को यह कहते हुए कल्पना करना कठिन है, "ठीक है, AI एजेंट, इसे कर लो। मुझे विश्वास है कि तुम यह कर सकते हो।" क्योंकि अगर यह गलती करता है, तो परिणाम बहुत गंभीर हो सकते हैं।

जेसी झांग: यह आमतौर पर हमारे ग्राहकों द्वारा तय किया जाता है, और वास्तव में हम बहुत सारे अंतर देखते हैं। एक चरम पर, कुछ लोग वास्तव में अपने एजेंट को एक इंसान की तरह दिखाते हैं, इसलिए एक मानव अवतार, एक मानव नाम होता है, और प्रतिक्रियाएँ बहुत स्वाभाविक होती हैं। दूसरी ओर, एजेंट बस यह बताता है कि यह AI है और उपयोगकर्ता को यह स्पष्ट करता है। मुझे लगता है कि हम जिन अलग-अलग कंपनियों के साथ काम करते हैं, उनके पास इस पर अलग-अलग स्थिति है।

आम तौर पर, यदि आप एक विनियमित उद्योग में हैं, तो आपको यह स्पष्ट करना होगा। मुझे अब जो दिलचस्प लगता है वह यह है कि ग्राहक व्यवहार बदल रहा है। क्योंकि हमारे कई ग्राहकों को सोशल मीडिया पर बहुत सारी प्रतिक्रियाएँ मिल रही हैं, जैसे, "हे भगवान, यह पहला चैट अनुभव है जिसे मैंने कभी आज़माया है जो वास्तव में इतना वास्तविक लगता है," या "यह बस जादू है।" और यह उनके लिए बहुत अच्छा है, क्योंकि अब उनके ग्राहक सीख रहे हैं, अरे, अगर यह एक AI अनुभव है, तो यह वास्तव में एक इंसान से बेहतर हो सकता है। अतीत में ऐसा नहीं था, क्योंकि हममें से अधिकांश लोगों को अतीत में इस तरह का फ़ोन ग्राहक सेवा अनुभव हुआ है: "ठीक है, AI, AI, AI..."

किम्बर्ली टैन: आपने कई बार निजीकरण की अवधारणा का उल्लेख किया है। हर कोई एक ही अंतर्निहित प्रौद्योगिकी वास्तुकला का उपयोग कर रहा है, लेकिन समर्थन सेवाओं के संदर्भ में उनकी निजीकरण की ज़रूरतें अलग-अलग हैं। क्या आप इस बारे में बात कर सकते हैं? विशेष रूप से, आप निजीकरण कैसे प्राप्त करते हैं ताकि लोग ऑनलाइन कह सकें, "हे भगवान, यह अब तक का सबसे अच्छा समर्थन अनुभव है"?

जेसी झांग: हमारे लिए, निजीकरण उपयोगकर्ता के लिए अनुकूलन से आता है। आपको उपयोगकर्ता की पृष्ठभूमि की जानकारी को समझने की आवश्यकता है, जो अतिरिक्त संदर्भ की आवश्यकता है। दूसरे, आपको हमारे ग्राहकों के व्यावसायिक तर्क को भी समझने की आवश्यकता है।यदि आप दोनों को मिला दें तो आप बहुत अच्छा अनुभव प्रदान कर सकते हैं।

जाहिर है, यह सरल लगता है, लेकिन वास्तव में सभी आवश्यक संदर्भ प्राप्त करना बहुत मुश्किल है। इसलिए, हमारा अधिकांश काम इस बात पर है कि सही आदिम घटकों का निर्माण कैसे किया जाए ताकि जब कोई ग्राहक हमारे सिस्टम को तैनात करे, तो वह आसानी से निर्णय ले सके, "ठीक है, यह वह व्यावसायिक तर्क है जो हमें चाहिए।" उदाहरण के लिए, पहले आपको ये चार चरण करने होंगे, और यदि चरण तीन विफल हो जाता है, तो आपको चरण पाँच पर जाना होगा।

आप AI को यह बहुत आसानी से सिखाना चाहते हैं, लेकिन साथ ही उसे इस तरह की जानकारी तक पहुँच भी देना चाहते हैं, "यह उपयोगकर्ता का खाता विवरण है। यदि आपको अधिक जानकारी की आवश्यकता है, तो आप इन API को कॉल कर सकते हैं।" ये परतें मॉडल के शीर्ष पर एक समन्वय परत हैं, और एक तरह से, वे एजेंट को वास्तव में उपयोग करने योग्य बनाती हैं।

किम्बर्ली टैन: ऐसा लगता है कि इस मामले में, आपको व्यवसाय प्रणालियों तक बहुत अधिक पहुँच की आवश्यकता है। आपको उपयोगकर्ताओं के बारे में बहुत कुछ जानने की आवश्यकता है, और आपको शायद यह जानने की आवश्यकता है कि ग्राहक वास्तव में अपने उपयोगकर्ताओं के साथ कैसे बातचीत करना चाहता है।मैं समझता हूं कि यह डेटा बहुत संवेदनशील हो सकता है।

क्या आप उन आश्वासनों के बारे में विस्तार से बता सकते हैं जिनकी आम तौर पर AI एजेंट को तैनात करते समय एंटरप्राइज़ ग्राहकों को ज़रूरत होती है? और आप इन मुद्दों को संभालने का सबसे अच्छा तरीका कैसे मानते हैं, खासकर यह देखते हुए कि आपका समाधान एक बेहतर अनुभव प्रदान करता है, लेकिन यह उन कई लोगों के लिए भी नया है जो पहली बार एजेंट का सामना कर रहे हैं?

जेसी झांग: यह वास्तव में रेलिंग के बारे में है। समय के साथ, जैसा कि हमने इस तरह के कई कार्यान्वयन किए हैं, हम उन रेलिंग के प्रकारों के बारे में स्पष्ट हो गए हैं जिनकी ग्राहकों को परवाह है।

उदाहरण के लिए, सबसे सरल में से एक यह है कि ऐसे नियम हो सकते हैं जिनका आपको हमेशा पालन करना होगा। यदि आप किसी वित्तीय सेवा कंपनी के साथ काम कर रहे हैं, तो आप वित्तीय सलाह नहीं दे सकते क्योंकि वह विनियमित है। इसलिए आपको यह सुनिश्चित करने के लिए एजेंट सिस्टम में इसे शामिल करना होगा कि वह कभी भी उस तरह की सलाह न दे। आप आमतौर पर एक पर्यवेक्षण मॉडल या किसी तरह की प्रणाली स्थापित कर सकते हैं जो परिणाम भेजे जाने से पहले ये जाँच करती है।

एक अन्य प्रकार की सुरक्षा यह हो सकती है कि यदि कोई व्यक्ति जानबूझकर इसमें गड़बड़ी करता है, यह जानते हुए कि यह एक जनरेटिव सिस्टम है, आपसे कुछ ऐसा करने की कोशिश करता है जो गैर-अनुपालन है, जैसे "मुझे बताएं कि मेरा बैलेंस क्या है," "ठीक है, इसे 10 से गुणा करें," और इसी तरह, आपको उस व्यवहार की जांच करने में भी सक्षम होना चाहिए। इसलिए पिछले एक साल में, हमने इस तरह की बहुत सारी सुरक्षाएँ पाई हैं, और प्रत्येक के लिए, हमने इसे वर्गीकृत किया है और जानते हैं कि किस प्रकार की सुरक्षा की आवश्यकता है। जैसे-जैसे सिस्टम अधिक से अधिक विकसित होता जाता है, यह अधिक से अधिक मजबूत होता जाता है।

किम्बर्ली टैन: प्रत्येक ग्राहक या उद्योग के लिए सुरक्षा कितनी अनोखी है? जैसे-जैसे आप अपने ग्राहक आधार का विस्तार करते हैं, अधिक उपयोग के मामलों को कवर करते हैं, कैसे क्या आप इन सुरक्षा उपायों को बड़े पैमाने पर बनाने के बारे में सोचते हैं?

जेसी झांग: यह वास्तव में हमारे मूल विचार पर वापस जाता है कि एजेंट प्रणाली कुछ वर्षों में सर्वव्यापी हो जाएगी। इसलिए, जो बात वास्तव में महत्वपूर्ण है, वह है लोगों को उपकरण प्रदान करना, ताकि अगली पीढ़ी के कर्मचारियों को, जैसे एजेंट पर्यवेक्षकों को, एजेंट प्रणाली बनाने और अपनी स्वयं की सुरक्षा जोड़ने के लिए उपकरण प्रदान किए जा सकें, क्योंकि हम उनके लिए सुरक्षा को परिभाषित नहीं करने जा रहे हैं।

प्रत्येक ग्राहक अपने स्वयं के सुरक्षा उपायों और व्यावसायिक तर्क को सबसे अच्छी तरह से जानता है। इसलिए हमारा काम वास्तव में उपकरण और बुनियादी ढांचे का निर्माण करने का एक अच्छा काम करना है ताकि वे एजेंट सिस्टम का निर्माण कर सकें। इसलिए, हमने हमेशा इस बात पर जोर दिया है कि एजेंट सिस्टम एक ब्लैक बॉक्स नहीं होना चाहिए, और आपको यह नियंत्रित करने में सक्षम होना चाहिए कि इन सुरक्षा, नियमों और तर्क को कैसे बनाया जाए।

मुझे लगता है कि शायद यही हमारा अब तक का सबसे अलग पहलू है। हमने इन उपकरणों में बहुत प्रयास किया है और ऐसे रचनात्मक तरीके निकाले हैं, जिनसे ऐसे लोग भी, जिनके पास बहुत ज़्यादा तकनीकी पृष्ठभूमि नहीं है या जिन्हें AI मॉडल कैसे काम करते हैं, इसकी गहरी समझ नहीं है, फिर भी वे एजेंट सिस्टम में AI द्वारा किए जाने वाले कार्यों को इनपुट कर सकते हैं।

मुझे लगता है कि अगले कुछ सालों में यह एक महत्वपूर्ण क्षमता बनने जा रही है। जब लोग समान उपकरणों का मूल्यांकन कर रहे हों तो यह सबसे महत्वपूर्ण मानदंडों में से एक होना चाहिए, क्योंकि आप समय के साथ इन प्रणालियों को लगातार अनुकूलित और बेहतर बनाने में सक्षम होना चाहते हैं।

प्राकृतिक भाषा द्वारा संचालित व्यावसायिक तर्क

डेरिक हैरिस: ग्राहक या व्यवसाय किसी भी प्रकार के स्वचालन और विशेष रूप से इस एजेंट सिस्टम के उपयोग के लिए क्या तैयारी कर सकते हैं? उदाहरण के लिए, वे ऐसे सिस्टम का समर्थन करने के लिए अपने डेटा सिस्टम, सॉफ़्टवेयर आर्किटेक्चर या व्यावसायिक तर्क को कैसे डिज़ाइन कर सकते हैं?

क्योंकि मुझे लगता है कि बहुत सी एआई तकनीकें पहली नजर में नई लगती हैं, लेकिन जब मौजूदा विरासत प्रणालियों की बात आती है, तो अक्सर इसमें काफी अव्यवस्था आ जाती है।

जेसी झांग: अगर कोई अभी स्क्रैच से निर्माण कर रहा है, तो ऐसे कई बेहतरीन अभ्यास हैं जो आपके काम को आसान बना सकते हैं। उदाहरण के लिए, अपने ज्ञान के आधार को कैसे संरचित करें। हमने इनमें से कुछ के बारे में लिखा है, और कुछ ऐसे तरीके पेश किए हैं जो AI के लिए जानकारी को ग्रहण करना और उसकी सटीकता में सुधार करना आसान बना सकते हैं। एक विशिष्ट सुझाव यह है कि ज्ञान के आधार को मॉड्यूलर भागों में विभाजित किया जाए, बजाय इसके कि एक से अधिक उत्तरों वाला एक बड़ा लेख हो।

API सेट करते समय, आप उन्हें एजेंट सिस्टम के लिए अधिक उपयुक्त बना सकते हैं, और अनुमतियाँ और आउटपुट इस तरह से सेट कर सकते हैं कि एजेंट सिस्टम के लिए उत्तर खोजने के लिए बहुत अधिक गणना किए बिना जानकारी को निगलना आसान हो जाए। ये कुछ सामरिक उपाय हैं जिन्हें अपनाया जा सकता है, लेकिन मैं यह नहीं कहूँगा कि एजेंट सिस्टम का उपयोग करने के लिए कुछ ऐसा करना ज़रूरी है।

डेरिक हैरिस: अच्छा दस्तावेज़ीकरण हमेशा महत्वपूर्ण होता है, मूलतः यह सूचना को प्रभावी ढंग से व्यवस्थित करने के बारे में है।

किम्बर्ली टैन: ऐसा लगता है कि यदि आप लोगों को यह सिखाने का प्रयास करते हैं कि एजेंट सिस्टम को किस प्रकार संचालित किया जाए, ताकि यह उनके ग्राहकों या विशिष्ट उपयोग मामलों के लिए सबसे उपयुक्त हो, तो यूआई और यूएक्स डिजाइन के साथ बहुत सारे प्रयोग करने की आवश्यकता हो सकती है, या आपको इस पूरी तरह से नए क्षेत्र में नए रास्ते बनाने होंगे, क्योंकि यह पारंपरिक सॉफ्टवेयर से बहुत अलग है।

मैं उत्सुक हूँ, आप इस बारे में क्या सोचते हैं? एजेंट-प्रथम दुनिया में UI और UX कैसा दिखना चाहिए? आपको क्या लगता है कि अगले कुछ सालों में इसमें क्या बदलाव आएगा?

जेसी झांग: मैं यह नहीं कहूंगा कि हमने इस समस्या का समाधान कर लिया है। मुझे लगता है कि हमने एक स्थानीय इष्टतम समाधान पा लिया है जो हमारे मौजूदा ग्राहकों के लिए कारगर है, लेकिन यह अभी भी हमारे और कई अन्य लोगों के लिए शोध का एक जारी क्षेत्र है।

मुख्य मुद्दा वही है जिसका हमने पहले उल्लेख किया था, यानी आपके पास एक एजेंट सिस्टम है। सबसे पहले, आप यह कैसे स्पष्ट रूप से देख सकते हैं कि यह क्या कर रहा है और यह कैसे निर्णय ले रहा है? फिर, आप इस जानकारी का उपयोग यह तय करने के लिए कैसे कर सकते हैं कि क्या अपडेट किया जाना चाहिए और AI को क्या फीडबैक दिया जाना चाहिए? यहीं पर UI तत्व एक साथ आते हैं, खासकर दूसरा भाग।

हमारा मानना है कि समय के साथ, यूआई और यूएक्स अधिकाधिक प्राकृतिक भाषा-आधारित होते जाएंगे, क्योंकि एजेंट सिस्टम इसी तरह सोचता है, या यह मूलतः बड़े भाषा मॉडल (एलएलएम) के प्रशिक्षण का आधार है।

चरम सीमा पर, यदि आपके पास एक अति-बुद्धिमान एजेंट है जो मूल रूप से मनुष्य की तरह सोचता है, तो आप उसे चीज़ें दिखा सकते हैं, उसे चीज़ें समझा सकते हैं, उसे फ़ीडबैक दे सकते हैं, और वह अपने "दिमाग" में अपडेट हो जाएगा। आप कल्पना कर सकते हैं कि आपकी टीम में एक बहुत ही सक्षम व्यक्ति शामिल है, आप उसे कुछ सिखाते हैं, वह काम करना शुरू कर देता है, और फिर आप उसे फ़ीडबैक देते रहते हैं, आप उसे नई चीज़ें, नए दस्तावेज़, आरेख आदि दिखा सकते हैं।

मुझे लगता है कि चरम मामले में, यह इस दिशा में विकसित होगा: चीजें अधिक संवादात्मक, अधिक प्राकृतिक भाषा-आधारित हो जाएंगी, और लोग जटिल निर्णय वृक्षों के साथ सिस्टम बनाना बंद कर देंगे जैसे वे करते थे, जो आप चाहते हैं उसे कैप्चर करते हैं, लेकिन यह दृष्टिकोण आसानी से टूट सकता है। हमें ऐसा करना पड़ता था क्योंकि उस समय कोई LLM नहीं था, लेकिन अब जब एजेंट सिस्टम अधिक से अधिक शक्तिशाली होते जा रहे हैं, तो UI और UX अधिक संवादात्मक हो जाएंगे।

किम्बर्ली टैन: लगभग डेढ़ साल पहले, जब डेकागन ने पहली बार शुरुआत की थी, तो एक सामान्य धारणा थी कि एलएलएम कई उपयोग मामलों में बहुत लागू है, लेकिन वास्तव में यह किसी प्रकार का "जीपीटी आवरण" था, जहां कंपनियां एपीआई के माध्यम से अंतर्निहित मॉडल को कॉल कर सकती थीं और तुरंत अपनी समर्थन समस्याओं को हल कर सकती थीं।

लेकिन जाहिर है, चूंकि कंपनियाँ सीधे उस रास्ते पर जाने के बजाय डेकागन जैसे समाधानों का उपयोग करना चुनती हैं, इसलिए यह पता चलता है कि ऐसा नहीं है। मैं सोच रहा था कि क्या आप यह समझा सकते हैं कि ऐसा क्यों है। आंतरिक रूप से निर्माण की चुनौतियों को अपेक्षा से अधिक जटिल बनाने वाली क्या बात थी? अवधारणा के बारे में उनके मन में क्या गलतफहमियाँ थीं?

जेसी झांग: "GPT रैपर" होने में कुछ भी गलत नहीं है, आप कह सकते हैं कि Purcell एक AWS रैपर है या ऐसा कुछ। आम तौर पर, जब लोग इस शब्द का इस्तेमाल करते हैं, तो इसका मतलब कुछ अपमानजनक होता है।

मेरा व्यक्तिगत विचार यह है कि यदि आप एजेंट सिस्टम बना रहे हैं, तो परिभाषा के अनुसार आप निश्चित रूप से LLM को एक उपकरण के रूप में उपयोग करने जा रहे हैं। तो आप वास्तव में किसी ऐसी चीज़ के ऊपर निर्माण कर रहे हैं जो पहले से मौजूद है, ठीक वैसे ही जैसे आप आमतौर पर AWS या GCP पर निर्माण करते हैं।

लेकिन वास्तविक समस्या यह हो सकती है कि यदि आप LLM के आधार पर जो सॉफ्टवेयर बनाते हैं वह इतना "भारी" या जटिल नहीं है कि वह कोई बदलाव ला सके।

पीछे मुड़कर देखें तो, हमारे लिए, हम जो बेचते हैं वह मूल रूप से सॉफ्टवेयर है। हम वास्तव में एक नियमित सॉफ्टवेयर कंपनी की तरह हैं, सिवाय इसके कि हम LLM को सॉफ्टवेयर के हिस्से के रूप में और एक उपकरण के रूप में उपयोग करते हैं। लेकिन जब लोग इस तरह का उत्पाद खरीदते हैं, तो वे मुख्य रूप से सॉफ्टवेयर ही चाहते हैं। वे ऐसे उपकरण चाहते हैं जो AI की निगरानी कर सकें, जो AI की हर बातचीत के विवरण में गहराई से जा सकें, जो प्रतिक्रिया दे सकें, जो लगातार सिस्टम का निर्माण और समायोजन कर सकें।

तो यही हमारे सॉफ़्टवेयर का मूल है। एजेंट सिस्टम के साथ भी, लोगों को यह समस्या है कि डेमो करना तो अच्छा है, लेकिन अगर आप इसे उत्पादन के लिए तैयार और वास्तव में ग्राहक-उन्मुख बनाना चाहते हैं, तो आपको बहुत सी पुरानी समस्याओं को हल करना होगा, जैसे कि "भ्रम" की घटना को रोकना और उन बुरे लोगों से निपटना जो तबाही मचाने की कोशिश करते हैं। हमें यह भी सुनिश्चित करना होगा कि विलंबता काफी कम हो, टोन उचित हो, इत्यादि।

हमने बहुत सी टीमों से बात की, और उन्होंने कुछ प्रयोग किए, एक प्रारंभिक संस्करण बनाया, और फिर उन्हें एहसास हुआ, "ओह, वास्तव में, हम उन लोगों में से नहीं बनना चाहते हैं जो बाद के चरणों में इन विवरणों का निर्माण करते रहें।" वे उन लोगों में से भी नहीं बनना चाहते थे जो ग्राहक सेवा टीम में नए तर्क जोड़ते रहें। इसलिए इस बिंदु पर, दूसरों के साथ सहयोग करना अधिक उचित लगता है।

किम्बर्ली टैन: आपने कुछ दीर्घकालिक मुद्दों का उल्लेख किया, जैसे बुरे लोगों से निपटने की आवश्यकता आदि।मेरा मानना है कि AI Agent का उपयोग करने पर विचार करने वाले कई श्रोता LLM की शुरूआत के बाद उत्पन्न होने वाले नए सुरक्षा हमले पथों या Agent सिस्टम की शुरूआत के बाद उत्पन्न होने वाले नए सुरक्षा जोखिमों के बारे में चिंतित हैं। आप इन मुद्दों के बारे में क्या सोचते हैं? और जब आप किसी समस्या से निपट रहे हों तो शीर्ष-स्तरीय एंटरप्राइज़ सुरक्षा सुनिश्चित करने के लिए सर्वोत्तम अभ्यास क्या हैं? प्रतिनिधि?

जेसी झांग: सुरक्षा के संदर्भ में, कुछ स्पष्ट उपाय हैं जो किए जा सकते हैं, जिनका मैंने पहले उल्लेख किया था, जैसे कि सुरक्षात्मक उपायों की आवश्यकता। मुख्य मुद्दा यह है कि एलएलएम के बारे में लोगों की चिंता यह है कि वे नियतात्मक नहीं हैं।

लेकिन अच्छी खबर यह है कि आप वास्तव में अधिकांश संवेदनशील और जटिल संचालन को एक नियतात्मक दीवार के पीछे रख सकते हैं, और जब यह API को कॉल करता है तो गणना वहीं होती है। इसलिए आप इसे संभालने के लिए पूरी तरह से LLM पर निर्भर नहीं रहते हैं, और इससे बहुत सी मुख्य समस्याओं से बचा जा सकता है।

लेकिन अभी भी ऐसी परिस्थितियाँ हैं जहाँ, उदाहरण के लिए, कोई बुरा अभिनेता हस्तक्षेप करता है या कोई व्यक्ति सिस्टम को भ्रमित करने की कोशिश करता है। हमने देखा है कि हमारे साथ काम करने वाले कई प्रमुख ग्राहकों में, उनकी सुरक्षा टीमें हमारे उत्पादों पर "रेड टीम" परीक्षण करती हैं और कमज़ोरियों को खोजने की कोशिश करने के लिए सिस्टम पर लगातार कई संभावित हमले करती हैं। जैसे-जैसे AI एजेंट अधिक से अधिक लोकप्रिय होता जा रहा है, हम इसे अधिक से अधिक बार होते हुए देख सकते हैं, क्योंकि यह यह जांचने का सबसे अच्छा तरीका है कि कोई सिस्टम प्रभावी है या नहीं। यह रेड टीम परीक्षण के माध्यम से उस पर कुछ फेंकना है और देखना है कि क्या यह सुरक्षा को भेद सकता है।

ऐसे स्टार्टअप भी हैं जो रेड टीम टूल विकसित कर रहे हैं या लोगों को इस तरह के परीक्षण खुद करने में सक्षम बना रहे हैं, जो कि एक ऐसा चलन है जिसे हम अभी देख रहे हैं। हम जिन कंपनियों के साथ काम करते हैं, उनमें से बहुत सी बिक्री चक्र के बाद के चरण में, अपनी सुरक्षा टीम बनाती हैं, या बाहरी टीम के साथ मिलकर सिस्टम का तनाव परीक्षण करती हैं। हमारे लिए, इस तरह के परीक्षणों को पास करने में सक्षम होना बहुत ज़रूरी है। तो, आखिरकार, यही बात मायने रखती है।

डेरिक हैरिस: क्या आप अपने ग्राहकों को ऐसा करने के लिए प्रोत्साहित करते हैं? क्योंकि जब हम AI नीतियों के बारे में बात करते हैं, तो हम एक महत्वपूर्ण पहलू का उल्लेख करते हैं, जो कि एप्लीकेशन लेयर है, और हम इस पर जोर देते हैं कि the एलएलएम के उपयोगकर्ताओं और एप्लिकेशन चलाने वाले लोगों पर जिम्मेदारी डालनी चाहिए, न कि केवल मॉडल को ही दोष देना चाहिए। कहने का तात्पर्य यह है कि ग्राहकों को रेड टीम परीक्षण करना चाहिए, विशिष्ट उपयोग के मामलों और हमले के रास्तों की पहचान करनी चाहिए, और यह निर्धारित करना चाहिए कि किन कमजोरियों से सुरक्षा की आवश्यकता है, न कि केवल ओपनएआई या अन्य कंपनियों द्वारा पहले से स्थापित सुरक्षा सुरक्षा पर निर्भर रहना चाहिए।

जेसी झांग: मैं पूरी तरह से सहमत हूँ। मुझे यह भी लगता है कि अधिसूचना आवश्यकताओं की एक नई लहर उभर सकती है, जो SOC 2 प्रमाणन और HIPAA प्रमाणन के समान है जो अब हर कोई कर रहा है, जो विभिन्न उद्योगों में आवश्यक हैं। आम तौर पर, जब आप एक सामान्य SaaS उत्पाद बेचते हैं, तो ग्राहकों को पैठ परीक्षण की आवश्यकता होगी, और हमें अपनी पैठ परीक्षण रिपोर्ट भी प्रदान करनी होगी। AI एजेंट के लिए, भविष्य में समान आवश्यकताएं हो सकती हैं, और कोई इसका नाम ले सकता है, लेकिन यह मूल रूप से यह जांचने का एक नया तरीका है कि क्या एजेंट सिस्टम पर्याप्त शक्तिशाली है।

किम्बर्ली टैन: एक बात जो दिलचस्प है वह यह है कि जाहिर तौर पर हर कोई नए मॉडल की सफलताओं और तकनीकी सफलताओं को लेकर बहुत उत्साहित है जो सभी बड़ी प्रयोगशालाओं द्वारा पेश की जा रही हैं। एक एआई कंपनी के रूप में, आप स्पष्ट रूप से अपना खुद का शोध नहीं करते हैं, लेकिन आप उस शोध का लाभ उठाते हैं और अंतिम ग्राहक तक पहुंचाने के लिए उसके इर्द-गिर्द बहुत सारे सॉफ़्टवेयर बनाते हैं।

लेकिन आपका काम तेज़ी से बदलती तकनीक पर आधारित है। मैं उत्सुक हूँ, एक एप्लाइड एआई कंपनी के रूप में, आप नए तकनीकी परिवर्तनों के साथ कैसे तालमेल बिठाते हैं और समझते हैं कि वे कंपनी को कैसे प्रभावित करते हैं, जबकि आप अपने खुद के उत्पाद रोडमैप की भविष्यवाणी करने और उपयोगकर्ता की ज़रूरतों को पूरा करने में सक्षम हैं? अधिक व्यापक रूप से, एप्लाइड एआई कंपनियों को समान परिस्थितियों में क्या रणनीति अपनानी चाहिए?

जेसी झांग: आप वास्तव में पूरे स्टैक को अलग-अलग भागों में विभाजित कर सकते हैं। उदाहरण के लिए, यदि आप एप्लिकेशन लेयर को देखें तो LLM सबसे नीचे है। आपके पास बीच में कुछ उपकरण हो सकते हैं जो आपको LLM को प्रबंधित करने या कुछ मूल्यांकन और इस तरह की चीजें करने में मदद करते हैं। फिर, शीर्ष भाग मूल रूप से वह है जो हमने बनाया है, जो वास्तव में एक मानक SaaS की तरह है।

इसलिए, हमारा ज़्यादातर काम वास्तव में नियमित सॉफ़्टवेयर से अलग नहीं है, सिवाय इसके कि हमारे पास एक अतिरिक्त शोध घटक है - LLM बहुत तेज़ी से बदलता है। हमें शोध करने की ज़रूरत है कि वे क्या कर सकते हैं, वे किसमें अच्छे हैं, और किसी निश्चित कार्य को करने के लिए किस मॉडल का उपयोग किया जाना चाहिए। यह एक बड़ा मुद्दा है क्योंकि ओपनएआई और एंथ्रोपिक दोनों नई तकनीकें लॉन्च कर रहे हैं, और जेमिनी भी धीरे-धीरे सुधार कर रही है।

इसलिए, आपको यह समझने के लिए अपना खुद का मूल्यांकन तंत्र बनाना होगा कि कौन सा मॉडल किस स्थिति में उपयोग के लिए उपयुक्त है। कभी-कभी आपको फाइन-ट्यूनिंग की भी आवश्यकता होती है, लेकिन सवाल यह है कि फाइन-ट्यूनिंग कब करनी है? फाइन-ट्यूनिंग कब उपयोगी होती है? ये शायद एलएलएम से संबंधित मुख्य शोध मुद्दे हैं जिन पर हम ध्यान केंद्रित कर रहे हैं। लेकिन कम से कम अब तक, हमें ऐसा नहीं लगता कि SaaS तेज़ी से बदल रहा है, क्योंकि हम मध्य परत पर निर्भर नहीं हैं। तो मूल रूप से, यह एलएलएम है जो बदल रहा है। वे बहुत बार नहीं बदलते हैं, और जब वे बदलते हैं, तो यह आमतौर पर एक अपग्रेड होता है। उदाहरण के लिए, क्लाउड 3.5 सॉनेट को कुछ महीने पहले अपडेट किया गया था, और उस समय हमने सोचा, "ठीक है, क्या हमें पुराने मॉडल का उपयोग जारी रखने के बजाय नए मॉडल पर स्विच करना चाहिए?"

हमें बस मूल्यांकन की एक श्रृंखला चलाने की आवश्यकता है, और एक बार जब हम नए मॉडल पर स्विच कर लेते हैं, तो हम इसके बारे में और नहीं सोचते क्योंकि आप पहले से ही नए मॉडल का उपयोग कर रहे हैं। फिर, o1 संस्करण सामने आया, और स्थिति समान थी। इस बारे में सोचें कि इसका उपयोग कहाँ किया जा सकता है। हमारे मामले में, o1 अधिकांश ग्राहक-सामने वाले उपयोग मामलों के लिए थोड़ा धीमा है, इसलिए हम इसे कुछ पृष्ठभूमि कार्य के लिए उपयोग कर सकते हैं। अंततः, हमें मॉडल अनुसंधान के लिए बस एक अच्छी प्रणाली की आवश्यकता है।

किम्बर्ली टैन: आप कितनी बार किसी नये मॉडल का मूल्यांकन करते हैं और यह निर्णय लेते हैं कि उसे बदलना है या नहीं?

जेसी झांग: हम हर बार जब कोई नया मॉडल आता है, तो उसका मूल्यांकन करते हैं। आपको यह सुनिश्चित करना होगा कि भले ही नया मॉडल ज़्यादा स्मार्ट हो, लेकिन यह आपके द्वारा पहले से बनाए गए कुछ उपयोग मामलों को बाधित न करे। ऐसा हो सकता है। उदाहरण के लिए, नया मॉडल कुल मिलाकर ज़्यादा स्मार्ट हो सकता है, लेकिन कुछ चरम मामलों में, यह आपके वर्कफ़्लो में से किसी एक में A/B विकल्प पर खराब प्रदर्शन करता है। हम इसी के लिए मूल्यांकन करते हैं।

मुझे लगता है कि कुल मिलाकर, जिस तरह की बुद्धिमत्ता की हम सबसे ज़्यादा परवाह करते हैं, उसे मैं "निर्देशों का पालन करने की क्षमता" कहूंगा। हम चाहते हैं कि मॉडल निर्देशों का पालन करने में और बेहतर होता जाए। अगर ऐसा है, तो यह निश्चित रूप से हमारे लिए फ़ायदेमंद है, और यह बहुत अच्छी बात है।

ऐसा लगता है कि हाल के शोध में बुद्धि के उस प्रकार पर अधिक ध्यान केंद्रित किया गया है जिसमें तर्क करना शामिल है, जैसे कि बेहतर प्रोग्रामिंग और बेहतर गणितीय संचालन। इससे भी हमें मदद मिलती है, लेकिन यह निर्देश पालन क्षमता में सुधार जितना महत्वपूर्ण नहीं है।

किम्बर्ली टैन: आपने जो एक बहुत ही दिलचस्प बात कही है, और मुझे लगता है कि यह डेकागन के लिए बहुत ही अनोखी बात है, वह यह कि आपने अपने यहां बहुत सारे मूल्यांकन ढांचे का निर्माण किया है, ताकि आप यह सुनिश्चित कर सकें कि आपके द्वारा दिए गए परीक्षणों के तहत प्रत्येक मॉडल कैसा प्रदर्शन कर रहा है।

क्या आप इस पर विस्तार से बता सकते हैं? यह इन-हाउस मूल्यांकन ढांचा कितना महत्वपूर्ण है, और विशेष रूप से यह आपको और आपके ग्राहकों को एजेंट के प्रदर्शन में कैसे विश्वास दिलाता है? क्योंकि इनमें से कुछ मूल्यांकन ग्राहक-सामने भी होते हैं।

जेसी झांग: मैं समझता हूं कि यह बहुत महत्वपूर्ण है, क्योंकि इस मूल्यांकन अवसंरचना के बिना, हमारे लिए शीघ्रता से पुनरावृत्ति करना बहुत कठिन होगा।

अगर आपको लगता है कि हर बदलाव से कुछ टूटने की संभावना ज़्यादा होती है, तो आप जल्दी से बदलाव नहीं करेंगे। लेकिन अगर आपके पास मूल्यांकन तंत्र है, तो जब कोई बड़ा बदलाव होता है, मॉडल अपडेट होता है, या कुछ नया आता है, तो आप सीधे सभी मूल्यांकन परीक्षणों से इसकी तुलना कर सकते हैं। अगर मूल्यांकन के नतीजे अच्छे हैं, तो आप महसूस कर सकते हैं: ठीक है, हमने सुधार किया है, या आप इसे बिना ज़्यादा चिंता किए आत्मविश्वास के साथ जारी कर सकते हैं।

तो, हमारे क्षेत्र में, मूल्यांकन के लिए ग्राहक से इनपुट की आवश्यकता होती है, क्योंकि ग्राहक ही निर्णय लेता है कि कोई चीज सही है या नहीं। बेशक, हम कुछ उच्च-स्तरीय मुद्दों की जांच कर सकते हैं, लेकिन आमतौर पर ग्राहक विशिष्ट उपयोग के मामले प्रदान करता है और हमें बताता है कि सही उत्तर क्या है, या यह क्या होना चाहिए, इसे किस लहजे में रखना चाहिए, इसे क्या कहना चाहिए।

मूल्यांकन इसी पर आधारित है। इसलिए हमें यह सुनिश्चित करना होगा कि हमारा मूल्यांकन सिस्टम पर्याप्त रूप से मजबूत हो। शुरुआत में, हमने इसे खुद बनाया था, और इसे बनाए रखना इतना मुश्किल नहीं है। हम यह भी जानते हैं कि कुछ मूल्यांकन कंपनियाँ हैं, और हमने उनमें से कुछ का पता लगाया है। हो सकता है कि किसी समय, हम इस पर विचार करें कि उन्हें अपनाना है या नहीं, लेकिन अभी के लिए, मूल्यांकन प्रणाली अब हमारे लिए कोई समस्या नहीं है।

किम्बर्ली टैन: आज एक बहुत लोकप्रिय विषय मल्टीमोडैलिटी है, जिसका अर्थ है कि एआई एजेंट उन सभी रूपों में बातचीत करने में सक्षम होना चाहिए जिनका उपयोग आज मनुष्य करते हैं, चाहे वह टेक्स्ट, वीडियो, आवाज़ आदि हो। मुझे पता है कि डेकागन की शुरुआत टेक्स्ट-आधारित के रूप में हुई थी। आपके दृष्टिकोण से, यह कितना महत्वपूर्ण है बहुविधता है एआई एजेंटों के लिए? आपको क्या लगता है कि इसके मुख्यधारा या यहां तक कि एक मानक बनने के लिए समय सीमा क्या है?

जेसी झांग: यह महत्वपूर्ण है, और कंपनी के दृष्टिकोण से, एक नई पद्धति जोड़ना विशेष रूप से कठिन नहीं है। यह सरल नहीं है, लेकिन मूल बात यह है: यदि आप अन्य समस्याओं को हल करते हैं, जैसे कि मैंने उल्लेख किया है - उदाहरण के लिए, AI का निर्माण करना, इसकी निगरानी करना और सही तर्क रखना - तो एक नई पद्धति जोड़ना सबसे कठिन काम नहीं है। इसलिए हमारे लिए, सभी पद्धतियों का होना बहुत मायने रखता है, और यह हमारे बाजार का विस्तार करता है। हम मूल रूप से पद्धति से अनभिज्ञ हैं, और हम प्रत्येक पद्धति के लिए अपना खुद का एजेंट बनाते हैं।

सामान्यतः कहें तो, दो सीमित कारक हैं: सबसे पहले, क्या ग्राहक नई पद्धति अपनाने के लिए तैयार है? मुझे लगता है कि टेक्स्ट से शुरुआत करना बहुत समझदारी भरा है, क्योंकि यही वह तरीका है जिसे लोग सबसे ज़्यादा सक्रियता से अपनाते हैं, और यह उनके लिए कम जोखिम भरा है, निगरानी करना आसान है, और समझना आसान है। दूसरी बड़ी पद्धति आवाज़ है। जाहिर है, मुझे लगता है कि बाज़ार में अभी भी जगह है, और आवाज़ की उपयोगकर्ता स्वीकृति में अभी भी सुधार की ज़रूरत है। फिलहाल, हम कुछ शुरुआती अपनाने वालों को देख रहे हैं जिन्होंने वॉयस एजेंट को अपनाना शुरू कर दिया है, जो बहुत ही रोमांचक है। दूसरा पहलू तकनीकी चुनौतियाँ हैं। ज़्यादातर लोग इस बात से सहमत होंगे कि वॉयस के लिए बार ज़्यादा ऊंचे हैं। अगर आप फ़ोन पर किसी से बात कर रहे हैं, तो आपको बहुत कम वॉयस लेटेंसी की ज़रूरत है। अगर आप किसी को बीच में रोकते हैं, तो उन्हें स्वाभाविक रूप से जवाब देने की ज़रूरत होती है।

क्योंकि भाषण की विलंबता कम है, इसलिए आपको गणना करने के तरीके में अधिक चतुर होना चाहिए। यदि आप चैट में हैं और प्रतिक्रिया समय पाँच से आठ सेकंड है, तो आप शायद ही इसे नोटिस करते हैं और यह बहुत स्वाभाविक लगता है। लेकिन अगर फोन पर प्रतिक्रिया देने में पाँच से आठ सेकंड लगते हैं, तो यह थोड़ा अस्वाभाविक लगता है। इसलिए भाषण के साथ अधिक तकनीकी चुनौतियाँ हैं। जैसे-जैसे ये तकनीकी चुनौतियाँ हल होती हैं और बाज़ार में भाषण को अपनाने में रुचि बढ़ती है, भाषण एक नई विधा के रूप में मुख्यधारा बन जाएगा।

एक ऐसा बिज़नेस मॉडल जो भरोसे से ऊपर है

किम्बर्ली टैन: आगे बढ़ने से पहले, मैं एआई एजेंट बिजनेस मॉडल के बारे में थोड़ी और बात करना चाहूंगी। जब आप पहली बार बनाना एआई एजेंट के साथ बातचीत की या ग्राहकों के साथ उनके द्वारा इस्तेमाल की जाने वाली प्रणाली, उनके द्वारा प्रोसेस किए जाने वाले डेटा और उनकी चिंताओं पर चर्चा की, क्या कोई ऐसी बात थी जिसने आपको आश्चर्यचकित किया? डेकागन को एंटरप्राइज़ ग्राहकों को बेहतर सेवा देने के लिए क्या-क्या गैर-सहज या आश्चर्यजनक चीजें करनी पड़ीं?

जेसी झांग: मुझे लगता है कि सबसे आश्चर्यजनक बात यह थी कि जब हमने पहली बार काम शुरू किया था, तो लोग हमसे बात करने के लिए कितने इच्छुक थे। आखिरकार, हम केवल दो ही थे। हम दोनों ने पहले भी कंपनियाँ शुरू की थीं, इसलिए हम बहुत से लोगों को जानते थे, लेकिन फिर भी, हर उद्यमी के लिए, जब आप किसी से बात करना चाहते हैं, तो अगर आप जो कह रहे हैं वह विशेष रूप से आकर्षक नहीं है, तो बातचीत आमतौर पर बहुत ही नीरस होती है।

लेकिन जब हमने इस उपयोग के मामले के बारे में बात करना शुरू किया, तो मुझे वास्तव में यह देखकर आश्चर्य हुआ कि लोग इसके बारे में बात करने के लिए कितने उत्साहित थे। क्योंकि यह विचार बहुत स्पष्ट लगता है। आप सोच सकते हैं कि चूंकि यह इतना स्पष्ट विचार है, इसलिए किसी और ने इसे पहले ही कर लिया होगा, या पहले से ही इसका कोई समाधान होना चाहिए, या किसी और ने पहले ही किसी तरह का समाधान निकाल लिया होगा। लेकिन मुझे लगता है कि हमने एक अच्छा पल पकड़ा है, वह उपयोग का मामला वास्तव में बड़ा है और लोग वास्तव में इसकी परवाह करते हैं। जैसा कि मैंने पहले उल्लेख किया है, वह उपयोग का मामला AI एजेंट को लेने और इसे उत्पादन में धकेलने के लिए वास्तव में उपयुक्त है, क्योंकि आप इसे क्रमिक रूप से लागू कर सकते हैं और ROI को ट्रैक करने में सक्षम हो सकते हैं।

यह मेरे लिए एक सुखद आश्चर्य था, लेकिन जाहिर है कि इसके बाद बहुत काम करना है, आपको ग्राहकों के साथ काम करना है, आपको उत्पाद बनाना है, आपको यह पता लगाना है कि किस रास्ते पर जाना है। शुरुआती चरण में, यह वास्तव में एक आश्चर्यजनक खोज थी।

डेरिक हैरिस: किम्बर्ली, मुझे लगता है कि मुझे आपके द्वारा लिखे गए ब्लॉग पोस्ट, RIP से RPA का उल्लेख करना चाहिए, जिसमें बहुत सी बातों पर चर्चा की गई है। the स्वचालन कार्य और स्टार्टअप।क्या आपको लगता है कि ऐसी कोई स्थिति है जिसमें ये स्वचालित कार्य या समाधान इतने आदर्श नहीं हैं, इसलिए लोग हमेशा बेहतर तरीके की तलाश में रहते हैं?

किम्बर्ली टैन: हां, मुझे ऐसा लगता है। मैं कुछ बातें कहना चाहूंगा। सबसे पहले, अगर कोई विचार सभी के लिए स्पष्ट है, लेकिन इसे हल करने के लिए कोई स्पष्ट कंपनी नहीं है, या कोई भी कंपनी की ओर इशारा करके यह नहीं कह रहा है, "आपको इसका उपयोग करना चाहिए," तो इसका मतलब है कि समस्या वास्तव में हल नहीं हुई है।

एक तरह से, यह किसी कंपनी के लिए समाधान विकसित करने का एक पूरी तरह से खुला अवसर है। क्योंकि, जैसा कि आपने कहा, हम शुरू से ही एक निवेशक के रूप में डेकागन का अनुसरण कर रहे हैं। हमने उन्हें रचनात्मक भूलभुलैया में नेविगेट करते देखा है, और जब उन्होंने इस दिशा में जाने का फैसला किया और ग्राहकों से बात करना शुरू किया, तो यह स्पष्ट हो गया कि सभी ग्राहक किसी तरह के मूल AI-सक्षम समाधान के लिए बेताब थे। यह उन समस्याओं में से एक है जिसका मैंने पहले उल्लेख किया था, जहाँ कई लोग सोचते हैं कि यह सिर्फ़ GPT आवरण है। लेकिन डेकागन को शुरू से ही ग्राहकों की जो दिलचस्पी मिली है, उसने हमें जल्दी ही एहसास करा दिया है कि इनमें से कई मुद्दे लोगों की अपेक्षा से कहीं ज़्यादा जटिल हैं।

मुझे लगता है कि यह घटना सभी उद्योगों में हो रही है, चाहे वह ग्राहक सेवा हो या कुछ क्षेत्रों में पेशेवर स्वचालन। मुझे लगता है कि कम आंके गए बिंदुओं में से एक, जैसा कि जेसी ने पहले उल्लेख किया है, कार्यों को स्वचालित करने के निवेश पर रिटर्न (आरओआई) को स्पष्ट रूप से मापने में सक्षम होना है। क्योंकि, यदि आप किसी को एआई एजेंट को स्वीकार करने के लिए कह रहे हैं, तो वे वास्तव में "विश्वास की छलांग" लगा रहे हैं, क्योंकि यह बहुत से लोगों के लिए एक बहुत ही अपरिचित क्षेत्र है।

यदि आप किसी विशेष प्रक्रिया को स्वचालित कर सकते हैं, जो या तो स्पष्ट रूप से राजस्व उत्पन्न करने वाली प्रक्रिया है, या ऐसी प्रक्रिया है जो पहले व्यवसाय में बाधा उत्पन्न करती थी, या एक प्रमुख लागत केंद्र है जो ग्राहक वृद्धि या राजस्व वृद्धि के साथ रैखिक रूप से बढ़ता है, तो एआई एजेंट के लिए स्वीकृति प्राप्त करना आसान हो जाएगा। ऐसी समस्याओं को अधिक उत्पादित प्रक्रिया में बदलने की क्षमता, जिसे पारंपरिक सॉफ्टवेयर की तरह बढ़ाया जा सके, बहुत आकर्षक है।

किम्बर्ली टैन: आगे बढ़ने से पहले मेरा एक आखिरी सवाल है। मुझे याद है कि जेसी, हमारी पिछली चर्चाओं में, हमेशा कहते थे कि सॉफ्टवेयर या एआई एजेंट अपनाने वाली कंपनियों के लिए सबसे बड़ी चुनौती मतिभ्रम होगी। लेकिन आपने एक बार मुझसे कहा था कि यह वास्तव में मुख्य समस्या नहीं है। क्या आप विस्तार से बता सकते हैं कि मतिभ्रम की धारणा कुछ हद तक भ्रामक क्यों है और लोग वास्तव में किस बारे में अधिक चिंतित हैं?

जेसी झांग: मुझे लगता है कि लोग मतिभ्रम के बारे में परवाह करते हैं, लेकिन वे इससे मिलने वाले मूल्य के बारे में अधिक चिंतित हैं। हम जिन कंपनियों के साथ काम करते हैं, उनमें से लगभग सभी एक ही मुद्दे पर ध्यान केंद्रित करती हैं, लगभग एक जैसे: आप कितने प्रतिशत बातचीत को हल कर सकते हैं? मेरे ग्राहक कितने संतुष्ट हैं? फिर मतिभ्रम के मुद्दे को तीसरी श्रेणी में वर्गीकृत किया जा सकता है, यानी यह कितना सटीक है। आम तौर पर, मूल्यांकन करते समय पहले दो कारक अधिक महत्वपूर्ण होते हैं।

मान लीजिए कि आप किसी नए व्यवसाय से बात कर रहे हैं और आपने पहले दो कारकों पर वास्तव में अच्छा काम किया है, और आपको नेतृत्व और टीम के सभी लोगों से बहुत समर्थन मिला है। वे कहते हैं, "हे भगवान, हमारा ग्राहक अनुभव अलग है। अब हर ग्राहक के पास अपना निजी सहायक है जो हमसे किसी भी समय संपर्क कर सकता है। हमने उन्हें बेहतरीन जवाब दिए हैं, वे बहुत संतुष्ट हैं, और यह बहुभाषी है और 24/7 उपलब्ध है।" यह इसका एक हिस्सा है, और आपने बहुत सारा पैसा भी बचाया है।

इसलिए एक बार जब आप उन लक्ष्यों को प्राप्त कर लेते हैं, तो आपको काम को आगे बढ़ाने के लिए बहुत सारा समर्थन और बहुत सारी अनुकूलता मिलती है। बेशक, भ्रम की समस्या को अंततः हल करने की आवश्यकता है, लेकिन यह वह चीज़ नहीं है जिसके बारे में वे सबसे अधिक चिंतित हैं। भ्रम को हल करने का तरीका वही है जिसका मैंने पहले उल्लेख किया था - लोग आपका परीक्षण करेंगे। एक प्रमाण-अवधारणा चरण हो सकता है जहाँ आप वास्तव में वास्तविक बातचीत करते हैं और उनके पास टीम के सदस्य निगरानी करते हैं और सटीकता की जाँच करते हैं। यदि यह ठीक से चलता है, तो आमतौर पर यह पूरा हो जाता है।

साथ ही, जैसा कि मैंने पहले बताया, आप संवेदनशील जानकारी के लिए कुछ सख्त सुरक्षा उपाय निर्धारित कर सकते हैं, जैसे कि आपको संवेदनशील सामग्री को सामान्य बनाने की आवश्यकता नहीं है। इसलिए भ्रम का मुद्दा अधिकांश लेन-देन में चर्चा का विषय है। यह कोई महत्वहीन विषय नहीं है। आप इस प्रक्रिया से गुजरेंगे, लेकिन यह कभी भी बातचीत का केंद्र नहीं होगा।

किम्बर्ली टैन: अब एआई एजेंट के बिजनेस मॉडल पर चलते हैं। आज, इन एआई एजेंट की कीमत कैसे तय की जाए, इस बारे में एक बड़ा विषय है।

ऐतिहासिक रूप से, कई SaaS सॉफ़्टवेयर की कीमत सीटों की संख्या के हिसाब से तय की जाती है क्योंकि वे वर्कफ़्लो सॉफ़्टवेयर होते हैं जो व्यक्तिगत कर्मचारियों को लक्षित करते हैं और कर्मचारी उत्पादकता में सुधार करने के लिए उपयोग किए जाते हैं। हालाँकि, AI एजेंट पारंपरिक सॉफ़्टवेयर की तरह व्यक्तिगत कर्मचारियों की उत्पादकता से जुड़ा नहीं है।

बहुत से लोगों को लगता है कि सीटों की संख्या के आधार पर मूल्य निर्धारण पद्धति अब लागू नहीं हो सकती। मैं इस बारे में उत्सुक हूँ कैसे आपने शुरुआती दिनों में इस दुविधा के बारे में सोचा और आखिरकार आपने डेकागन की कीमत कैसे तय की। साथ ही, आपको क्या लगता है कि AI एजेंट के ज़्यादा से ज़्यादा आम हो जाने के बाद सॉफ़्टवेयर की कीमत का भविष्य का रुझान क्या होगा?

जेसी झांग: इस मुद्दे पर हमारा दृष्टिकोण यह है कि अतीत में, सॉफ्टवेयर की कीमत प्रति सीट के हिसाब से तय होती थी, क्योंकि इसका पैमाना मोटे तौर पर उन लोगों की संख्या पर आधारित होता था जो सॉफ्टवेयर का उपयोग कर सकते थे। लेकिन अधिकांश AI एजेंटों के लिए, आपके द्वारा प्रदान किया जाने वाला मूल्य इसे बनाए रखने वाले लोगों की संख्या पर निर्भर नहीं करता है, बल्कि उत्पादित कार्य की मात्रा पर निर्भर करता है। यह उस बिंदु के अनुरूप है जिसका मैंने पहले उल्लेख किया था: यदि निवेश पर प्रतिफल (ROI) बहुत मापने योग्य है, तो कार्य उत्पादन का स्तर भी बहुत स्पष्ट है।

हमारा मानना है कि सीटों की संख्या के आधार पर कीमत तय करना निश्चित रूप से लागू नहीं होता। आप काम के आउटपुट के आधार पर कीमत तय कर सकते हैं। इसलिए, आपके द्वारा पेश किया जाने वाला मूल्य निर्धारण मॉडल यह होना चाहिए कि जितना ज़्यादा काम होगा, उतना ज़्यादा भुगतान करें।

हमारे लिए, मूल्य निर्धारण के दो स्पष्ट तरीके हैं। आप या तो बातचीत का मूल्य निर्धारण कर सकते हैं, या आप उन बातचीत का मूल्य निर्धारण कर सकते हैं जिन्हें AI वास्तव में हल करता है। मुझे लगता है कि हमने जो दिलचस्प सबक सीखा है, उनमें से एक यह है कि अधिकांश लोगों ने बातचीत-मूल्य निर्धारण मॉडल को चुना। इसका कारण यह है कि समाधान के आधार पर मूल्य निर्धारण का मुख्य लाभ यह है कि आप उसी के लिए भुगतान करते हैं the एआई करता है।

लेकिन अब सवाल यह है कि "समाधान" किसे माना जाए? सबसे पहले, कोई भी इस पर गहराई से नहीं जाना चाहता, क्योंकि यह ऐसा हो जाता है, "अगर कोई गुस्से में आता है और आप उसे वापस भेज देते हैं, तो हम उसके लिए भुगतान क्यों करें?"

इससे एक अजीब स्थिति पैदा होती है और एआई प्रदाताओं के लिए प्रोत्साहन भी थोड़ा अजीब हो जाता है, क्योंकि समाधान के आधार पर बिलिंग का मतलब है, "हमें बस यथासंभव अधिक से अधिक बातचीत को हल करना है और कुछ लोगों को दूर करना है।" लेकिन ऐसे कई मामले हैं जहाँ समस्या को दूर धकेलने के बजाय उसे आगे बढ़ाना बेहतर होता है, और ग्राहक इस तरह से निपटना पसंद नहीं करते हैं। इसलिए, बातचीत के आधार पर बिलिंग से अधिक सरलता और पूर्वानुमानशीलता आएगी।

किम्बर्ली टैन: आपके विचार से भविष्य का मूल्य निर्धारण मॉडल कितने समय तक चलेगा?क्योंकि अभी जब आप ROI का उल्लेख करते हैं, तो यह आमतौर पर पिछले खर्च पर आधारित होता है जिसका उपयोग श्रम लागतों को कवर करने के लिए किया जा सकता है। जैसे-जैसे AI एजेंट अधिक आम होते जा रहे हैं, क्या आपको लगता है कि दीर्घावधि में, AI की तुलना श्रम लागतों से की जाएगी और यह एक उपयुक्त बेंचमार्क है? यदि नहीं, तो आप श्रम लागतों से परे दीर्घावधि मूल्य निर्धारण को कैसे देखते हैं?

जेसी झांग: मुझे लगता है कि दीर्घावधि में, एआई एजेंट का मूल्य निर्धारण अभी भी मुख्य रूप से श्रम लागत से जुड़ा हो सकता है, क्योंकि एजेंट की यही खूबसूरती है - सेवाओं पर आपका पिछला खर्च अब सॉफ्टवेयर पर स्थानांतरित किया जा सकता है।

व्यय का यह हिस्सा सॉफ्टवेयर व्यय का 10 से 100 गुना हो सकता है, इसलिए लागत का एक बड़ा हिस्सा सॉफ्टवेयर पर आ जाएगा। इसलिए, श्रम लागत स्वाभाविक रूप से एक बेंचमार्क बन जाएगी। हमारे ग्राहकों के लिए, ROI बहुत स्पष्ट है। यदि आप श्रम लागत में X मिलियन की बचत कर सकते हैं, तो इस समाधान को अपनाना समझदारी है। लेकिन लंबे समय में, यह बीच का रास्ता हो सकता है।

क्योंकि कुछ उत्पाद जो हमारे एजेंट जितने अच्छे नहीं हैं, वे भी कम कीमत पर स्वीकार करेंगे। यह क्लासिक SaaS स्थिति की तरह है, जहाँ हर कोई बाजार हिस्सेदारी के लिए प्रतिस्पर्धा कर रहा है।

किम्बर्ली टैन: आपके विचार में वर्तमान SaaS कम्पनियों का भविष्य क्या होगा, विशेषकर उन कम्पनियों का जिनके उत्पाद मूलतः AI के लिए नहीं बनाए गए हैं या जिनकी कीमत प्रति सीट के हिसाब से है और इसलिए वे परिणाम-उन्मुख मूल्य निर्धारण मॉडल के अनुकूल नहीं हो सकती हैं?

जेसी झांग: कुछ पारंपरिक कंपनियों के लिए, यह वास्तव में थोड़ा मुश्किल है अगर वे एक एआई एजेंट उत्पाद लॉन्च करने की कोशिश करते हैं क्योंकि वे सीट मॉडल का उपयोग करके इसकी कीमत नहीं तय कर सकते हैं। यदि आपको अब उतने एजेंटों की आवश्यकता नहीं है, तो मौजूदा उत्पाद के साथ राजस्व बनाए रखना मुश्किल है। यह पारंपरिक कंपनियों के लिए एक समस्या है, लेकिन यह कहना मुश्किल है। पारंपरिक कंपनियों को हमेशा वितरण चैनलों का लाभ होता है। भले ही उत्पाद नई कंपनी जितना अच्छा न हो, लोग केवल 80% गुणवत्ता वाले नए आपूर्तिकर्ता को स्वीकार करने के लिए प्रयास करने में अनिच्छुक होते हैं।

इसलिए, सबसे पहले, यदि आप हमारे जैसे स्टार्टअप हैं, तो आपको यह सुनिश्चित करना होगा कि आपका उत्पाद पारंपरिक उत्पाद से तीन गुना बेहतर हो। दूसरा, यह पारंपरिक कंपनियों और स्टार्टअप के बीच एक आम प्रतिस्पर्धा है। पारंपरिक कंपनियों में स्वाभाविक रूप से जोखिम सहन करने की क्षमता कम होती है क्योंकि उनके पास बड़ी संख्या में ग्राहक होते हैं। यदि वे तेजी से पुनरावृत्ति में कोई गलती करते हैं, तो इससे भारी नुकसान होगा। हालाँकि, स्टार्टअप तेजी से पुनरावृत्ति कर सकते हैं, इसलिए पुनरावृत्ति प्रक्रिया ही बेहतर उत्पाद की ओर ले जा सकती है। यह सामान्य चक्र है। हमारे लिए, हमें हमेशा अपनी डिलीवरी की गति, उत्पाद की गुणवत्ता और अपनी टीम के निष्पादन पर गर्व रहा है। यही कारण है कि हमने मौजूदा सौदा जीता है।

किम्बर्ली टैन: क्या आप कार्यस्थल में एआई के भविष्य के बारे में कुछ पूर्वानुमान लगा सकते हैं? उदाहरण के लिए, यह कर्मचारियों की ज़रूरतों या क्षमताओं को कैसे बदलेगा, या मानव कर्मचारी और एआई एजेंट कैसे बातचीत करेंगे?आपके विचार में एआई एजेंटों के अधिक व्यापक हो जाने के कारण कार्यस्थल पर कौन सी नई सर्वोत्तम प्रथाएं या मानदंड सामान्य हो जाएंगे?

जेसी झांग: पहला और सबसे महत्वपूर्ण परिवर्तन यह है कि हम आश्वस्त हैं कि भविष्य में, कर्मचारी कार्यस्थल पर एआई एजेंटों के निर्माण और प्रबंधन में बहुत अधिक समय व्यतीत करेंगे, जो एआई पर्यवेक्षकों की भूमिका के समान है। भले ही आपकी स्थिति आधिकारिक तौर पर "एआई पर्यवेक्षक" की न हो, लेकिन आप जो समय पहले अपना काम करने में बिताते थे, उसका एक बड़ा हिस्सा इन एजेंटों के प्रबंधन में लगेगा, क्योंकि एजेंट आपको बहुत लाभ दे सकते हैं।

हमने कई तैनाती में ऐसा देखा है, जहाँ लोग जो कभी टीम लीडर थे, अब AI की निगरानी में बहुत समय बिताते हैं, उदाहरण के लिए, यह सुनिश्चित करने के लिए कि इसमें कोई समस्या नहीं है या समायोजन करने के लिए। वे समग्र प्रदर्शन की निगरानी करते हैं ताकि यह देखा जा सके कि क्या ऐसे विशिष्ट क्षेत्र हैं जिन पर ध्यान देने की आवश्यकता है, क्या ज्ञान के आधार में कोई अंतराल है जो AI को बेहतर बनाने में मदद कर सकता है, और क्या AI उन अंतरालों को भर सकता है।

एजेंट के साथ काम करने से जो काम आता है, उससे यह आभास होता है कि भविष्य में, कर्मचारी AI एजेंट के साथ बातचीत करने में काफी समय बिताएंगे। यह हमारी कंपनी की एक मुख्य अवधारणा है, जैसा कि मैंने पहले बताया था। इसलिए, हमारा संपूर्ण उत्पाद लोगों को उपकरण, दृश्यीकरण, व्याख्या और नियंत्रण प्रदान करने पर आधारित है। मुझे लगता है कि एक साल के भीतर यह एक बहुत बड़ा चलन बन जाएगा।

किम्बर्ली टैन: यह बात बहुत सही है। आपको क्या लगता है कि भविष्य में एआई सुपरवाइजरों को किन क्षमताओं की आवश्यकता होगी? इस भूमिका के लिए क्या कौशल होना चाहिए?

जेसी झांग: इसके दो पहलू हैं। एक है अवलोकनीयता और व्याख्यात्मकता, यह समझने की क्षमता कि एआई क्या कर रहा है और यह कैसे निर्णय लेता है। दूसरा है निर्णय लेने की क्षमता, या निर्माण भाग, फीडबैक कैसे दिया जाए और नए तर्क कैसे बनाए जाएं। मैं सोचता हूं कि ये दोनों एक ही सिक्के के दो पहलू हैं।

किम्बर्ली टैन: आपके विचार में मध्यम या दीर्घावधि में कौन से कार्य एआई एजेंट की क्षमताओं से परे रहेंगे तथा उन्हें अभी भी मनुष्यों द्वारा ही सही ढंग से प्रबंधित और निष्पादित करने की आवश्यकता होगी?

जेसी झांग: मुझे लगता है कि यह मुख्य रूप से "पूर्णता" की आवश्यकता पर निर्भर करेगा जिसका मैंने पहले उल्लेख किया था। ऐसे कई कार्य हैं जिनमें त्रुटि के लिए बहुत कम सहनशीलता होती है। इन मामलों में, कोई भी AI टूल एक पूर्ण विकसित एजेंट की तुलना में अधिक सहायक होता है।

उदाहरण के लिए, कुछ अधिक संवेदनशील उद्योगों में, जैसे कि स्वास्थ्य सेवा या सुरक्षा, जहाँ आपको लगभग पूर्ण होना होता है, तो इन क्षेत्रों में, AI एजेंट कम स्वायत्त हो सकते हैं, लेकिन इसका मतलब यह नहीं है कि वे बेकार हैं। मुझे लगता है कि शैली अलग होगी, हमारे जैसे प्लेटफ़ॉर्म में, आप वास्तव में इन एजेंटों को तैनात कर रहे हैं ताकि वे पूरे काम को स्वचालित कर सकें।

डेरिक हैरिस: और इस एपिसोड के लिए बस इतना ही। अगर आपको यह विषय दिलचस्प या प्रेरणादायक लगा, तो कृपया हमारे पॉडकास्ट को रेटिंग दें और इसे ज़्यादा लोगों के साथ शेयर करें।हम उम्मीद करते हैं कि साल के अंत से पहले अंतिम एपिसोड रिलीज़ हो जाएगा और नए साल के लिए कंटेंट को फिर से तैयार किया जाएगा। सुनने के लिए धन्यवाद और छुट्टियों का मौसम अच्छा रहे (अगर आप छुट्टियों के दौरान सुन रहे हैं)।

मूल वीडियो: क्या अल एजेंट अंततः ग्राहक सहायता को ठीक कर सकते हैं?

इसी तरह की पोस्ट

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *