हाइलाइटहरू
- LLM हरूको जादू यो हो कि तिनीहरू धेरै लचिलो हुन्छन्, धेरै फरक परिस्थितिहरूमा अनुकूलन गर्न सक्छन्, र आधारभूत बुद्धिमत्ता राख्छन्।
- हामीलाई विश्वास छ कि समयसँगै, UI र UX प्राकृतिक भाषामा आधारित हुँदै जानेछन्, किनकि एजेन्ट प्रणालीले सोच्ने तरिका यही हो, वा यो मूल रूपमा ठूला भाषा मोडेलहरू (LLMs) को लागि प्रशिक्षणको आधार हो।
- यदि तपाईं कसैलाई एआई एजेन्ट स्वीकार गर्न चाहनुहुन्छ भने, तिनीहरूले वास्तवमा "विश्वासको छलांग" को डिग्री लिइरहेका हुन्छन् किनभने धेरै मानिसहरूका लागि, यो एकदमै अपरिचित क्षेत्र हो।
एआई एजेन्टले ग्राहकको अनुभवलाई नयाँ आकार दिन्छ
जेसी झाङ: एजेन्ट वास्तवमा कसरी निर्माण गरिन्छ? हाम्रो विचार यो छ कि समयसँगै, यो प्राकृतिक भाषामा आधारित एजेन्ट जस्तै हुँदै जानेछ किनभने ठूला भाषा मोडेलहरू (LLMs) लाई यसरी नै प्रशिक्षित गरिन्छ।
लामो अवधिमा, यदि तपाईंसँग एक सुपर बुद्धिमान एजेन्ट छ जुन वास्तवमा मानव जस्तै छ भने, तपाईं यसलाई चीजहरू देखाउन सक्नुहुन्छ, व्याख्या गर्न सक्नुहुन्छ, प्रतिक्रिया दिन सक्नुहुन्छ, र यसले आफ्नो दिमागमा जानकारी अपडेट गर्नेछ।
तपाईं कल्पना गर्न सक्नुहुन्छ कि एक धेरै सक्षम मानव टोली सदस्य छ। जब तिनीहरू पहिलो पटक सामेल हुन्छन्, तपाईंले तिनीहरूलाई केही सिकाउनुहुन्छ, तिनीहरूले काम गर्न थाल्छन्, र त्यसपछि तपाईंले तिनीहरूलाई प्रतिक्रिया दिनुहुन्छ र नयाँ जानकारी देखाउनुहुन्छ।
अन्ततः, यो यस दिशामा विकसित हुनेछ - यो अधिक संवादात्मक र प्राकृतिक भाषामा आधारित हुनेछ, र मानिसहरूले एकअर्कासँग कुराकानी गर्ने तरिका अधिक प्राकृतिक हुनेछ। र मानिसहरूले अब ती जटिल निर्णय रूखहरू आवश्यकताहरू कब्जा गर्न प्रयोग गर्दैनन्, जुन काम गर्न सक्छन् तर पतन हुने सम्भावना हुन्छ।
विगतमा, हामीसँग ठूलो भाषा मोडेल नभएकोले हामीले यो गर्नुपर्थ्यो। तर अब, एजेन्टको निरन्तर प्रगतिसँगै, प्रयोगकर्ता अनुभव (UX) र प्रयोगकर्ता इन्टरफेस (UI) थप संवादात्मक हुनेछन्।
डेरिक ह्यारिस: नमस्ते सबैजना, A16z AI पोडकास्टमा स्वागत छ। म डेरिक ह्यारिस हुँ, र आज मसँग Decagon का सह-संस्थापक र CEO जेसी झाङ र a16z का साझेदार किम्बर्ली ट्यान सामेल हुनेछु। किम्बर्लीले छलफललाई मध्यस्थता गर्नेछन्, र जेसीले Decagon र यसका उत्पादनहरू निर्माण गर्ने आफ्नो अनुभव साझा गर्नेछन्।
यदि तपाईंलाई यसको बारेमा धेरै थाहा छैन भने, डेकागन एउटा स्टार्टअप हो जसले ग्राहक समर्थनमा सहयोग गर्न व्यवसायहरूलाई एआई एजेन्टहरू प्रदान गर्दछ। यी एजेन्टहरू न त च्याटबटहरू हुन् न त एकल एपीआई कलको लागि एलएलएम र्यापरहरू, तर अत्यधिक अनुकूलित उन्नत एजेन्टहरू हुन् जसले कम्पनीको विशिष्ट आवश्यकताहरूमा आधारित जटिल कार्यप्रवाहहरू ह्यान्डल गर्न सक्छन्।
उनीहरूले डेकागन किन सिर्जना गरे र यसलाई विभिन्न LLM र ग्राहक वातावरणहरू ह्यान्डल गर्न कसरी वास्तुकृत गरिएको छ भनेर व्याख्या गर्नुका साथै, जेसीले प्रति कुराकानी शुल्क लिने व्यापार मोडेलका फाइदाहरू र एआई एजेन्टहरूले ग्राहक समर्थन नेताहरूको आवश्यक सीपहरू कसरी परिवर्तन गर्नेछन् भन्ने बारेमा पनि कुरा गर्छन्।
यो पनि उल्लेखनीय छ कि किम्बर्लीले हालै "RIP to RPA, The Rise of Intelligent Automation" शीर्षकको ब्लग पोस्ट लेखेकी छिन्, जसको बारेमा हामी यस एपिसोडमा संक्षिप्त रूपमा छलफल गर्नेछौं।
व्यापार प्रक्रियाहरूमा स्वचालन कसरी बढिरहेको छ भनेर बुझ्नको लागि यो एक उत्कृष्ट सुरुवात बिन्दु हो, र हामी शो नोटहरूमा लिङ्क प्रदान गर्नेछौं। र अन्तमा, सम्झनाको रूपमा, यस लेखको सामग्री केवल जानकारीमूलक उद्देश्यका लागि हो र यसलाई कानुनी, व्यापार, कर वा लगानी सल्लाह मान्नु हुँदैन, न त यसलाई कुनै पनि लगानी वा सुरक्षाको मूल्याङ्कन गर्न प्रयोग गर्नु हुँदैन, र यो कुनै पनि a16z कोष लगानीकर्ता वा सम्भावित लगानीकर्तामा निर्देशित छैन।
जेसी झाङ: मेरो छोटो परिचय। म बोल्डरमा जन्मेको र हुर्केको थिएँ, र मैले बाल्यकालमा धेरै गणित प्रतियोगिताहरू र यस्तै अन्य प्रतियोगिताहरूमा भाग लिएको थिएँ। मैले हार्वर्डमा कम्प्युटर विज्ञान पढें, र त्यसपछि एउटा कम्पनी सुरु गरें जुन a16z द्वारा समर्थित थियो। हामीलाई अन्ततः Niantic ले अधिग्रहण गर्यो।
त्यसपछि हामीले डेकागन निर्माण गर्न थाल्यौं। हाम्रो व्यवसायले ग्राहक सेवाको लागि एआई एजेन्टहरू निर्माण गरिरहेको छ। सुरुमा, हामीले यो गर्यौं किनभने हामी हाम्रो हृदयको धेरै नजिकको काम गर्न चाहन्थ्यौं।
अवश्य पनि, ग्राहक सेवामा एआई एजेन्टहरूको भूमिकाको बारेमा कसैलाई पनि सिकाउनु पर्दैन, हैन र? हामी सबै एयरलाइन्स, होटलहरू, आदिसँग फोनमा कुरा गरिरहेका थियौं, र पर्खिरहेका थियौं। त्यसैले त्यहाँबाट विचार आयो।
हामीले कस्तो प्रकारको उत्पादन निर्माण गर्नुपर्छ भनेर पत्ता लगाउन धेरै ग्राहकहरूसँग कुरा गर्यौं। हाम्रो लागि एउटा कुरा उल्लेखनीय थियो कि हामीले एआई एजेन्टहरूको बारेमा थप सिक्दै जाँदा, हामीले धेरै एआई एजेन्टहरू हुँदा भविष्य कस्तो हुनेछ भनेर सोच्न थाल्यौं। मलाई लाग्छ सबैजना विश्वास गर्छन् कि भविष्यमा धेरै एआई एजेन्टहरू हुनेछन्।
हामी के सोचिरहेका छौं भने एआई एजेन्टहरू वरिपरि काम गर्ने कर्मचारीहरूले के गर्नेछन्? उनीहरूसँग कस्तो प्रकारको उपकरणहरू हुनेछन्? उनीहरूले काम गर्ने वा व्यवस्थापन गर्ने एजेन्टहरूलाई कसरी नियन्त्रण वा हेर्नेछन्?
त्यसैले यो प्रश्नको वरिपरि हामीले कम्पनी कसरी निर्माण गर्यौं भन्ने कुराको मूल कुरा यही हो। मलाई लाग्छ कि यसले हामीलाई अहिले अलग बनाउँछ, किनकि हामी यी एआई एजेन्टहरूलाई विभिन्न उपकरणहरू प्रदान गर्छौं जसले गर्दा हामीसँग काम गर्ने मानिसहरूलाई यी एजेन्टहरू निर्माण र कन्फिगर गर्न मद्दत मिल्छ ताकि तिनीहरू अब "ब्ल्याक बक्स" नहोस्। यसरी हामी हाम्रो ब्रान्ड निर्माण गर्छौं।
डेरिक ह्यारिस: तपाईंको अन्तिम कम्पनी उपभोक्तामुखी भिडियो कम्पनी भएकोले, तपाईंलाई इन्टरप्राइज सफ्टवेयरमा जान केले प्रेरित गर्यो?
जेसी झाङ: राम्रो प्रश्न। मलाई लाग्छ संस्थापकहरू विषय छनौट गर्दा प्रायः "विषय अज्ञेयवादी" हुन्छन्, किनकि वास्तविकतामा, जब तपाईं नयाँ क्षेत्रमा जानुहुन्छ, तपाईं सामान्यतया धेरै भोला हुनुहुन्छ। त्यसैले नयाँ दृष्टिकोणबाट चीजहरू हेर्नुको फाइदा छ। त्यसैले जब हामी यसको बारेमा सोचिरहेका थियौं, त्यहाँ लगभग कुनै विषय प्रतिबन्धहरू थिएनन्।
मलाई लाग्छ कि यो धेरै मात्रात्मक पृष्ठभूमि भएका मानिसहरूको लागि एक धेरै सामान्य ढाँचा हो, म आफैं पनि। उपभोक्ता उत्पादनहरू प्रयास गरेपछि, तपाईं उद्यम सफ्टवेयर तिर बढी आकर्षित हुनुहुन्छ किनभने उद्यम सफ्टवेयरमा धेरै ठोस समस्याहरू छन्।
तपाईंसँग वास्तविक आवश्यकताहरू, बजेटहरू र त्यस्तै चीजहरू भएका वास्तविक ग्राहकहरू छन्, र तपाईं तिनीहरूका लागि समस्याहरू अनुकूलन गर्न र समाधान गर्न सक्नुहुन्छ। उपभोक्ता बजार पनि धेरै आकर्षक छ, तर यो प्रयोगद्वारा संचालित भन्दा अन्तर्ज्ञानमा आधारित छ। व्यक्तिगत रूपमा मेरो लागि, इन्टरप्राइज सफ्टवेयर राम्रो फिट हो।
किम्बर्ली ट्यान: पहिले, हामी यो प्रश्नबाट सुरु गर्न सक्छौं: आज डेकागनले व्यवहार गर्ने सबैभन्दा सामान्य समर्थन वर्गहरू के हुन्? के तपाईं यी समस्याहरू समाधान गर्न ठूला भाषा मोडेलहरू (LLMs) कसरी प्रयोग गर्नुहुन्छ र पहिले गर्न नसक्ने कुराहरू अब के गर्न सक्नुहुन्छ भन्ने बारे विस्तृत रूपमा बताउन सक्नुहुन्छ?
जेसी झाङ: यदि तपाईंले पहिलेको स्वचालनलाई फर्केर हेर्नुभयो भने, तपाईंले कुन बाटो लिने भनेर निर्धारण गर्न, केही सरल काम गर्न निर्णय रूखहरू प्रयोग गर्नुभएको हुन सक्छ। तर हामी सबैले च्याटबटहरू प्रयोग गरेका छौं, र यो एकदमै निराशाजनक अनुभव हो।
प्रायः तपाईंको प्रश्नको पूर्ण उत्तर निर्णय रूखले दिन सक्दैन। त्यसैले तपाईंलाई प्रश्नसँग सम्बन्धित तर ठ्याक्कै मेल नखाने प्रश्न मार्गमा निर्देशित गरिन्छ। अब, हामीसँग ठूला भाषा मोडेलहरू (LLMs) छन्। LLMs को जादू यो हो कि तिनीहरू धेरै लचिलो हुन्छन्, धेरै फरक परिस्थितिहरूमा अनुकूलन गर्न सक्छन्, र आधारभूत बुद्धिमत्ता हुन्छ।
जब तपाईं यसलाई ग्राहक समर्थनमा लागू गर्नुहुन्छ, वा ग्राहकले प्रश्न सोध्दा, तपाईं अझ बढी व्यक्तिगत सेवा प्रदान गर्न सक्नुहुन्छ। यो पहिलो बुँदा हो, निजीकरणको स्तरमा धेरै सुधार भएको छ। यसले उच्च मेट्रिक्स अनलक गर्छ। तपाईं थप समस्याहरू समाधान गर्न सक्नुहुन्छ, ग्राहकहरू बढी सन्तुष्ट हुन्छन्, र ग्राहक सन्तुष्टि बढ्छ।
अर्को प्राकृतिक चरण हो: यदि तपाईंसँग यो बुद्धिमत्ता छ भने, तपाईं मानिसहरूले गर्न सक्ने धेरै कामहरू गर्न सक्षम हुनुपर्छ। मानिसहरूले गर्न सक्ने कामहरू भनेको तिनीहरूले वास्तविक समयमा डेटा तान्न सक्छन्, तिनीहरूले कारबाही गर्न सक्छन्, र तिनीहरूले धेरै चरणहरू मार्फत तर्क गर्न सक्छन्। यदि कुनै ग्राहकले अपेक्षाकृत जटिल प्रश्न सोध्छ भने, हुनसक्छ "म यो र त्यो गर्न चाहन्छु," र एआई पहिलो प्रश्न ह्यान्डल गर्न मात्र तयार छ। LLM यहाँ दुई प्रश्नहरू छन् भनेर पहिचान गर्न पर्याप्त स्मार्ट छ। पहिलो, यसले पहिलो समस्या समाधान गर्नेछ, र त्यसपछि तपाईंलाई दोस्रो समस्या समाधान गर्न मद्दत गर्नेछ।
LLM आउनुभन्दा पहिले, यो मूलतः असम्भव थियो। त्यसैले हामी अब प्रविधिले गर्न सक्ने कुरामा एक कदम परिवर्तन देखिरहेका छौं, र त्यो LLM को कारणले हो।
किम्बर्ली ट्यान: यस सन्दर्भमा, तपाईं एआई एजेन्टलाई कसरी परिभाषित गर्नुहुन्छ? "एजेन्ट" शब्द व्यापक रूपमा प्रयोग हुने भएकोले, डेकागनको सन्दर्भमा यसको वास्तवमा के अर्थ हुन्छ भनेर म उत्सुक छु।
जेसी झाङ: म भन्छु कि एजेन्टले त्यस्तो प्रणालीलाई बुझाउँछ जहाँ धेरै LLM (ठूलो भाषा मोडेल) प्रणालीहरू सँगै काम गर्छन्। तपाईंसँग LLM आह्वान छ, जसमा मूल रूपमा प्रम्प्ट पठाउने र प्रतिक्रिया प्राप्त गर्ने समावेश छ। एजेन्टको लागि, तपाईं धेरै यस्ता आह्वानहरू जडान गर्न सक्षम हुन चाहनुहुन्छ, सायद पुनरावर्ती पनि।
उदाहरणका लागि, तपाईंसँग एउटा LLM कल छ जसले सन्देश कसरी ह्यान्डल गर्ने भनेर निर्धारण गर्छ, र त्यसपछि यसले अन्य कलहरू ट्रिगर गर्न सक्छ जसले थप डेटा तान्छ, कार्यहरू गर्दछ, र प्रयोगकर्ताले भनेको कुरा दोहोर्याउँछ, सायद फलो-अप प्रश्नहरू पनि सोध्छ। त्यसैले हाम्रो लागि, एजेन्टलाई लगभग LLM कलहरू, API कलहरू, वा अन्य तर्कहरूको नेटवर्कको रूपमा बुझ्न सकिन्छ जुन राम्रो अनुभव प्रदान गर्न सँगै काम गर्दछ।
किम्बर्ली ट्यान: यस विषयमा, सायद हामी तपाईंले वास्तवमा निर्माण गर्नुभएको एजेन्ट पूर्वाधारको बारेमा थप कुरा गर्न सक्छौं। मलाई लाग्छ एउटा धेरै रोचक कुरा के हो भने बजारमा एआई एजेन्टहरूको धेरै प्रदर्शनहरू छन्, तर मलाई लाग्छ कि उत्पादन वातावरणमा वास्तवमा स्थिर रूपमा चल्न सक्ने धेरै कम उदाहरणहरू छन्। र बाहिरबाट के वास्तविक हो र के होइन भनेर जान्न गाह्रो छ।
त्यसोभए तपाईंको विचारमा, आजका एआई एजेन्टहरूका कुन पक्षहरूले राम्रो काम गरिरहेका छन्, र तिनीहरूलाई अझ बलियो र भरपर्दो बनाउन अझै पनि प्राविधिक सफलताहरू आवश्यक पर्ने पक्षहरू के हुन्?
जेसी झाङ: मेरो दृष्टिकोण वास्तवमा अलि फरक छ। एआई एजेन्ट केवल एक डेमो हो वा "वास्तवमा काम गरिरहेको छ" भनेर निर्धारण गर्ने बीचको भिन्नता पूर्णतया प्रविधि स्ट्याकमा निहित छैन, किनभने मलाई लाग्छ कि धेरैजसो मानिसहरूले लगभग एउटै प्रविधि प्रयोग गरिरहेका हुन सक्छन्। मलाई लाग्छ कि एक पटक तपाईं आफ्नो कम्पनीको विकासमा अगाडि बढिसकेपछि, उदाहरणका लागि, हाम्रो कम्पनी एक वर्ष भन्दा बढी समयदेखि स्थापित भएको छ, तपाईंले आफ्नो प्रयोगको अवस्थामा मिल्ने धेरै विशिष्ट चीज सिर्जना गर्नुहुनेछ।
तर अन्तिम विश्लेषणमा, सबैले एउटै मोडेलमा पहुँच गर्न सक्छन् र उस्तै प्रविधि प्रयोग गर्न सक्छन्। मलाई लाग्छ कि एआई एजेन्टले प्रभावकारी रूपमा काम गर्न सक्छ कि सक्दैन भन्ने सबैभन्दा ठूलो भिन्नता प्रयोगको रूपमा निहित छ। सुरुमा यो जान्न गाह्रो छ, तर पछाडि फर्केर हेर्दा, तपाईंले पाउनुहुनेछ कि एआई एजेन्टको लागि प्रदर्शनभन्दा बाहिर जान र व्यावहारिक प्रयोगमा प्रवेश गर्न दुईवटा विशेषताहरू धेरै महत्त्वपूर्ण छन्।
पहिलो कुरा, तपाईंले समाधान गर्नुभएको प्रयोगको केसमा परिमाणात्मक ROI (लगानीमा प्रतिफल) हुनुपर्छ। यो धेरै महत्त्वपूर्ण छ, किनकि यदि ROI परिमाण गर्न सकिएन भने, मानिसहरूलाई तपाईंको उत्पादन प्रयोग गर्न र यसको लागि भुक्तानी गर्न मनाउन गाह्रो हुनेछ। हाम्रो अवस्थामा, मात्रात्मक सूचक हो: तपाईंले कति प्रतिशत समर्थन अनुरोधहरू समाधान गर्नुहुन्छ? किनभने यो संख्या स्पष्ट छ, मानिसहरूले यसलाई बुझ्न सक्छन् - ओह, ठीक छ, यदि तपाईंले थप समाधान गर्नुभयो भने, म यो परिणामलाई मेरो हालको खर्च र बिताएको समयसँग तुलना गर्न सक्छु। त्यसोभए, यदि यो सूचक छ भने, हाम्रो लागि धेरै महत्त्वपूर्ण अर्को सूचक ग्राहक सन्तुष्टि हो। ROI सजिलै परिमाण गर्न सकिने हुनाले, मानिसहरूले यसलाई साँच्चै अपनाउनेछन्।
दोस्रो कारक भनेको प्रयोगका केसहरू क्रमशः अझ कठिन हुनुपर्छ। यदि तपाईंलाई सुरुदेखि नै सुपरह्युमन बन्न एजेन्ट चाहिन्छ भने, लगभग १००१TP११T प्रयोगका केसहरू समाधान गर्न यो धेरै गाह्रो हुनेछ। किनकि हामीलाई थाहा छ, LLM हरू गैर-निर्धारित हुन्छन्, तपाईंसँग कुनै प्रकारको आकस्मिक योजना हुनुपर्छ। सौभाग्यवश, समर्थन प्रयोगका केसहरूको एक ठूलो विशेषता छ, र त्यो हो कि तपाईं सधैं मानवमा बढ्न सक्नुहुन्छ। यदि तपाईंले आधा समस्याहरू मात्र समाधान गर्न सक्नुहुन्छ भने, यो अझै पनि मानिसहरूको लागि धेरै मूल्यवान छ।
त्यसैले मलाई लाग्छ कि त्यो समर्थनमा यो विशेषता छ जसले यसलाई एआई एजेन्टको लागि धेरै उपयुक्त बनाउँछ। मलाई लाग्छ कि त्यहाँ धेरै अन्य क्षेत्रहरू छन् जहाँ मानिसहरूले प्रभावशाली डेमोहरू सिर्जना गर्न सक्छन् जहाँ तपाईंले एआई एजेन्ट किन उपयोगी हुनेछ भनेर बुझ्नको लागि नजिकबाट हेर्नु पर्दैन। तर यदि यो सुरुदेखि नै उत्तम हुनुपर्छ भने, यो धेरै गाह्रो छ। यदि त्यसो हो भने, लगभग कोही पनि यसलाई प्रयास गर्न वा प्रयोग गर्न चाहँदैनन् किनभने यसको अपूर्णताको परिणाम धेरै गम्भीर हुन सक्छ - उदाहरणका लागि, सुरक्षाको सन्दर्भमा।
उदाहरणका लागि, जब मानिसहरूले सिमुलेशन गर्छन्, तिनीहरूसँग सधैं यो क्लासिक विचार हुन्छ: "ओह, यदि LLM ले यो पढ्न सकेको भए यो राम्रो हुन्थ्यो।" तर कसैले यसो भनिरहेको कल्पना गर्न गाह्रो छ, "ठीक छ, एआई एजेन्ट, यसको लागि जानुहोस्। मलाई विश्वास छ कि तपाईं यो गर्न सक्नुहुन्छ।" किनभने यदि यसले गल्ती गर्छ भने, परिणामहरू धेरै गम्भीर हुन सक्छन्।
जेसी झाङ: यो सामान्यतया हाम्रा ग्राहकहरूद्वारा निर्णय गरिन्छ, र वास्तवमा हामी भिन्नताहरूको धेरै विस्तृत दायरा देख्छौं। एक चरम सीमामा, केही मानिसहरूले आफ्नो एजेन्टलाई वास्तवमा मानव जस्तो देखाउँछन्, त्यसैले त्यहाँ मानव अवतार, मानव नाम हुन्छ, र प्रतिक्रियाहरू धेरै स्वाभाविक हुन्छन्। अर्कोतर्फ, एजेन्टले यो एआई हो भनेर मात्र भन्छ र प्रयोगकर्तालाई यो स्पष्ट पार्छ। मलाई लाग्छ कि हामीसँग काम गर्ने विभिन्न कम्पनीहरूको यसमा फरक-फरक धारणा छ।
सामान्यतया, यदि तपाईं नियमन गरिएको उद्योगमा हुनुहुन्छ भने, तपाईंले यो स्पष्ट पार्नु पर्छ। मलाई अहिले रोचक लागेको कुरा के हो भने ग्राहकको व्यवहार परिवर्तन हुँदैछ। किनभने हाम्रा धेरै ग्राहकहरूले सामाजिक सञ्जालमा धेरै प्रतिक्रिया पाइरहेका छन्, जस्तै, "हे भगवान, यो मैले कहिल्यै प्रयास गरेको पहिलो च्याट अनुभव हो जुन वास्तवमा यति वास्तविक लाग्छ," वा "यो केवल जादु हो।" र यो उनीहरूको लागि राम्रो छ, किनभने अब उनीहरूका ग्राहकहरूले सिकिरहेका छन्, हे, यदि यो एआई अनुभव हो भने, यो वास्तवमा मानव भन्दा राम्रो हुन सक्छ। विगतमा त्यस्तो थिएन, किनभने हामीमध्ये धेरैले विगतमा त्यस्तो प्रकारको फोन ग्राहक सेवा अनुभव गरेका छौं: "ठीक छ, एआई, एआई, एआई..."
किम्बर्ली ट्यान: तपाईंले निजीकरणको अवधारणालाई केही पटक उल्लेख गर्नुभयो। सबैजना एउटै अन्तर्निहित प्रविधि वास्तुकला प्रयोग गरिरहेका छन्, तर समर्थन सेवाहरूको सन्दर्भमा उनीहरूसँग फरक-फरक निजीकरण आवश्यकताहरू छन्। के तपाईं यसको बारेमा कुरा गर्न सक्नुहुन्छ? विशेष गरी, तपाईं कसरी निजीकरण प्राप्त गर्नुहुन्छ ताकि मानिसहरूले अनलाइन भन्न सकून्, "हे भगवान, यो मैले अहिलेसम्म पाएको सबैभन्दा राम्रो समर्थन अनुभव हो"?
जेसी झाङ: हाम्रो लागि, निजीकरण प्रयोगकर्ताको लागि अनुकूलनबाट आउँछ। तपाईंले प्रयोगकर्ताको पृष्ठभूमि जानकारी बुझ्नु आवश्यक छ, जुन आवश्यक अतिरिक्त सन्दर्भ हो। दोस्रो, तपाईंले हाम्रा ग्राहकहरूको व्यापारिक तर्क पनि बुझ्नु आवश्यक छ।यदि तपाईंले यी दुईलाई संयोजन गर्नुभयो भने, तपाईंले एकदमै राम्रो अनुभव प्रदान गर्न सक्नुहुन्छ।
स्पष्ट रूपमा, यो सरल सुनिन्छ, तर वास्तविकतामा सबै आवश्यक सन्दर्भ प्राप्त गर्न धेरै गाह्रो छ। त्यसकारण, हाम्रो धेरैजसो काम सही आदिम कम्पोनेन्टहरू कसरी निर्माण गर्ने भन्नेमा हुन्छ ताकि जब ग्राहकले हाम्रो प्रणाली तैनाथ गर्छ, तिनीहरूले सजिलै निर्णय गर्न सकून्, "ठीक छ, यो हामीले चाहेको व्यावसायिक तर्क हो।" उदाहरणका लागि, पहिले तपाईंले यी चार चरणहरू गर्न आवश्यक छ, र यदि तेस्रो चरण असफल भयो भने, तपाईंले पाँचौं चरणमा जान आवश्यक छ।
तपाईं AI लाई यो धेरै सजिलै सिकाउन सक्षम हुन चाहनुहुन्छ, तर यसलाई "यो प्रयोगकर्ताको खाता विवरण हो। यदि तपाईंलाई थप जानकारी चाहिन्छ भने, तपाईं यी API हरूलाई कल गर्न सक्नुहुन्छ।" यी तहहरू मोडेलको माथि एक समन्वय तह हुन्, र एक तरिकाले, तिनीहरूले एजेन्टलाई वास्तवमै प्रयोगयोग्य बनाउँछन्।
किम्बर्ली ट्यान: यस्तो लाग्छ कि यस अवस्थामा, तपाईंलाई व्यापार प्रणालीहरूमा धेरै पहुँच चाहिन्छ। तपाईंलाई प्रयोगकर्ताहरूको बारेमा धेरै जान्न आवश्यक छ, र तपाईंलाई सम्भवतः ग्राहकले वास्तवमा आफ्ना प्रयोगकर्ताहरूसँग कसरी अन्तरक्रिया गर्न चाहन्छ भनेर जान्न आवश्यक छ।मलाई लाग्छ यो डेटा धेरै संवेदनशील हुन सक्छ।
के तपाईं एआई एजेन्ट तैनाथ गर्दा उद्यम ग्राहकहरूलाई सामान्यतया चाहिने आश्वासनहरूको बारेमा विस्तृत रूपमा बताउन सक्नुहुन्छ? र तपाईं यी समस्याहरूलाई कसरी सम्हाल्ने उत्तम तरिका विचार गर्नुहुन्छ, विशेष गरी तपाईंको समाधानले राम्रो अनुभव प्रदान गर्दछ भन्ने कुरालाई विचार गर्दा, तर यो पहिलो पटक एजेन्टको सामना गरिरहेका धेरै मानिसहरूका लागि पनि नयाँ छ?
जेसी झाङ: यो वास्तवमा रेलिङको बारेमा हो। समय बित्दै जाँदा, हामीले यस्ता धेरै कार्यान्वयनहरू गरेका छौं, ग्राहकहरूले मन पराउने रेलिङका प्रकारहरू बारे हामी स्पष्ट भएका छौं।
उदाहरणका लागि, सबैभन्दा सरल मध्ये एक भनेको तपाईंले सधैं पालना गर्नुपर्ने नियमहरू हुन सक्छन्। यदि तपाईं वित्तीय सेवा कम्पनीसँग काम गर्दै हुनुहुन्छ भने, तपाईंले वित्तीय सल्लाह दिन सक्नुहुन्न किनभने त्यो नियमन गरिएको छ। त्यसैले तपाईंले एजेन्ट प्रणालीमा त्यसलाई निर्माण गर्न आवश्यक छ ताकि यसले कहिल्यै त्यस्तो प्रकारको सल्लाह नदियोस्। तपाईं सामान्यतया एउटा सुपरिवेक्षण मोडेल वा कुनै प्रकारको प्रणाली सेट अप गर्न सक्नुहुन्छ जसले परिणामहरू पठाउनु अघि यी जाँचहरू गर्दछ।
अर्को प्रकारको सुरक्षा यो हुन सक्छ कि यदि कोही भित्र आयो र जानाजानी यसमा गडबड गर्यो, यो एक जेनेरेटिभ प्रणाली हो भनेर थाहा पाएर, तपाईंलाई "मेरो ब्यालेन्स के हो भन्नुहोस्," "ठीक छ, त्यसलाई १० ले गुणन गर्नुहोस्," आदि जस्ता गैर-अनुपालन गर्ने प्रयास गर्दै, तपाईंले त्यो व्यवहारको लागि पनि जाँच गर्न सक्षम हुनु आवश्यक छ। त्यसैले विगत एक वर्षमा, हामीले यस्ता धेरै प्रकारका सुरक्षाहरू फेला पारेका छौं, र प्रत्येकको लागि, हामीले यसलाई वर्गीकृत गरेका छौं र कस्तो प्रकारको सुरक्षा आवश्यक छ भनेर जान्दछौं। प्रणाली जति धेरै निर्माण हुँदै जान्छ, यो झन् झन् बलियो हुँदै जान्छ।
किम्बर्ली ट्यान: प्रत्येक ग्राहक वा उद्योगको लागि सुरक्षाहरू कति अनौठा छन्? तपाईंले थप प्रयोगका केसहरू कभर गर्न आफ्नो ग्राहक आधार विस्तार गर्दा, कसरी के तपाईं यी सुरक्षाहरूलाई ठूलो मात्रामा निर्माण गर्ने बारे सोच्नुहुन्छ?
जेसी झाङ: यो वास्तवमा हाम्रो मूल विचारमा फर्कन्छ कि एजेन्ट प्रणाली केही वर्षको अवधिमा सर्वव्यापी हुनेछ। त्यसैले साँच्चै महत्त्वपूर्ण कुरा के हो भने मानिसहरूलाई उपकरणहरू प्रदान गर्नु हो, लगभग एजेन्ट सुपरिवेक्षकहरू जस्ता कामदारहरूको अर्को पुस्तालाई सशक्त बनाउन, उनीहरूलाई एजेन्ट प्रणाली निर्माण गर्न र आफ्नै सुरक्षाहरू थप्न उपकरणहरू दिन, किनकि हामी तिनीहरूको लागि सुरक्षाहरू परिभाषित गर्ने छैनौं।
प्रत्येक ग्राहकलाई आफ्नो सुरक्षा उपायहरू र व्यावसायिक तर्क राम्रोसँग थाहा छ। त्यसैले हाम्रो काम वास्तवमा उपकरण र पूर्वाधार निर्माण गर्ने राम्रो काम गर्नु हो ताकि उनीहरूले एजेन्ट प्रणाली निर्माण गर्न सकून्। त्यसकारण, हामीले सधैं जोड दिएका छौं कि एजेन्ट प्रणाली ब्ल्याक बक्स हुनु हुँदैन, र तपाईंले यी सुरक्षाहरू, नियमहरू र तर्कहरू कसरी निर्माण गर्ने भनेर नियन्त्रण गर्न सक्षम हुनुपर्छ।
मलाई लाग्छ कि यो सायद अहिलेसम्मको हाम्रो सबैभन्दा फरक पक्ष हो। हामीले यी उपकरणहरूमा धेरै प्रयास गरेका छौं र उत्कृष्ट प्राविधिक पृष्ठभूमि नभएका वा AI मोडेलहरूले कसरी काम गर्छ भन्ने बारे गहिरो बुझाइ नभएका मानिसहरूलाई एजेन्ट प्रणालीमा AI ले प्रदर्शन गर्न चाहेको कार्यहरू इनपुट गर्न अनुमति दिने रचनात्मक तरिकाहरू लिएर आएका छौं।
मलाई लाग्छ कि यो आगामी केही वर्षहरूमा बढ्दो रूपमा महत्त्वपूर्ण क्षमता बन्न गइरहेको छ। मानिसहरूले समान उपकरणहरूको मूल्याङ्कन गर्दा यो सबैभन्दा महत्त्वपूर्ण मापदण्ड मध्ये एक हुनुपर्छ, किनकि तपाईं समयसँगै यी प्रणालीहरूलाई निरन्तर अनुकूलन र सुधार गर्न सक्षम हुन चाहनुहुन्छ।
प्राकृतिक भाषाद्वारा संचालित व्यापार तर्क
डेरिक ह्यारिस: कुनै पनि प्रकारको स्वचालनको लागि, र विशेष गरी यो एजेन्ट प्रणालीको प्रयोगको लागि ग्राहकहरू वा व्यवसायहरूले कस्तो तयारी गर्न सक्छन्? उदाहरणका लागि, तिनीहरूले त्यस्ता प्रणालीहरूलाई समर्थन गर्न आफ्नो डेटा प्रणाली, सफ्टवेयर वास्तुकला वा व्यापार तर्क कसरी डिजाइन गर्न सक्छन्?
किनभने मलाई लाग्छ कि धेरैजसो एआई प्रविधि सुरुमा नयाँ हुन्छन्, तर जब अवस्थित लिगेसी प्रणालीहरूको कुरा आउँछ, यसले प्रायः धेरै अराजकताको सामना गर्छ।
जेसी झाङ: यदि कसैले अहिले स्क्र्याचबाट निर्माण गरिरहेको छ भने, तपाईंको कामलाई सजिलो बनाउन सक्ने धेरै उत्कृष्ट अभ्यासहरू छन्। उदाहरणका लागि, तपाईंको ज्ञानको आधार कसरी संरचना गर्ने। हामीले यी मध्ये केहीको बारेमा लेखेका छौं, र केही विधिहरू प्रस्तुत गरेका छौं जसले AI लाई जानकारी इन्जेस्ट गर्न र यसको शुद्धता सुधार गर्न सजिलो बनाउन सक्छ। एउटा विशिष्ट सुझाव भनेको धेरै उत्तरहरू भएको एउटा ठूलो लेख हुनुको सट्टा ज्ञानको आधारलाई मोड्युलर भागहरूमा विभाजन गर्नु हो।
एपीआई सेटअप गर्दा, तपाईंले तिनीहरूलाई एजेन्ट प्रणालीको लागि अझ उपयुक्त बनाउन सक्नुहुन्छ, र अनुमतिहरू र आउटपुट सेट गर्न सक्नुहुन्छ जसले गर्दा एजेन्ट प्रणालीले उत्तर खोज्न धेरै गणना नगरीकनै जानकारी इन्जेस्ट गर्न सजिलो हुन्छ। यी केही रणनीतिक उपायहरू हुन् जुन लिन सकिन्छ, तर म भन्दिन कि एजेन्ट प्रणाली प्रयोग गर्न केहि पनि गर्नुपर्छ।
डेरिक ह्यारिस: राम्रो कागजात सधैं महत्त्वपूर्ण हुन्छ, मूलतः यो जानकारीलाई प्रभावकारी रूपमा व्यवस्थित गर्ने बारे हो।
किम्बर्ली ट्यान: यस्तो लाग्छ कि यदि तपाईंले मानिसहरूलाई एजेन्ट प्रणालीलाई आफ्ना ग्राहकहरू वा विशिष्ट प्रयोगका केसहरूमा उपयुक्त हुने तरिकाले सञ्चालन गर्न कसरी निर्देशित गर्ने भनेर सिकाउने प्रयास गर्नुभयो भने, UI र UX डिजाइनको साथ धेरै प्रयोग आवश्यक पर्न सक्छ, वा तपाईंले यो पूर्णतया नयाँ क्षेत्रमा नयाँ बाटोहरू बनाउनु पर्ने हुन सक्छ, किनभने यो परम्परागत सफ्टवेयर भन्दा धेरै फरक छ।
म उत्सुक छु, यसबारे तपाईंको विचार कस्तो छ? एजेन्ट-प्रथम संसारमा UI र UX कस्तो देखिनु पर्छ? आगामी केही वर्षहरूमा यो कसरी परिवर्तन हुनेछ जस्तो तपाईंलाई लाग्छ?
जेसी झाङ: म भन्दिन कि हामीले यो समस्या समाधान गरिसकेका छौं। मलाई लाग्छ हामीले हाम्रा हालका ग्राहकहरूको लागि काम गर्ने स्थानीय इष्टतम फेला पारेका छौं, तर यो अझै पनि हामी र धेरै अन्य ग्राहकहरूको लागि अनुसन्धानको निरन्तर क्षेत्र हो।
मुख्य मुद्दा हामीले पहिले उल्लेख गरेको कुरामा फर्कन्छ, जुन तपाईंसँग एजेन्ट प्रणाली छ। पहिले, तपाईं कसरी स्पष्ट रूपमा यो के गरिरहेको छ र यसले कसरी निर्णय गरिरहेको छ भनेर देख्न सक्नुहुन्छ? त्यसपछि, के अद्यावधिक गर्न आवश्यक छ र AI लाई कस्तो प्रतिक्रिया दिनुपर्छ भनेर निर्णय गर्न तपाईं यो जानकारी कसरी प्रयोग गर्न सक्नुहुन्छ? यी ती ठाउँहरू हुन् जहाँ UI तत्वहरू एकसाथ आउँछन्, विशेष गरी दोस्रो भाग।
हामीलाई लाग्छ कि समयसँगै, UI र UX प्राकृतिक भाषामा आधारित हुँदै जानेछन्, किनकि एजेन्ट प्रणालीले त्यस्तै सोच्दछ, वा त्यो मूल रूपमा ठूला भाषा मोडेलहरू (LLMs) लाई प्रशिक्षण दिने आधार हो।
अतिमा, यदि तपाईंसँग एक अति बुद्धिमान एजेन्ट छ जसले मूल रूपमा मानव जस्तै सोच्दछ, तपाईं त्यसलाई चीजहरू देखाउन सक्नुहुन्छ, चीजहरू व्याख्या गर्न सक्नुहुन्छ, प्रतिक्रिया दिन सक्नुहुन्छ, र यो आफ्नै "दिमाग" मा अपडेट हुनेछ। तपाईं कल्पना गर्न सक्नुहुन्छ कि एक धेरै सक्षम व्यक्ति तपाईंको टोलीमा सामेल हुनेछ, तपाईंले उसलाई केहि सिकाउनुहुन्छ, उसले काम गर्न थाल्छ, र त्यसपछि तपाईंले उसलाई प्रतिक्रिया दिइरहनुहुन्छ, तपाईं उसलाई नयाँ चीजहरू, नयाँ कागजातहरू, रेखाचित्रहरू, आदि देखाउन सक्नुहुन्छ।
मलाई लाग्छ कि चरम अवस्थामा, यो यस दिशामा विकसित हुनेछ: चीजहरू बढी कुराकानीयोग्य, बढी प्राकृतिक भाषा-आधारित हुनेछन्, र मानिसहरूले पहिले जस्तै जटिल निर्णय रूखहरू भएका प्रणालीहरू निर्माण गर्न बन्द गर्नेछन्, तपाईंले चाहेको कुरा कैद गर्नेछन्, तर यो दृष्टिकोण सजिलै बिग्रन सक्छ। हामीले यो गर्नुपर्थ्यो किनभने त्यतिबेला LLM हरू थिएनन्, तर अब एजेन्ट प्रणालीहरू बढ्दो शक्तिशाली हुँदै गइरहेका छन्, UI र UX थप कुराकानीयोग्य हुनेछन्।
किम्बर्ली ट्यान: लगभग डेढ वर्ष पहिले, जब डेकागन पहिलो पटक सुरु भएको थियो, त्यहाँ एक सामान्य धारणा थियो कि LLM धेरै प्रयोगका केसहरूमा धेरै लागू हुन्छ, तर वास्तवमा यो केवल एक प्रकारको "GPT र्यापर" थियो, जहाँ कम्पनीहरूले API मार्फत अन्तर्निहित मोडेललाई कल गर्न सक्थे र तुरुन्तै उनीहरूको समर्थन समस्याहरू समाधान गर्न सक्थे।
तर स्पष्ट रूपमा, कम्पनीहरूले सिधै त्यो बाटोमा जानुको सट्टा डेकागन जस्ता समाधानहरू प्रयोग गर्ने छनौट गर्दा, यो मामला होइन भन्ने कुरा पत्ता लाग्यो। म सोचिरहेको थिएँ कि के तपाईं यो मामला किन हो भनेर व्याख्या गर्न सक्नुहुन्छ। आन्तरिक रूपमा निर्माण गर्ने चुनौतीहरूलाई वास्तवमा के ले अपेक्षा गरेभन्दा बढी जटिल बनायो? अवधारणाको बारेमा उनीहरूमा कस्ता गलत धारणाहरू थिए?
जेसी झाङ: "GPT र्यापर" हुनुमा केही गलत छैन, तपाईं भन्न सक्नुहुन्छ कि Purcell AWS र्यापर हो वा त्यस्तै केहि। सामान्यतया, जब मानिसहरूले यो शब्द प्रयोग गर्छन्, यसको अर्थ अपमानजनक हुन्छ।
मेरो व्यक्तिगत विचार के हो भने यदि तपाईं एजेन्ट प्रणाली निर्माण गर्दै हुनुहुन्छ भने, परिभाषा अनुसार तपाईंले निश्चित रूपमा LLM लाई उपकरणको रूपमा प्रयोग गर्नुहुनेछ। त्यसैले तपाईं वास्तवमा पहिले नै अवस्थित कुनै चीजको माथि निर्माण गर्दै हुनुहुन्छ, जसरी तपाईं सामान्यतया AWS वा GCP मा निर्माण गर्नुहुन्छ।
तर तपाईंले सामना गर्न सक्ने वास्तविक समस्या भनेको LLM माथि निर्माण गर्नुभएको सफ्टवेयर "भारी" वा फरक पार्न पर्याप्त जटिल छैन भने हो।
पछाडि फर्केर हेर्दा, हाम्रो लागि, हामीले बेच्ने कुरा मूलतः सफ्टवेयर हो। हामी वास्तवमा एक नियमित सफ्टवेयर कम्पनी जस्तै हौं, बाहेक हामी सफ्टवेयरको भागको रूपमा र उपकरणहरू मध्ये एकको रूपमा LLM प्रयोग गर्छौं। तर जब मानिसहरूले यस प्रकारको उत्पादन किन्छन्, तिनीहरू मुख्यतया सफ्टवेयर नै चाहन्छन्। तिनीहरू त्यस्ता उपकरणहरू चाहन्छन् जसले AI लाई निगरानी गर्न सक्छ, जसले AI ले गर्ने हरेक कुराकानीको विवरणमा गहिरो रूपमा जान सक्छ, जसले प्रतिक्रिया दिन सक्छ, जसले प्रणालीलाई निरन्तर निर्माण र समायोजन गर्न सक्छ।
त्यसैले हाम्रो सफ्टवेयरको मूल कुरा यही हो। एजेन्ट प्रणाली आफैंमा भए पनि, मानिसहरूको समस्या यो हो कि डेमो गर्न राम्रो छ, तर यदि तपाईं यसलाई उत्पादन-तयार र वास्तवमै ग्राहक-मुखी बनाउन चाहनुहुन्छ भने, तपाईंले धेरै लामो समयदेखिका समस्याहरू समाधान गर्नुपर्छ, जस्तै "भ्रम" घटनालाई रोक्ने र विनाश निम्त्याउने प्रयास गर्ने खराब अभिनेताहरूसँग व्यवहार गर्ने। हामीले यो पनि सुनिश्चित गर्नुपर्छ कि विलम्बता पर्याप्त कम छ, स्वर उपयुक्त छ, आदि।
हामीले धेरै टोलीहरूसँग कुरा गर्यौं, र तिनीहरूले केही प्रयोगहरू गरे, प्रारम्भिक संस्करण निर्माण गरे, र त्यसपछि तिनीहरूले महसुस गरे, "ओह, साँच्चै, हामी पछिल्ला चरणहरूमा यी विवरणहरू निर्माण गरिरहनेहरू बन्न चाहँदैनौं।" तिनीहरू ग्राहक सेवा टोलीमा नयाँ तर्क थपिरहनेहरू पनि बन्न चाहँदैनथे। त्यसैले यस बिन्दुमा, अरूसँग सहकार्य गर्न छनौट गर्नु बढी उपयुक्त देखिन्छ।
किम्बर्ली ट्यान: तपाईंले केही दीर्घकालीन मुद्दाहरू उल्लेख गर्नुभयो, जस्तै खराब अभिनेताहरूसँग व्यवहार गर्ने आवश्यकता, आदि।मलाई विश्वास छ कि एआई एजेन्ट प्रयोग गर्ने विचार गरिरहेका धेरै श्रोताहरू एलएलएमको परिचय पछि उत्पन्न हुन सक्ने नयाँ सुरक्षा आक्रमण मार्गहरू वा एजेन्ट प्रणालीको परिचय पछि उत्पन्न हुन सक्ने नयाँ सुरक्षा जोखिमहरूको बारेमा चिन्तित छन्। यी मुद्दाहरूको बारेमा तपाईंको के विचार छ? र व्यवहार गर्दा शीर्ष-स्तरीय उद्यम सुरक्षा सुनिश्चित गर्नका लागि उत्तम अभ्यासहरू के हुन्? एजेन्ट?
जेसी झाङ: सुरक्षाको सन्दर्भमा, केही स्पष्ट उपायहरू लिन सकिन्छ, जुन मैले पहिले उल्लेख गरेको छु, जस्तै सुरक्षात्मक उपायहरूको आवश्यकता। मुख्य मुद्दा यो हो कि LLM हरूको बारेमा मानिसहरूको चिन्ता यो हो कि तिनीहरू निर्धारणात्मक छैनन्।
तर खुशीको कुरा के छ भने तपाईंले धेरैजसो संवेदनशील र जटिल कार्यहरूलाई निश्चित पर्खाल पछाडि राख्न सक्नुहुन्छ, र API कल गर्दा गणना त्यहाँ हुन्छ। त्यसैले तपाईं यसलाई ह्यान्डल गर्न पूर्ण रूपमा LLM मा भर पर्नुहुन्न, र यसले धेरै मुख्य समस्याहरूलाई बेवास्ता गर्छ।
तर अझै पनि त्यस्ता परिस्थितिहरू छन् जहाँ, उदाहरणका लागि, कुनै खराब व्यक्तिले हस्तक्षेप गर्छ वा कसैले प्रणालीलाई भ्रमित पार्ने प्रयास गर्छ। हामीले देखेका छौं कि हामीले काम गर्ने धेरै प्रमुख ग्राहकहरूमा, तिनीहरूको सुरक्षा टोलीहरू प्रवेश गर्नेछन् र मूल रूपमा हाम्रा उत्पादनहरूमा "रातो टोली" परीक्षण गर्नेछन्, कमजोरीहरू पत्ता लगाउन प्रयास गर्न प्रणालीमा विभिन्न सम्भावित आक्रमणहरू सुरु गर्न हप्ताहरू लगातार बिताउँछन्। एआई एजेन्ट बढ्दो र अधिक लोकप्रिय हुँदै जाँदा, हामी यो धेरै पटक भएको देख्न सक्छौं, किनभने यो प्रणाली प्रभावकारी छ कि छैन भनेर परीक्षण गर्ने उत्तम तरिकाहरू मध्ये एक हो। यो रातो टोली परीक्षण मार्फत यसमा केहि फ्याँक्नु हो र यो प्रतिरक्षाहरू तोड्न सक्छ कि भनेर हेर्नु हो।
त्यहाँ स्टार्टअपहरू पनि छन् जसले रातो टोली उपकरणहरू विकास गरिरहेका छन् वा मानिसहरूलाई यस प्रकारका परीक्षणहरू आफैं गर्न सक्षम बनाइरहेका छन्, जुन हामीले अहिले देखिरहेका प्रवृत्ति हो। हामीले काम गर्ने धेरै कम्पनीहरूसँग, बिक्री चक्रको पछिल्लो चरणमा, तिनीहरूको सुरक्षा टोली हुनेछ, वा बाह्य टोलीसँग काम गर्नेछ, प्रणालीको तनाव परीक्षण गर्नेछ। हाम्रो लागि, त्यस्ता परीक्षणहरू पास गर्न सक्षम हुनु आवश्यक छ। त्यसैले, अन्ततः, यो त्यही हो जुन कुरामा आउँछ।
डेरिक ह्यारिस: के तपाईंले आफ्ना ग्राहकहरूलाई यो गर्न प्रोत्साहित गर्नुहुन्छ? किनभने जब हामी एआई नीतिहरूको बारेमा कुरा गर्छौं, हामी एउटा महत्त्वपूर्ण पक्षलाई उल्लेख गर्छौं, जुन अनुप्रयोग तह हो, र हामी राख्ने कुरामा जोड दिन्छौं द LLM का प्रयोगकर्ताहरू र अनुप्रयोग चलाउने व्यक्तिहरूमाथि जिम्मेवारी, केवल मोडेललाई दोष दिनुको सट्टा। भन्नुको अर्थ, ग्राहकहरूले OpenAI वा अन्य कम्पनीहरूद्वारा पहिले नै स्थापित सुरक्षा सुरक्षामा भर पर्नुको सट्टा रातो टोली परीक्षण सञ्चालन गर्नुपर्छ, विशिष्ट प्रयोगका केसहरू र आक्रमण मार्गहरू पहिचान गर्नुपर्छ, र कुन कमजोरीहरूलाई सुरक्षित गर्न आवश्यक छ भनेर निर्धारण गर्नुपर्छ।
जेसी झाङ: म पूर्ण रूपमा सहमत छु। मलाई लाग्छ कि सूचना आवश्यकताहरूको नयाँ लहर देखा पर्न सक्छ, जुन SOC 2 प्रमाणीकरण र HIPAA प्रमाणीकरण जस्तै हो जुन सबैले अहिले गरिरहेका छन्, जुन विभिन्न उद्योगहरूमा आवश्यक छ। सामान्यतया, जब तपाईं सामान्य SaaS उत्पादन बेच्नुहुन्छ, ग्राहकहरूलाई प्रवेश परीक्षणको आवश्यकता पर्दछ, र हामीले हाम्रो प्रवेश परीक्षण रिपोर्ट पनि प्रदान गर्नुपर्छ। AI एजेन्टको लागि, भविष्यमा समान आवश्यकताहरू हुन सक्छन्, र कसैले यसलाई नाम दिन सक्छ, तर यो मूल रूपमा एजेन्ट प्रणाली पर्याप्त शक्तिशाली छ कि छैन भनेर परीक्षण गर्ने नयाँ तरिका हो।
किम्बर्ली ट्यान: एउटा रोचक कुरा के छ भने, सबै ठूला प्रयोगशालाहरूले प्रस्तुत गरिरहेका नयाँ मोडेल सफलताहरू र प्राविधिक सफलताहरू बारे सबैजना धेरै उत्साहित छन्। एआई कम्पनीको रूपमा, तपाईं स्पष्ट रूपमा आफ्नै अनुसन्धान गर्नुहुन्न, तर तपाईंले त्यो अनुसन्धानलाई प्रयोग गर्नुहुन्छ र अन्तिम ग्राहकलाई डेलिभर गर्न यसको वरिपरि धेरै सफ्टवेयर निर्माण गर्नुहुन्छ।
तर तपाईंको काम द्रुत गतिमा परिवर्तनशील प्रविधिमा आधारित छ। म उत्सुक छु, एक लागू गरिएको एआई कम्पनीको रूपमा, तपाईं कसरी नयाँ प्राविधिक परिवर्तनहरूसँग अद्यावधिक रहनुहुन्छ र तिनीहरूले कम्पनीलाई कसरी असर गर्छ भनेर बुझ्नुहुन्छ, साथै तपाईंको आफ्नै उत्पादन रोडम्यापको भविष्यवाणी गर्न र प्रयोगकर्ताको आवश्यकताहरू निर्माण गर्न सक्षम हुनुहुन्छ? अझ व्यापक रूपमा, समान परिस्थितिहरूमा लागू गरिएको एआई कम्पनीहरूले कस्ता रणनीतिहरू अपनाउनु पर्छ?
जेसी झाङ: तपाईं वास्तवमा सम्पूर्ण स्ट्याकलाई विभिन्न भागहरूमा विभाजन गर्न सक्नुहुन्छ। उदाहरणका लागि, यदि तपाईंले अनुप्रयोग तह हेर्नुभयो भने LLM तल छ। तपाईंसँग बीचमा केही उपकरणहरू हुन सक्छन् जसले तपाईंलाई LLM व्यवस्थापन गर्न वा केही मूल्याङ्कन र त्यस्तै चीजहरू गर्न मद्दत गर्दछ। त्यसपछि, माथिल्लो भाग मूल रूपमा हामीले बनाएको हो, जुन वास्तवमा मानक SaaS जस्तै हो।
त्यसैले, हाम्रो धेरैजसो काम वास्तवमा नियमित सफ्टवेयर भन्दा त्यति फरक छैन, बाहेक हामीसँग एउटा अतिरिक्त अनुसन्धान घटक छ - LLM धेरै छिटो परिवर्तन हुन्छ। हामीले उनीहरूले के गर्न सक्छन्, उनीहरू केमा राम्रो छन्, र निश्चित कार्य गर्न कुन मोडेल प्रयोग गर्नुपर्छ भनेर अनुसन्धान गर्न आवश्यक छ। यो ठूलो मुद्दा हो किनभने OpenAI र Anthropic दुवैले नयाँ प्रविधिहरू सुरु गरिरहेका छन्, र Gemini पनि बिस्तारै सुधार गर्दैछ।
त्यसैले, कुन मोडेल कुन परिस्थितिमा प्रयोगको लागि उपयुक्त छ भनेर बुझ्नको लागि तपाईंसँग आफ्नै मूल्याङ्कन संयन्त्र हुनुपर्छ। कहिलेकाहीँ तपाईंलाई फाइन-ट्युन पनि गर्न आवश्यक पर्दछ, तर प्रश्न यो हो: कहिले फाइन-ट्युन गर्ने? फाइन-ट्युनिङ कहिले सार्थक हुन्छ? यी सम्भवतः LLM हरूसँग सम्बन्धित मुख्य अनुसन्धान मुद्दाहरू हुन् जसमा हामी ध्यान केन्द्रित गरिरहेका छौं। तर कम्तिमा अहिलेसम्म, हामीलाई लाग्दैन कि SaaS द्रुत रूपमा परिवर्तन भइरहेको छ, किनकि हामी मध्य तहमा निर्भर छैनौं। त्यसैले मूल रूपमा, यो LLM हरू हुन् जुन परिवर्तन भइरहेका छन्। तिनीहरू धेरै पटक परिवर्तन हुँदैनन्, र जब तिनीहरू हुन्छन्, यो सामान्यतया एक अपग्रेड हो। उदाहरणका लागि, क्लाउड 3.5 सोनेट केही महिना अघि अद्यावधिक गरिएको थियो, र त्यस समयमा हामीले सोच्यौं, "ठीक छ, के हामीले पुरानो प्रयोग गर्न जारी राख्नुको सट्टा नयाँ मोडेलमा स्विच गर्नुपर्छ?"
हामीले केवल मूल्याङ्कनको श्रृंखला चलाउन आवश्यक छ, र एकपटक हामीले नयाँ मोडेलमा स्विच गरेपछि, हामी अब यसको बारेमा सोच्दैनौं किनभने तपाईं पहिले नै नयाँ मोडेल प्रयोग गर्दै हुनुहुन्छ। त्यसपछि, o1 संस्करण आयो, र परिस्थिति समान थियो। यसलाई कहाँ प्रयोग गर्न सकिन्छ भनेर सोच्नुहोस्। हाम्रो मामलामा, o1 धेरैजसो ग्राहक-अनुहार प्रयोग केसहरूको लागि अलि ढिलो छ, त्यसैले हामी यसलाई केही पृष्ठभूमि कार्यको लागि प्रयोग गर्न सक्छौं। अन्ततः, हामीसँग मोडेल अनुसन्धानको लागि राम्रो प्रणाली हुनु आवश्यक छ।
किम्बर्ली ट्यान: तपाईं कति पटक नयाँ मोडेलको मूल्याङ्कन गर्नुहुन्छ र त्यसलाई प्रतिस्थापन गर्ने कि नगर्ने भनेर निर्णय गर्नुहुन्छ?
जेसी झाङ: हामी हरेक पटक नयाँ मोडेल आउँदा मूल्याङ्कन गर्छौं। तपाईंले नयाँ मोडेल स्मार्ट भए पनि, तपाईंले पहिले नै निर्माण गरिसक्नुभएका केही प्रयोगका केसहरू तोड्न नदिने कुरा सुनिश्चित गर्नुपर्छ। यो हुन सक्छ। उदाहरणका लागि, नयाँ मोडेल समग्रमा स्मार्ट हुन सक्छ, तर केही चरम अवस्थामा, यसले तपाईंको कार्यप्रवाहहरू मध्ये एकमा A/B छनोटमा खराब प्रदर्शन गर्छ। हामी त्यसको लागि मूल्याङ्कन गर्छौं।
मलाई लाग्छ समग्रमा, हामीले सबैभन्दा बढी ख्याल गर्ने बुद्धिमत्तालाई म "निर्देशन पालना गर्ने क्षमता" भन्नेछु। हामी निर्देशनहरू पालना गर्ने मोडेल अझ राम्रो र राम्रो हुँदै जाओस् भन्ने चाहन्छौं। यदि त्यसो हो भने, यो निश्चित रूपमा हाम्रो लागि लाभदायक छ, र त्यो धेरै राम्रो छ।
यस्तो देखिन्छ कि हालैका अनुसन्धानहरूले तर्क समावेश गर्ने बुद्धिमत्ताको प्रकारमा बढी ध्यान केन्द्रित गरेको छ, जस्तै राम्रो प्रोग्रामिङ र राम्रो गणितीय सञ्चालन। यसले हामीलाई पनि मद्दत गर्छ, तर यो निर्देशन पालना गर्ने क्षमताको सुधार जत्तिकै महत्त्वपूर्ण छैन।
किम्बर्ली ट्यान: तपाईंले उल्लेख गर्नुभएको एउटा धेरै रोचक बुँदा, र मलाई लाग्छ कि यो डेकागनको लागि पनि धेरै अनौठो छ, त्यो हो कि तपाईंले प्रदान गर्नुभएको परीक्षणहरूको सेट अन्तर्गत प्रत्येक मोडेलले कसरी प्रदर्शन गरिरहेको छ भनेर तपाईंलाई थाहा छ भनेर सुनिश्चित गर्न तपाईंले घरभित्र धेरै मूल्याङ्कन पूर्वाधार निर्माण गर्नुभएको छ।
के तपाईं यसको बारेमा विस्तृत रूपमा बताउन सक्नुहुन्छ? यो आन्तरिक मूल्याङ्कन पूर्वाधार कत्तिको महत्त्वपूर्ण छ, र विशेष गरी यसले तपाईं र तपाईंका ग्राहकहरूलाई एजेन्टको कार्यसम्पादनमा कसरी विश्वास दिन्छ? किनभने यीमध्ये केही मूल्याङ्कनहरू ग्राहकमुखी पनि छन्।
जेसी झाङ: मलाई लाग्छ यो धेरै महत्त्वपूर्ण छ, किनकि यो मूल्याङ्कन पूर्वाधार बिना, हामीलाई छिटो दोहोर्याउन धेरै गाह्रो हुनेछ।
यदि तपाईंलाई लाग्छ कि प्रत्येक परिवर्तनले केही बिग्रने उच्च सम्भावना छ भने, तपाईंले छिटो परिवर्तन गर्नुहुने छैन। तर यदि तपाईंसँग मूल्याङ्कन संयन्त्र छ भने, जब कुनै ठूलो परिवर्तन हुन्छ, मोडेल अपडेट हुन्छ, वा केहि नयाँ आउँछ, तपाईं यसलाई सबै मूल्याङ्कन परीक्षणहरूसँग सिधै तुलना गर्न सक्नुहुन्छ। यदि मूल्याङ्कन नतिजा राम्रो छ भने, तपाईं महसुस गर्न सक्नुहुन्छ: ठीक छ, हामीले सुधार गरेका छौं, वा तपाईं धेरै चिन्ता नगरी आत्मविश्वासका साथ यसलाई जारी गर्न सक्नुहुन्छ।
त्यसैले, हाम्रो क्षेत्रमा, मूल्याङ्कनका लागि ग्राहकको सुझाव आवश्यक पर्दछ, किनकि ग्राहकले नै कुनै कुरा सही छ कि छैन भनेर निर्णय गर्छ। अवश्य पनि, हामी केही उच्च-स्तरीय मुद्दाहरू जाँच गर्न सक्छौं, तर सामान्यतया ग्राहकले विशिष्ट प्रयोगका केसहरू प्रदान गर्दछ र हामीलाई सही उत्तर के हो, वा यो के हुनुपर्छ, यसले कुन स्वर कायम राख्नुपर्छ, के भन्नुपर्छ भनेर बताउँछ।
मूल्याङ्कन यसैमा आधारित छ। त्यसैले हामीले हाम्रो मूल्याङ्कन प्रणाली पर्याप्त बलियो छ भनी सुनिश्चित गर्नुपर्छ। सुरुमा, हामीले यसलाई आफैंले निर्माण गरेका थियौं, र यसलाई कायम राख्न त्यति गाह्रो छैन। हामीलाई यो पनि थाहा छ कि केही मूल्याङ्कन कम्पनीहरू छन्, र हामीले ती मध्ये केहीको अन्वेषण गरेका छौं। सायद कुनै समयमा, हामी तिनीहरूलाई अपनाउने कि नगर्ने भनेर विचार गर्नेछौं, तर अहिलेको लागि, मूल्याङ्कन प्रणाली अब हाम्रो लागि पीडादायी बिन्दु रहेन।
किम्बर्ली ट्यान: आजकल धेरै लोकप्रिय विषय भनेको बहु-मोडालिटी हो, जसको अर्थ एआई एजेन्टहरूले आज मानिसहरूले प्रयोग गर्ने सबै रूपहरूमा अन्तरक्रिया गर्न सक्षम हुनुपर्छ, चाहे त्यो पाठ, भिडियो, आवाज, आदि होस्। मलाई थाहा छ कि डेकागन पाठ-आधारित रूपमा सुरु भएको थियो। तपाईंको दृष्टिकोणबाट, कति महत्त्वपूर्ण छ बहुविधता हो एआई एजेन्टहरूलाई? यसलाई मुख्यधारा वा मानक बनाउन कति समय लाग्छ?
जेसी झाङ: यो महत्त्वपूर्ण छ, र कम्पनीको दृष्टिकोणबाट, नयाँ मोडालिटी थप्न विशेष गाह्रो छैन। यो सरल छैन, तर मूल कुरा यो हो: यदि तपाईंले अन्य समस्याहरू समाधान गर्नुभयो भने, जस्तै मैले उल्लेख गरेका - उदाहरणका लागि, एआई निर्माण गर्ने, यसको अनुगमन गर्ने र सही तर्क राख्ने - तब नयाँ मोडालिटी थप्नु सबैभन्दा गाह्रो काम होइन। त्यसैले हाम्रो लागि, सबै मोडालिटीहरू हुनु धेरै अर्थपूर्ण हुन्छ, र यसले हाम्रो बजार विस्तार गर्दछ। हामी मूल रूपमा मोडालिटी अज्ञेयवादी हौं, र हामी प्रत्येक मोडालिटीको लागि आफ्नै एजेन्ट निर्माण गर्छौं।
सामान्यतया, दुई सीमित कारकहरू छन्: पहिलो, के ग्राहक नयाँ मोडालिटी अपनाउन तयार छन्? मलाई लाग्छ कि टेक्स्टबाट सुरु गर्नु धेरै अर्थपूर्ण छ, किनकि मानिसहरूले सबैभन्दा सक्रिय रूपमा अपनाउने तरिका यही हो, र यो उनीहरूको लागि कम जोखिमपूर्ण, निगरानी गर्न सजिलो र बुझ्न सजिलो छ। अर्को ठूलो मोडालिटी आवाज हो। स्पष्ट रूपमा, मलाई लाग्छ बजारमा अझै ठाउँ छ, र आवाजको प्रयोगकर्ता स्वीकृति अझै सुधार गर्न आवश्यक छ। यस समयमा, हामी केही प्रारम्भिक अपनाउनेहरू देखिरहेका छौं जसले भ्वाइस एजेन्टहरू अपनाउन थालेका छन्, जुन धेरै रोमाञ्चक छ। अर्को पक्ष प्राविधिक चुनौतीहरू हुन्। धेरैजसो मानिसहरू सहमत हुनेछन् कि आवाजको लागि बार उच्च सेट गरिएको छ। यदि तपाईं फोनमा कसैसँग कुरा गर्दै हुनुहुन्छ भने, तपाईंलाई धेरै छोटो आवाज विलम्बता चाहिन्छ। यदि तपाईंले कसैलाई बाधा पुर्याउनुभयो भने, तिनीहरूले स्वाभाविक रूपमा प्रतिक्रिया दिन आवश्यक छ।
बोलीको विलम्बता कम भएकोले, तपाईंले गणना गर्ने तरिकामा बढी चलाखी अपनाउनुपर्छ। यदि तपाईं च्याटमा हुनुहुन्छ र प्रतिक्रिया समय पाँच देखि आठ सेकेन्ड छ भने, तपाईंले यसलाई मुश्किलले याद गर्नुहुन्छ र यो धेरै स्वाभाविक लाग्छ। तर यदि फोनमा प्रतिक्रिया दिन पाँच देखि आठ सेकेन्ड लाग्छ भने, यो अलि अप्राकृतिक लाग्छ। त्यसैले बोलीमा धेरै प्राविधिक चुनौतीहरू छन्। यी प्राविधिक चुनौतीहरू समाधान हुँदै जाँदा र बजारमा बोली अपनाउने रुचि बढ्दै जाँदा, नयाँ मोडालिटीको रूपमा बोली मुख्यधारा बन्नेछ।
विश्वासभन्दा माथि उठ्ने व्यापार मोडेल
किम्बर्ली ट्यान: हामी अगाडि बढ्नु अघि, म एआई एजेन्ट व्यापार मोडेलको बारेमा अलि बढी कुरा गर्न चाहन्छु। जब तपाईं पहिलो पटक निर्माण गरिएको एआई एजेन्ट वा ग्राहकहरूसँग उनीहरूले प्रयोग गर्ने प्रणाली, उनीहरूले प्रशोधन गर्ने डेटा र उनीहरूका सरोकारहरूबारे छलफल गर्दा, के त्यहाँ त्यस्तो केही थियो जसले तपाईंलाई अचम्मित पार्यो? इन्टरप्राइज ग्राहकहरूलाई राम्रो सेवा दिन डेकागनले गर्नुपर्ने केही गैर-सहज वा आश्चर्यजनक कामहरू के के हुन्?
जेसी झाङ: मलाई लाग्छ सबैभन्दा अचम्मको कुरा के थियो भने हामीले सुरुमा काम सुरु गर्दा मानिसहरू हामीसँग कति हदसम्म कुरा गर्न इच्छुक थिए। आखिर, हामी दुई जना मात्र थियौं। हामीले पहिले दुवैले कम्पनीहरू सुरु गरेका थियौं, त्यसैले हामी धेरै मानिसहरूलाई चिन्थ्यौं, तर तैपनि, प्रत्येक उद्यमीको लागि, जब तपाईं रेफरल कुराकानी गर्न चाहनुहुन्छ, यदि तपाईंले भनिरहनुभएको कुरा विशेष रूपमा आकर्षक छैन भने, कुराकानी सामान्यतया धेरै हल्का हुन्छ।
तर जब हामीले यो प्रयोगको बारेमा कुरा गर्न थाल्यौं, मलाई वास्तवमा यो कुरा सुनेर मानिसहरू कति उत्साहित थिए भन्ने कुरा अचम्म लाग्यो। किनभने यो विचार यति स्पष्ट देखिन्छ। तपाईंलाई लाग्न सक्छ कि यो यति स्पष्ट विचार भएकोले, अरू कसैले यो पहिले नै गरिसकेको हुनुपर्छ, वा पहिले नै समाधान हुनुपर्छ, वा अरू कसैले पहिले नै कुनै प्रकारको समाधान लिएर आएको हुनुपर्छ। तर मलाई लाग्छ कि हामीले राम्रो क्षण समात्यौं, त्यो प्रयोगको केस साँच्चै ठूलो छ र मानिसहरूले यसको बारेमा साँच्चै ख्याल राख्छन्। मैले पहिले भनेझैं, त्यो प्रयोगको केस एआई एजेन्ट लिन र यसलाई उत्पादनमा धकेल्न साँच्चै उपयुक्त छ, किनकि तपाईं यसलाई क्रमिक रूपमा लागू गर्न सक्नुहुन्छ र ROI ट्र्याक गर्न सक्षम हुन सक्नुहुन्छ।
त्यो मेरो लागि सुखद आश्चर्य थियो, तर त्यसपछि धेरै काम गर्न बाँकी छ, तपाईंले ग्राहकहरूसँग काम गर्नुपर्छ, तपाईंले उत्पादन निर्माण गर्नुपर्छ, तपाईंले कुन बाटो जाने भनेर पत्ता लगाउनुपर्छ। सुरुवाती चरणमा, यो साँच्चै अचम्मको खोज थियो।
डेरिक ह्यारिस: किम्बर्ली, मलाई लाग्छ कि मैले तपाईंले लेखेको ब्लग पोस्ट, RIP to RPA, उल्लेख गर्नुपर्छ, जसले धेरै कुराहरूलाई छुन्छ द स्वचालन कार्यहरू र स्टार्टअपहरू।के तपाईंलाई लाग्छ कि त्यहाँ कुनै यस्तो घटना छ जहाँ यी स्वचालित कार्यहरू, वा समाधानहरू, त्यति आदर्श छैनन्, त्यसैले मानिसहरू सधैं राम्रो तरिका खोजिरहेका हुन्छन्?
किम्बर्ली ट्यान: हो, मलाई त्यस्तै लाग्छ। म केही कुरा भन्न चाहन्छु। पहिलो, यदि कुनै विचार सबैलाई स्पष्ट छ, तर त्यसलाई समाधान गर्न कुनै स्पष्ट कम्पनी छैन, वा कसैले पनि कुनै कम्पनीलाई औंल्याउँदै "तपाईंले यो प्रयोग गर्नुपर्छ" भन्दैन भने यसको अर्थ समस्या वास्तवमा समाधान भएको छैन।
एक अर्थमा, यो कम्पनीको लागि समाधान विकास गर्ने पूर्ण रूपमा खुला अवसर हो। किनकि, तपाईंले भन्नुभएझैं, हामी सुरुदेखि नै लगानीकर्ताको रूपमा डेकागनलाई पछ्याउँदै आएका छौं। हामीले उनीहरूलाई रचनात्मक भूलभुलैयामा नेभिगेट गरेको हेरेका छौं, र जब उनीहरूले यस दिशामा जाने निर्णय गरे र ग्राहकहरूसँग कुरा गर्न थाले, यो स्पष्ट भयो कि सबै ग्राहकहरू कुनै न कुनै प्रकारको नेटिभ एआई-सक्षम समाधानको लागि हताश थिए। यो मैले पहिले उल्लेख गरेको समस्याहरू मध्ये एक हो, जहाँ धेरै मानिसहरूलाई लाग्छ कि यो केवल एक GPT र्यापर हो। तर डेकागनले सुरुदेखि नै प्राप्त गरेको ग्राहकको चासोले हामीलाई सुरुमै महसुस गराएको छ कि यी धेरै समस्याहरू मानिसहरूले अपेक्षा गरेभन्दा धेरै जटिल छन्।
मलाई लाग्छ यो घटना सबै उद्योगहरूमा भइरहेको छ, चाहे त्यो ग्राहक सेवा होस् वा केही ठाडो क्षेत्रमा व्यावसायिक स्वचालन। मलाई लाग्छ कि कम मूल्याङ्कन गरिएको एउटा बुँदा भनेको जेसीले पहिले उल्लेख गरेझैं, स्वचालन कार्यहरूको लगानीमा प्रतिफल (ROI) स्पष्ट रूपमा मापन गर्न सक्षम हुनु हो। किनभने, यदि तपाईं कसैलाई एआई एजेन्ट स्वीकार गराउन जाँदै हुनुहुन्छ भने, तिनीहरूले वास्तवमा "विश्वासको छलांग" लिइरहेका हुन्छन् किनभने यो धेरै मानिसहरूको लागि धेरै अपरिचित क्षेत्र हो।
यदि तपाईंले एउटा धेरै विशिष्ट प्रक्रियालाई स्वचालित गर्न सक्नुहुन्छ जुन या त स्पष्ट राजस्व उत्पन्न गर्ने प्रक्रिया हो, वा व्यवसायमा पहिले अवरोधको रूपमा रहेको प्रक्रिया हो, वा ग्राहक वृद्धि वा राजस्व वृद्धिसँगै रेखीय रूपमा बढ्दै जाने प्रमुख लागत केन्द्र हो, तब एआई एजेन्टको लागि स्वीकृति प्राप्त गर्न सजिलो हुनेछ। यस्ता समस्याहरूलाई परम्परागत सफ्टवेयर जस्तै मापन गर्न सकिने थप उत्पादक प्रक्रियामा परिणत गर्ने क्षमता धेरै आकर्षक छ।
किम्बर्ली ट्यान: हामी अगाडि बढ्नु अघि मेरो एउटा अन्तिम प्रश्न छ। मलाई याद छ, जेसीले हाम्रा अघिल्ला छलफलहरूमा सधैं भन्ने गर्थे कि सफ्टवेयर वा एआई एजेन्टहरू अपनाउने कम्पनीहरूको लागि सबैभन्दा ठूलो चुनौती भ्रम हुनेछ। तर तपाईंले एक पटक मलाई भन्नुभएको थियो कि यो वास्तवमा मुख्य समस्या होइन। भ्रमको धारणा किन केही हदसम्म भ्रामक छ र मानिसहरू वास्तवमा के बारे बढी चिन्तित छन् भन्ने बारेमा के तपाईं विस्तृत रूपमा बताउन सक्नुहुन्छ?
जेसी झाङ: मलाई लाग्छ मानिसहरूलाई भ्रमको वास्ता छ, तर तिनीहरूले प्रदान गर्न सक्ने मूल्यको बारेमा बढी चिन्तित छन्। हामीसँग काम गर्ने लगभग सबै कम्पनीहरू उही केही मुद्दाहरूमा केन्द्रित छन्, लगभग ठ्याक्कै उस्तै: तपाईंले कति प्रतिशत कुराकानीहरू समाधान गर्न सक्नुहुन्छ? मेरा ग्राहकहरू कति सन्तुष्ट हुनुहुन्छ? त्यसपछि भ्रमको मुद्दालाई तेस्रो श्रेणीको रूपमा वर्गीकृत गर्न सकिन्छ, अर्थात् यो कति सही छ। सामान्यतया, मूल्याङ्कन गर्दा पहिलो दुई कारकहरू बढी महत्त्वपूर्ण हुन्छन्।
मानौं तपाईं नयाँ व्यवसायसँग कुरा गर्दै हुनुहुन्छ र तपाईंले पहिलो दुई कारकहरूमा साँच्चै राम्रो काम गर्नुभएको छ, र तपाईंले नेतृत्व र टोलीका सबैबाट धेरै समर्थन पाउनुभएको छ। तिनीहरू भन्छन्, "हे भगवान, हाम्रो ग्राहक अनुभव फरक छ। अब प्रत्येक ग्राहकको आफ्नै व्यक्तिगत सहायक छ जसले हामीलाई जुनसुकै बेला सम्पर्क गर्न सक्छ। हामीले तिनीहरूलाई उत्कृष्ट जवाफ दिएका छौं, तिनीहरू धेरै सन्तुष्ट छन्, र यो बहुभाषी छ र २४/७ उपलब्ध छ।" त्यो यसको अंश मात्र हो, र तपाईंले धेरै पैसा पनि बचत गर्नुभएको छ।
त्यसैले एकचोटि तपाईंले ती लक्ष्यहरू प्राप्त गर्नुभयो भने, तपाईंले कामलाई अगाडि बढाउन धेरै समर्थन र धेरै टेलविन्डहरू प्राप्त गर्नुहुन्छ। अवश्य पनि, भ्रमको समस्या अन्ततः समाधान गर्न आवश्यक छ, तर यो उनीहरूलाई सबैभन्दा बढी चिन्तित गर्ने कुरा होइन। भ्रम समाधान गर्ने तरिका मैले पहिले उल्लेख गरेको तरिका हो - मानिसहरूले तपाईंलाई परीक्षण गर्नेछन्। त्यहाँ अवधारणाको प्रमाण चरण हुन सक्छ जहाँ तपाईं वास्तवमा वास्तविक कुराकानीहरू चलाउनुहुन्छ र तिनीहरूसँग टोली सदस्यहरूले शुद्धताको लागि निगरानी र जाँच गर्छन्। यदि त्यो राम्रो भयो भने, यो सामान्यतया पार हुन्छ।
साथै, मैले पहिले उल्लेख गरेझैं, तपाईंले संवेदनशील जानकारीको लागि केही कडा सुरक्षा उपायहरू सेट अप गर्न सक्नुहुन्छ, जस्तै तपाईंले संवेदनशील सामग्रीलाई सामान्य बनाउनु आवश्यक पर्दैन। त्यसैले भ्रम मुद्दा धेरैजसो लेनदेनमा छलफलको बिन्दु हो। यो महत्वहीन विषय होइन। तपाईं यो प्रक्रियाबाट जानुहुनेछ, तर यो कहिल्यै कुराकानीको केन्द्रबिन्दु हुँदैन।
किम्बर्ली ट्यान: अब एआई एजेन्टको व्यापार मोडेलतिर लागौं। आज, यी एआई एजेन्टहरूको मूल्य कसरी निर्धारण गर्ने भन्ने बारेमा एउटा ठूलो विषय छ।
ऐतिहासिक रूपमा, धेरै SaaS सफ्टवेयरहरूको मूल्य सिट संख्या अनुसार निर्धारण गरिन्छ किनभने तिनीहरू कार्यप्रवाह सफ्टवेयर हुन् जसले व्यक्तिगत कर्मचारीहरूलाई लक्षित गर्दछ र कर्मचारी उत्पादकता सुधार गर्न प्रयोग गरिन्छ। यद्यपि, एआई एजेन्ट परम्परागत सफ्टवेयर जस्तै व्यक्तिगत कर्मचारीहरूको उत्पादकतासँग जोडिएको छैन।
धेरै मानिसहरू सोच्छन् कि सिट संख्याको आधारमा मूल्य निर्धारण विधि अब लागू नहुन सक्छ। म उत्सुक छु कि कसरी तपाईंले सुरुवाती दिनहरूमा यो दुविधाको बारेमा सोच्नुभयो र अन्ततः डेकागनको मूल्य कसरी निर्धारण गर्नुभयो? साथै, एआई एजेन्ट बढ्दो रूपमा सामान्य हुँदै जाँदा सफ्टवेयर मूल्य निर्धारणको भविष्यको प्रवृत्ति के हुनेछ जस्तो तपाईंलाई लाग्छ?
जेसी झाङ: यस विषयमा हाम्रो विचार यो हो कि विगतमा, सफ्टवेयरको मूल्य प्रति सिट थियो किनभने यसको स्केल लगभग सफ्टवेयर प्रयोग गर्न सक्ने व्यक्तिहरूको संख्यामा आधारित थियो। तर धेरैजसो एआई एजेन्टहरूको लागि, तपाईंले प्रदान गर्नुभएको मूल्य यसलाई कायम राख्ने व्यक्तिहरूको संख्यामा निर्भर गर्दैन, बरु उत्पादन गरिएको कामको मात्रामा निर्भर गर्दछ। यो मैले पहिले उल्लेख गरेको बुँदासँग मेल खान्छ: यदि लगानीमा प्रतिफल (ROI) धेरै मापनयोग्य छ भने, कामको उत्पादनको स्तर पनि धेरै स्पष्ट हुन्छ।
हाम्रो विचारमा सिट संख्याका आधारमा मूल्य निर्धारण निश्चित रूपमा लागू हुँदैन। तपाईंले कामको आउटपुटको आधारमा मूल्य निर्धारण गर्न सक्नुहुन्छ। त्यसैले, तपाईंले प्रस्ताव गर्ने मूल्य निर्धारण मोडेल यस्तो हुनुपर्छ कि जति धेरै काम गरिन्छ, त्यति नै बढी भुक्तानी गरिन्छ।
हाम्रो लागि, मूल्य निर्धारण गर्ने दुई स्पष्ट तरिकाहरू छन्। तपाईं या त कुराकानीहरूको मूल्य निर्धारण गर्न सक्नुहुन्छ, वा तपाईं AI ले वास्तवमा समाधान गर्ने कुराकानीहरूको मूल्य निर्धारण गर्न सक्नुहुन्छ। मलाई लाग्छ हामीले सिकेको एउटा रोचक पाठ यो हो कि धेरैजसो मानिसहरूले कुराकानी-मूल्य निर्धारण मोडेल रोजे। कारण यो हो कि समाधानद्वारा मूल्य निर्धारणको मुख्य फाइदा भनेको तपाईंले केको लागि तिर्नुहुन्छ द एआईले गर्छ।
तर त्यसपछि आउने प्रश्न यो हो कि, "समाधान" के मानिन्छ? सबैभन्दा पहिले, कोही पनि यसमा गहिरिएर जान चाहँदैनन्, किनकि कुरा यस्तो हुन्छ, "यदि कोही रिसाएर आयो र तपाईंले उसलाई पठाउनुभयो भने, हामीले त्यसको लागि किन तिर्ने?"
यसले असहज परिस्थिति सिर्जना गर्छ र एआई प्रदायकहरूको लागि प्रोत्साहनलाई पनि अलि अनौठो बनाउँछ, किनकि समाधानद्वारा बिलिङको अर्थ, "हामीले सकेसम्म धेरै कुराकानीहरू समाधान गर्न र केही मानिसहरूलाई टाढा धकेल्न आवश्यक छ।" तर धेरै केसहरू छन् जहाँ समस्यालाई टाढा धकेल्नुको सट्टा बढाउनु राम्रो हुन्छ, र ग्राहकहरूलाई यस प्रकारको ह्यान्डलिङ मन पर्दैन। त्यसकारण, कुराकानीद्वारा बिलिङले थप सरलता र भविष्यवाणी गर्ने क्षमता ल्याउनेछ।
किम्बर्ली ट्यान: भविष्यको मूल्य निर्धारण मोडेल कति समय टिक्छ जस्तो तपाईंलाई लाग्छ?किनभने अहिले जब तपाईं ROI को कुरा गर्नुहुन्छ, यो सामान्यतया विगतको खर्चमा आधारित हुन्छ जुन श्रम लागतहरू कभर गर्न प्रयोग गरिएको हुन सक्छ। AI एजेन्टहरू सामान्य हुँदै जाँदा, के तपाईंलाई लाग्छ कि दीर्घकालीन रूपमा, AI लाई श्रम लागतसँग तुलना गरिनेछ र यो उपयुक्त बेन्चमार्क हो? यदि होइन भने, तपाईं श्रम लागतभन्दा बाहिरको दीर्घकालीन मूल्य निर्धारण कसरी देख्नुहुन्छ?
जेसी झाङ: मलाई लाग्छ कि लामो अवधिमा, एआई एजेन्ट मूल्य निर्धारण अझै पनि मुख्यतया श्रम लागतसँग जोडिएको हुन सक्छ, किनभने त्यो एजेन्टको सुन्दरता हो - सेवाहरूमा तपाईंको पहिलेको खर्च अब सफ्टवेयरमा सार्न सकिन्छ।
खर्चको यो भाग सफ्टवेयर खर्चको १० देखि १०० गुणा हुन सक्छ, त्यसैले धेरैजसो लागत सफ्टवेयरमा सर्नेछ। त्यसकारण, श्रम लागत स्वाभाविक रूपमा एक बेन्चमार्क बन्नेछ। हाम्रा ग्राहकहरूको लागि, ROI धेरै स्पष्ट छ। यदि तपाईं श्रम लागतमा X मिलियन बचत गर्न सक्नुहुन्छ भने, यो समाधान अपनाउनु अर्थपूर्ण हुन्छ। तर लामो समयसम्म, यो मध्य मैदानमा हुन सक्छ।
किनभने हाम्रो एजेन्ट जत्तिकै राम्रो नभएका केही उत्पादनहरूले पनि कम मूल्य स्वीकार गर्नेछन्। यो क्लासिक SaaS अवस्था जस्तै हो, जहाँ सबैजना बजार हिस्साको लागि प्रतिस्पर्धा गरिरहेका छन्।
किम्बर्ली ट्यान: तपाईंलाई के लाग्छ हालका SaaS कम्पनीहरूको भविष्य कस्तो छ, विशेष गरी ती कम्पनीहरूका लागि जसका उत्पादनहरू AI को लागि नेटिभ रूपमा निर्माण गरिएका नहुन सक्छन् वा जसको मूल्य प्रति सिट हुन्छ र त्यसैले परिणाम-उन्मुख मूल्य निर्धारण मोडेलमा अनुकूलन गर्न सक्दैनन्?
जेसी झाङ: केही परम्परागत कम्पनीहरूका लागि, यदि तिनीहरूले एआई एजेन्ट उत्पादन सुरु गर्ने प्रयास गर्छन् भने यो साँच्चै अलि गाह्रो हुन्छ किनभने तिनीहरूले सिट मोडेल प्रयोग गरेर यसको मूल्य निर्धारण गर्न सक्दैनन्। यदि तपाईंलाई अब धेरै एजेन्टहरू आवश्यक पर्दैन भने, अवस्थित उत्पादनबाट राजस्व कायम राख्न गाह्रो हुन्छ। यो परम्परागत कम्पनीहरूको लागि समस्या हो, तर यो भन्न गाह्रो छ। परम्परागत कम्पनीहरूसँग सधैं वितरण च्यानलहरूको फाइदा हुन्छ। उत्पादन नयाँ कम्पनी जत्तिकै राम्रो नभए पनि, मानिसहरू केवल 80% गुणस्तरको साथ नयाँ आपूर्तिकर्ता स्वीकार गर्न प्रयास खर्च गर्न हिचकिचाउँछन्।
त्यसोभए, पहिले, यदि तपाईं हामी जस्तै स्टार्टअप हुनुहुन्छ भने, तपाईंले आफ्नो उत्पादन परम्परागत उत्पादन भन्दा तीन गुणा राम्रो छ भनी सुनिश्चित गर्नुपर्छ। दोस्रो, यो परम्परागत कम्पनीहरू र स्टार्टअपहरू बीचको एक विशिष्ट प्रतिस्पर्धा हो। परम्परागत कम्पनीहरूमा स्वाभाविक रूपमा कम जोखिम सहनशीलता हुन्छ किनभने तिनीहरूसँग ठूलो संख्यामा ग्राहकहरू हुन्छन्। यदि तिनीहरूले द्रुत पुनरावृत्तिमा गल्ती गर्छन् भने, यसले ठूलो नोक्सान निम्त्याउँछ। यद्यपि, स्टार्टअपहरू छिटो पुनरावृत्ति गर्न सक्छन्, त्यसैले पुनरावृत्ति प्रक्रिया आफैंले राम्रो उत्पादनमा लैजान सक्छ। यो सामान्य चक्र हो। हाम्रो लागि, हामी सधैं हाम्रो डेलिभरीको गति, उत्पादन गुणस्तर र हाम्रो टोलीको कार्यान्वयनमा गर्व गर्छौं। यही कारणले गर्दा हामीले हालको सम्झौता जितेका छौं।
किम्बर्ली ट्यान: के तपाईं कार्यस्थलमा एआईको भविष्यको बारेमा केही भविष्यवाणी गर्न सक्नुहुन्छ? उदाहरणका लागि, यसले कर्मचारीको आवश्यकता वा क्षमताहरूमा कसरी परिवर्तन ल्याउनेछ, वा मानव कर्मचारीहरू र एआई एजेन्टहरूले कसरी अन्तरक्रिया गर्छन्?एआई एजेन्टहरू व्यापक हुँदै जाँदा कार्यस्थलमा कुन नयाँ उत्कृष्ट अभ्यासहरू वा मान्यताहरू सामान्य बन्दै जानेछन् जस्तो तपाईंलाई लाग्छ?
जेसी झाङ: पहिलो र सबैभन्दा महत्त्वपूर्ण परिवर्तन यो हो कि हामी विश्वस्त छौं कि भविष्यमा, कर्मचारीहरूले एआई पर्यवेक्षकहरूको भूमिका जस्तै कार्यस्थलमा एआई एजेन्टहरू निर्माण र व्यवस्थापनमा धेरै समय बिताउनेछन्। तपाईंको पद आधिकारिक रूपमा "एआई सुपरिवेक्षक" नभए पनि, तपाईंले आफ्नो काम गर्न बिताउनुभएको धेरैजसो समय यी एजेन्टहरूको व्यवस्थापनमा सर्नेछ, किनभने एजेन्टहरूले तपाईंलाई धेरै लाभ दिन सक्छन्।
हामीले यो धेरै तैनातीहरूमा देखेका छौं जहाँ पहिले टोली नेता रहेका मानिसहरूले अहिले एआईको निगरानीमा धेरै समय बिताउँछन्, उदाहरणका लागि, यसमा समस्या भइरहेको छैन भनेर सुनिश्चित गर्न वा समायोजन गर्न। तिनीहरूले समग्र कार्यसम्पादनको निगरानी गर्छन् कि ध्यान दिनुपर्ने विशेष क्षेत्रहरू छन् कि छैनन्, ज्ञानको आधारमा कुनै खाडलहरू छन् कि छैनन् जसले एआईलाई राम्रो बनाउन मद्दत गर्न सक्छ, र एआईले ती खाडलहरू भर्न सक्छ कि सक्दैन भनेर हेर्न।
एजेन्टसँग काम गर्दा आउने कामले भविष्यमा कर्मचारीहरूले एआई एजेन्टहरूसँग अन्तरक्रिया गर्नमा धेरै समय बिताउनेछन् भन्ने धारणा दिन्छ। मैले पहिले भनेझैं यो हाम्रो कम्पनीको मूल अवधारणा हो। त्यसकारण, हाम्रो सम्पूर्ण उत्पादन मानिसहरूलाई उपकरणहरू, दृश्यावलोकन, व्याख्यायोग्यता, र नियन्त्रण प्रदान गर्ने वरिपरि निर्मित छ। मलाई लाग्छ एक वर्ष भित्र, यो एउटा ठूलो प्रवृत्ति बन्नेछ।
किम्बर्ली ट्यान: यो धेरै अर्थपूर्ण छ। भविष्यमा एआई सुपरिवेक्षकहरूलाई कस्ता क्षमताहरू चाहिन्छ जस्तो तपाईंलाई लाग्छ? यो भूमिकाको लागि कस्ता सीपहरू चाहिन्छ?
जेसी झाङ: यसका दुई पक्ष छन्। एउटा अवलोकनयोग्यता र व्याख्यायोग्यता हो, एआईले के गरिरहेको छ र यसले कसरी निर्णय लिन्छ भनेर द्रुत रूपमा बुझ्ने क्षमता। अर्को निर्णय लिने क्षमता, वा निर्माण भाग, प्रतिक्रिया कसरी दिने र नयाँ तर्क कसरी निर्माण गर्ने भन्ने हो। मलाई लाग्छ यी दुई एउटै सिक्काका दुई पाटा हुन्।
किम्बर्ली ट्यान: तपाईंलाई के लाग्छ मध्यम वा दीर्घकालीन रूपमा एआई एजेन्टको क्षमताभन्दा बाहिरका कस्ता कार्यहरू रहनेछन् र अझै पनि मानिसहरूद्वारा सही रूपमा व्यवस्थापन र सञ्चालन गर्न आवश्यक पर्नेछ?
जेसी झाङ: मलाई लाग्छ यो मुख्यतया मैले पहिले उल्लेख गरेको "पूर्णता" को आवश्यकतामा निर्भर गर्नेछ। धेरै कार्यहरू छन् जसमा त्रुटिको लागि धेरै कम सहनशीलता हुन्छ। यी अवस्थाहरूमा, कुनै पनि एआई उपकरण पूर्ण रूपमा विकसित एजेन्ट भन्दा बढी सहयोगी हुन्छ।
उदाहरणका लागि, स्वास्थ्य सेवा वा सुरक्षा जस्ता केही संवेदनशील उद्योगहरूमा, जहाँ तपाईं लगभग पूर्ण हुनुपर्छ, त्यसपछि यी क्षेत्रहरूमा, एआई एजेन्टहरू कम स्वायत्त हुन सक्छन्, तर यसको मतलब यो होइन कि तिनीहरू बेकार छन्। मलाई लाग्छ शैली फरक हुनेछ, हाम्रो जस्तो प्लेटफर्ममा, तपाईं वास्तवमा यी एजेन्टहरूलाई सम्पूर्ण काम स्वचालित गर्न दिन तैनाथ गर्दै हुनुहुन्छ।
डेरिक ह्यारिस: अनि यो एपिसोडको लागि यति मात्र। यदि तपाईंलाई यो विषय रोचक वा प्रेरणादायी लाग्यो भने, कृपया हाम्रो पोडकास्टलाई मूल्याङ्कन गर्नुहोस् र धेरै मानिसहरूसँग साझा गर्नुहोस्।हामी वर्षको अन्त्य हुनुभन्दा अगाडि अन्तिम एपिसोड रिलिज गर्ने अपेक्षा गर्छौं र नयाँ वर्षको लागि सामग्री पुन: तयार पार्नेछौं। सुन्नुभएकोमा धन्यवाद र तपाईंको छुट्टीको मौसम राम्रो रहोस् (यदि तपाईं बिदाको समयमा सुन्दै हुनुहुन्छ भने)।
मूल भिडियो: के अल एजेन्टहरूले अन्ततः ग्राहक समर्थन समाधान गर्न सक्छन्??