أبرز الأحداث
- إن ما يميز طلاب الماجستير في القانون هو مرونتهم الشديدة وقدرتهم على التكيف مع العديد من المواقف المختلفة، كما أنهم يتمتعون بذكاء أساسي.
- نحن نعتقد أنه بمرور الوقت، ستصبح واجهة المستخدم وتجربة المستخدم تعتمدان بشكل متزايد على اللغة الطبيعية، لأن هذه هي الطريقة التي يفكر بها نظام الوكيل، أو هذا هو أساس التدريب على نماذج اللغة الكبيرة (LLMs).
- إذا كنت تريد من شخص ما أن يقبل وكيل الذكاء الاصطناعي، فهو في الواقع يتخذ درجة من "القفزة الإيمانية" لأن هذا المجال غير مألوف للغاية بالنسبة للعديد من الأشخاص.
يعمل وكيل الذكاء الاصطناعي على إعادة تشكيل تجربة العملاء
جيسي تشانغ: كيف يتم إنشاء الوكيل فعليًا؟ وجهة نظرنا هي أنه بمرور الوقت، سيصبح أكثر فأكثر أشبه بالوكيل القائم على اللغة الطبيعية لأن هذه هي الطريقة التي يتم بها تدريب نماذج اللغة الكبيرة (LLMs).
على المدى الطويل، إذا كان لديك وكيل فائق الذكاء يشبه الإنسان فعليًا، فيمكنك أن تظهر له الأشياء، وتشرح له، وتقدم له ردود الفعل، وسوف يقوم بتحديث المعلومات في ذهنه.
يمكنك أن تتخيل وجود عضو بشري يتمتع بقدرات عالية في الفريق. فعندما ينضمون إلى الفريق لأول مرة، تعلمهم شيئًا ما، ويبدأون العمل، ثم تقدم لهم ملاحظاتك وتعرض عليهم معلومات جديدة.
وفي نهاية المطاف، سوف يتطور الأمر في هذا الاتجاه ــ فسوف يصبح أكثر تفاعلية واعتماداً على اللغة الطبيعية، وسوف تصبح الطريقة التي يتواصل بها الناس مع بعضهم البعض أكثر طبيعية. ولن يستخدم الناس بعد الآن أشجار القرار المعقدة تلك لتسجيل المتطلبات، والتي قد تنجح ولكنها عرضة للانهيار.
في الماضي، كان علينا القيام بذلك لأننا لم يكن لدينا نموذج لغوي كبير. ولكن الآن، مع التقدم المستمر لـ Agent، ستصبح تجربة المستخدم (UX) وواجهة المستخدم (UI) أكثر تفاعلية.
ديريك هاريس: مرحبًا بالجميع، ومرحبًا بكم في بودكاست A16z AI. أنا ديريك هاريس، وسينضم إليّ اليوم جيسي تشانج، المؤسس المشارك والرئيس التنفيذي لشركة Decagon، وكيمبرلي تان، الشريك في a16z. سيدير كيمبرلي المناقشة، وسيشارك جيسي تجربته في بناء Decagon ومنتجاتها.
إذا كنت لا تعرف الكثير عن هذا الأمر، فإن Decagon هي شركة ناشئة توفر وكلاء الذكاء الاصطناعي للشركات للمساعدة في دعم العملاء. هؤلاء الوكلاء ليسوا روبوتات محادثة ولا غلافات LLM لمكالمة API واحدة، بل هم وكلاء متقدمون مخصصون للغاية يمكنهم التعامل مع سير العمل المعقدة بناءً على احتياجات الشركة المحددة.
بالإضافة إلى شرح سبب إنشاء Decagon وكيفية تصميمه للتعامل مع بيئات LLM والعملاء المختلفة، يتحدث جيسي أيضًا عن فوائد نموذج الأعمال الذي يتقاضى رسومًا لكل محادثة، وكيف سيغير وكلاء الذكاء الاصطناعي المهارات المطلوبة لقادة دعم العملاء.
ومن الجدير بالذكر أيضًا أن كيمبرلي كتبت مؤخرًا منشورًا على مدونتها بعنوان "RIP to RPA، صعود الأتمتة الذكية"، والذي نناقشه بإيجاز في هذه الحلقة.
إنها نقطة بداية رائعة لفهم كيفية إقلاع الأتمتة في العمليات التجارية، وسنقدم رابطًا في ملاحظات العرض. وأخيرًا، كتذكير، فإن محتوى هذه المقالة هو لأغراض إعلامية فقط ولا ينبغي اعتباره نصيحة قانونية أو تجارية أو ضريبية أو استثمارية، ولا ينبغي استخدامه لتقييم أي استثمار أو أمان، ولا يستهدف أي مستثمر في صندوق a16z أو مستثمر محتمل.
جيسي تشانغ: مقدمة موجزة عن نفسي. لقد ولدت ونشأت في بولدر، وشاركت في العديد من مسابقات الرياضيات وما شابه ذلك عندما كنت طفلاً. درست علوم الكمبيوتر في جامعة هارفارد، ثم أسست شركة كانت مدعومة أيضًا من قبل a16z. وفي النهاية استحوذت علينا شركة Niantic.
ثم بدأنا في بناء Decagon. عملنا هو بناء وكلاء الذكاء الاصطناعي لخدمة العملاء. في البداية، فعلنا ذلك لأننا أردنا القيام بشيء قريب جدًا من قلوبنا.
بالطبع، لا أحد يحتاج إلى أن يتعلم عن دور وكلاء الذكاء الاصطناعي في خدمة العملاء، أليس كذلك؟ لقد تحدثنا جميعًا عبر الهاتف مع شركات الطيران والفنادق وما إلى ذلك، وانتظرنا على الهاتف. ومن هنا جاءت الفكرة.
تحدثنا إلى العديد من العملاء لمعرفة نوع المنتج الذي يجب أن نبنيه بالضبط. كان أحد الأشياء التي لفتت انتباهنا هو أنه مع تعلمنا المزيد عن وكلاء الذكاء الاصطناعي، بدأنا نفكر في الشكل الذي سيكون عليه المستقبل عندما يكون هناك الكثير منهم. أعتقد أن الجميع يعتقدون أنه سيكون هناك الكثير من وكلاء الذكاء الاصطناعي في المستقبل.
ما نفكر فيه هو ما الذي سيفعله الموظفون الذين يعملون مع وكلاء الذكاء الاصطناعي؟ ما نوع الأدوات التي سيستخدمونها؟ كيف سيتحكمون في الوكلاء الذين يعملون معهم أو يديرونهم أو يشاهدونهم؟
لذا، هذا هو جوهر الطريقة التي بنينا بها الشركة حول هذا السؤال. أعتقد أن هذا هو أيضًا ما يميزنا الآن، لأننا نوفر لوكلاء الذكاء الاصطناعي أدوات مختلفة لمساعدة الأشخاص الذين نعمل معهم في بناء وتكوين هؤلاء الوكلاء حتى لا يصبحوا "صندوقًا أسودًا". هذه هي الطريقة التي نبني بها علامتنا التجارية.
ديريك هاريس: ما الذي ألهمك، باعتبار أن شركتك الأخيرة كانت شركة فيديو موجهة للمستهلكين، للانتقال إلى برمجيات المؤسسات؟
جيسي تشانغ: سؤال رائع. أعتقد أن المؤسسين غالبًا ما يكونون "محايدين بشأن موضوع ما" عندما يتعلق الأمر باختيار موضوع ما، لأنه في الواقع، عندما تقترب من مجال جديد، فأنت عادةً ما تكون ساذجًا إلى حد كبير. لذا فهناك ميزة في النظر إلى الأشياء من منظور جديد. لذا عندما كنا نفكر في الأمر، لم تكن هناك قيود على الموضوع تقريبًا.
أعتقد أن هذا نمط شائع جدًا بين الأشخاص ذوي الخلفيات الكمية، بما في ذلك أنا. بعد تجربة المنتجات الاستهلاكية، تميل إلى الانجذاب أكثر نحو برامج المؤسسات لأن برامج المؤسسات بها مشكلات أكثر تحديدًا.
لديك عملاء فعليون لديهم احتياجات وميزانيات فعلية وأشياء من هذا القبيل، ويمكنك تحسين وحل المشكلات التي تواجههم. كما أن سوق المستهلكين جذابة للغاية، لكنها تعتمد على الحدس أكثر من كونها مدفوعة بالتجريب. بالنسبة لي شخصيًا، فإن برامج المؤسسات هي الأنسب.
كيمبرلي تان: أولاً، يمكننا أن نبدأ بهذا السؤال: ما هي فئات الدعم الأكثر شيوعًا التي تتعامل معها Decagon اليوم؟ هل يمكنك شرح كيفية استخدامك لنماذج اللغة الكبيرة (LLMs) لحل هذه المشكلات وما الذي يمكنك فعله الآن ولم يكن بإمكانك فعله من قبل؟
جيسي تشانغ: إذا نظرت إلى الأتمتة السابقة، فربما تكون قد استخدمت أشجار القرار للقيام بشيء بسيط، لتحديد المسار الذي يجب اتباعه. لكننا جميعًا استخدمنا برامج الدردشة الآلية، وهي تجربة محبطة للغاية.
غالبًا ما لا يمكن الإجابة على سؤالك بالكامل من خلال شجرة القرار. لذا ينتهي بك الأمر إلى توجيهك إلى مسار سؤال مرتبط بالسؤال ولكنه لا يتطابق معه تمامًا. الآن، لدينا نماذج لغوية كبيرة (LLMs). يكمن سحر نماذج اللغة الكبيرة في أنها مرنة للغاية، ويمكنها التكيف مع العديد من المواقف المختلفة، وتتمتع بذكاء أساسي.
عندما تطبق هذا على دعم العملاء، أو عندما يطرح العميل سؤالاً، يمكنك تقديم خدمة أكثر تخصيصًا. هذه هي النقطة الأولى، حيث تحسن مستوى التخصيص بشكل كبير. وهذا يفتح المجال أمام مقاييس أعلى. يمكنك حل المزيد من المشكلات، ويشعر العملاء بالرضا، ويزداد رضا العملاء.
الخطوة الطبيعية التالية هي: إذا كان لديك هذا الذكاء، فيجب أن تكون قادرًا على القيام بمزيد من الأشياء التي يستطيع البشر القيام بها. الأشياء التي يستطيع البشر القيام بها هي أنه يمكنهم سحب البيانات في الوقت الفعلي، ويمكنهم اتخاذ الإجراءات، ويمكنهم التفكير من خلال خطوات متعددة. إذا طرح أحد العملاء سؤالاً معقدًا نسبيًا، فربما "أريد أن أفعل هذا وذاك"، والذكاء الاصطناعي مستعد للتعامل مع السؤال الأول فقط. LLM ذكي بما يكفي ليدرك أن هناك سؤالين هنا. أولاً، سيحل المشكلة الأولى، ثم يساعدك في حل المشكلة الثانية.
قبل ظهور برنامج LLM، كان هذا مستحيلاً في الأساس. لذا فإننا نشهد الآن تغييراً كبيراً في ما تستطيع التكنولوجيا القيام به، وذلك بفضل برنامج LLM.
كيمبرلي تان: في هذا السياق، كيف يمكنك تعريف وكيل الذكاء الاصطناعي؟ نظرًا لاستخدام كلمة "وكيل" على نطاق واسع، فأنا أشعر بالفضول لمعرفة ما تعنيه بالفعل في سياق Decagon.
جيسي تشانغ: أود أن أقول إن Agent يشير أكثر إلى نظام حيث تعمل أنظمة LLM (نموذج اللغة الكبير) المتعددة معًا. لديك استدعاء LLM، والذي يتضمن في الأساس إرسال مطالبة والحصول على استجابة. بالنسبة إلى Agent، تريد أن تكون قادرًا على ربط العديد من مثل هذه الاستدعاءات، وربما بشكل متكرر.
على سبيل المثال، لديك مكالمة LLM تحدد كيفية التعامل مع الرسالة، ومن ثم قد تؤدي إلى مكالمات أخرى تسحب المزيد من البيانات وتنفذ إجراءات وتعيد النظر فيما قاله المستخدم، وربما تطرح أسئلة متابعة. لذا بالنسبة لنا، يمكن فهم الوكيل كشبكة من مكالمات LLM أو مكالمات API أو منطق آخر يعمل معًا لتوفير تجربة أفضل.
كيمبرلي تان: في هذا الموضوع، ربما يمكننا التحدث أكثر عن البنية الأساسية للوكيل التي أنشأتها بالفعل. أعتقد أن هناك نقطة مثيرة للاهتمام للغاية وهي أن هناك العديد من العروض التوضيحية لوكلاء الذكاء الاصطناعي في السوق، لكنني أعتقد أن هناك أمثلة قليلة جدًا لهم يمكنهم العمل بشكل مستقر في بيئة إنتاجية. ومن الصعب معرفة ما هو حقيقي وما هو غير حقيقي من الخارج.
فبرأيك، ما هي الجوانب التي تعمل بشكل جيد في وكلاء الذكاء الاصطناعي اليوم، وما هي الجوانب التي لا تزال تتطلب اختراقات تكنولوجية لجعلها أكثر قوة وموثوقية؟
جيسي تشانغ: في الواقع، وجهة نظري مختلفة بعض الشيء. لا يكمن الاختلاف بين تحديد ما إذا كان وكيل الذكاء الاصطناعي مجرد عرض توضيحي أو "يعمل حقًا" بالكامل في مجموعة التكنولوجيا، لأنني أعتقد أن معظم الأشخاص قد يستخدمون نفس التكنولوجيا تقريبًا. أعتقد أنه بمجرد المضي قدمًا في تطوير شركتك، على سبيل المثال، تأسست شركتنا منذ أكثر من عام، ستنشئ شيئًا محددًا للغاية يناسب حالة الاستخدام الخاصة بك.
ولكن في التحليل النهائي، يمكن لأي شخص الوصول إلى نفس النموذج واستخدام تكنولوجيا مماثلة. أعتقد أن أكبر عامل يميز ما إذا كان وكيل الذكاء الاصطناعي قادرًا على العمل بشكل فعال يكمن في شكل حالة الاستخدام. من الصعب معرفة ذلك في البداية، ولكن إذا نظرنا إلى الوراء، فسوف نجد أن هناك صفتين مهمتين للغاية لكي يتمكن وكيل الذكاء الاصطناعي من تجاوز العرض التوضيحي والدخول في التطبيق العملي.
الأول هو أن حالة الاستخدام التي تحلها يجب أن يكون لها عائد على الاستثمار قابل للقياس. هذا مهم جدًا، لأنه إذا لم يكن من الممكن قياس عائد الاستثمار، فسيكون من الصعب إقناع الناس باستخدام منتجك ودفع ثمنه بالفعل. في حالتنا، المؤشر الكمي هو: ما هي النسبة المئوية لطلبات الدعم التي تحلها؟ نظرًا لأن هذا الرقم واضح، يمكن للناس فهمه - حسنًا، إذا حللت المزيد، يمكنني مقارنة هذه النتيجة بنفقاتي الحالية والوقت الذي أمضيته. لذا، إذا كان هناك هذا المؤشر، فإن مؤشرًا آخر مهمًا جدًا بالنسبة لنا هو رضا العملاء. نظرًا لأنه يمكن قياس عائد الاستثمار بسهولة، فسيتبناه الناس حقًا.
العامل الثاني هو أن حالات الاستخدام يجب أن تصبح أكثر صعوبة بشكل تدريجي. سيكون الأمر صعبًا للغاية أيضًا إذا كنت بحاجة إلى وكيل خارق للطبيعة منذ البداية، وحل ما يقرب من 100% من حالات الاستخدام. نظرًا لأننا نعلم أن LLMs غير حتمية، فيجب أن يكون لديك نوع من خطة الطوارئ. لحسن الحظ، هناك ميزة رائعة لحالات استخدام الدعم، وهي أنه يمكنك دائمًا تصعيد الأمر إلى شخص بشري. حتى لو لم تتمكن من حل سوى نصف المشكلات، فلا يزال ذلك ذا قيمة كبيرة للناس.
لذا أعتقد أن الدعم يتمتع بهذه الخاصية التي تجعله مناسبًا جدًا لـ AI Agent. أعتقد أن هناك العديد من المجالات الأخرى حيث يمكن للأشخاص إنشاء عروض توضيحية رائعة حيث لا يتعين عليك حتى النظر عن كثب لفهم سبب فائدة AI Agent. ولكن إذا كان لابد أن يكون مثاليًا منذ البداية، فسيكون الأمر صعبًا للغاية. إذا كان الأمر كذلك، فلن يرغب أحد تقريبًا في تجربته أو استخدامه لأن عواقب عدم كمالها يمكن أن تكون خطيرة للغاية - على سبيل المثال، من حيث الأمان.
على سبيل المثال، عندما يقوم الأشخاص بإجراء عمليات محاكاة، فإنهم دائمًا ما يفكرون بهذه الفكرة الكلاسيكية: "أوه، سيكون من الرائع لو كان بإمكان LLM قراءة هذا". ولكن من الصعب أن نتخيل شخصًا يقول، "حسنًا، عميل الذكاء الاصطناعي، انطلق. أعتقد أنك قادر على القيام بذلك". لأنه إذا ارتكب خطأ، فقد تكون العواقب وخيمة للغاية.
جيسي تشانغ: عادة ما يتم تحديد ذلك من قبل عملائنا، وفي الواقع نرى مجموعة واسعة جدًا من الاختلافات. في أحد الطرفين، يجعل بعض الأشخاص وكيلهم يبدو وكأنه إنسان، لذلك يوجد صورة رمزية بشرية واسم بشري، وتكون الاستجابات طبيعية جدًا. من ناحية أخرى، يذكر الوكيل ببساطة أنه ذكاء اصطناعي ويوضح ذلك للمستخدم. أعتقد أن الشركات المختلفة التي نعمل معها لديها مواقف مختلفة بشأن هذا الأمر.
عادة، إذا كنت تعمل في صناعة منظمة، فعليك توضيح ذلك. ما أراه مثيرًا للاهتمام الآن هو أن سلوك العملاء يتغير. لأن العديد من عملائنا يتلقون الكثير من التعليقات على وسائل التواصل الاجتماعي، مثل، "يا إلهي، هذه أول تجربة دردشة أجرّبها على الإطلاق تبدو حقيقية للغاية"، أو "هذا مجرد سحر". وهذا أمر رائع بالنسبة لهم، لأن عملائهم الآن يتعلمون، مهلاً، إذا كانت تجربة الذكاء الاصطناعي، فيمكنها أن تكون أفضل من الإنسان. لم يكن هذا هو الحال في الماضي، لأن معظمنا مر بهذا النوع من تجربة خدمة العملاء عبر الهاتف في الماضي: "حسنًا، الذكاء الاصطناعي، الذكاء الاصطناعي، الذكاء الاصطناعي..."
كيمبرلي تان: لقد ذكرت مفهوم التخصيص عدة مرات. يستخدم الجميع نفس البنية الأساسية للتكنولوجيا، ولكن لديهم احتياجات مختلفة للتخصيص من حيث خدمات الدعم. هل يمكنك التحدث عن هذا؟ على وجه التحديد، كيف تحقق التخصيص حتى يتمكن الأشخاص من القول عبر الإنترنت، "يا إلهي، هذه أفضل تجربة دعم مررت بها على الإطلاق"؟
جيسي تشانغ: بالنسبة لنا، يأتي التخصيص من التخصيص للمستخدم. تحتاج إلى فهم معلومات الخلفية الخاصة بالمستخدم، وهو السياق الإضافي المطلوب. ثانيًا، تحتاج أيضًا إلى فهم منطق عمل عملائنا.إذا قمت بدمج الاثنين، فيمكنك تقديم تجربة جيدة جدًا.
من الواضح أن هذا يبدو بسيطًا، ولكن في الواقع من الصعب جدًا الحصول على كل السياق المطلوب. لذلك، فإن معظم عملنا يتعلق بكيفية بناء المكونات الأولية الصحيحة بحيث عندما يقوم العميل بنشر نظامنا، يمكنه بسهولة أن يقرر، "حسنًا، هذا هو منطق العمل الذي نريده". على سبيل المثال، تحتاج أولاً إلى القيام بهذه الخطوات الأربع، وإذا فشلت الخطوة الثالثة، فأنت بحاجة إلى الانتقال إلى الخطوة الخامسة.
تريد أن تتمكن من تعليم الذكاء الاصطناعي هذا الأمر بسهولة بالغة، ولكنك تريد أيضًا منحه حق الوصول إلى معلومات مثل "هذه تفاصيل حساب المستخدم. إذا كنت بحاجة إلى مزيد من المعلومات، يمكنك الاتصال بواجهات برمجة التطبيقات هذه". هذه الطبقات هي طبقة تنسيق أعلى النموذج، وبطريقة ما، تجعل العميل قابلاً للاستخدام حقًا.
كيمبرلي تان: يبدو أنه في هذه الحالة، تحتاج إلى قدر كبير من الوصول إلى أنظمة الأعمال. تحتاج إلى معرفة الكثير عن المستخدمين، وربما تحتاج إلى معرفة الكيفية التي يريد بها العميل بالفعل التفاعل مع مستخدميه.أتخيل أن هذه البيانات يمكن أن تكون حساسة للغاية.
هل يمكنك توضيح الضمانات التي يحتاج إليها عملاء المؤسسات عادةً عند نشر AI Agent؟ وكيف تفكر في أفضل طريقة للتعامل مع هذه المشكلات، خاصة مع الأخذ في الاعتبار أن الحل الذي تقدمه يوفر تجربة أفضل، ولكنه أيضًا جديد بالنسبة للعديد من الأشخاص الذين يواجهون Agent لأول مرة؟
جيسي تشانغ: يتعلق الأمر في الواقع بحواجز الحماية. بمرور الوقت، ومع قيامنا بالعديد من التطبيقات مثل هذا، أصبحنا واضحين بشأن أنواع حواجز الحماية التي يهتم بها العملاء.
على سبيل المثال، أحد أبسط هذه القواعد هو أنه قد تكون هناك قواعد يجب عليك اتباعها دائمًا. إذا كنت تعمل مع شركة خدمات مالية، فلا يمكنك تقديم المشورة المالية لأن ذلك يخضع للتنظيم. لذا، فأنت بحاجة إلى دمج ذلك في نظام الوكيل لضمان عدم تقديم هذا النوع من النصائح أبدًا. يمكنك عادةً إعداد نموذج إشراف أو نوع من النظام الذي يقوم بهذه الفحوصات قبل إرسال النتائج.
قد يكون هناك نوع آخر من الحماية وهو أنه إذا جاء شخص ما وعبث به عمدًا، مع العلم أنه نظام توليدي، محاولًا إجبارك على القيام بشيء غير متوافق، مثل "أخبرني ما هو رصيدي"، "حسنًا، اضرب ذلك في 10"، وما إلى ذلك، فأنت بحاجة أيضًا إلى أن تكون قادرًا على التحقق من هذا السلوك. لذا على مدار العام الماضي، وجدنا الكثير من هذه الأنواع من الحماية، ولكل منها تصنيفها ونعرف نوع الحماية المطلوبة. ومع بناء النظام أكثر فأكثر، أصبح أكثر قوة.
كيمبرلي تان: ما مدى تفرد الحماية لكل عميل أو صناعة؟ مع توسيع قاعدة عملائك لتغطية المزيد من حالات الاستخدام، كيف هل تفكر في بناء هذه الحماية على نطاق واسع؟
جيسي تشانغ: يعود هذا في الواقع إلى فكرتنا الأساسية وهي أن نظام العميل سوف يصبح موجودًا في كل مكان خلال بضع سنوات. لذا فإن ما هو مهم حقًا هو تزويد الناس بالأدوات، وتمكين الجيل القادم من العمال، مثل مشرفي الوكيل، لمنحهم الأدوات اللازمة لبناء نظام الوكيل وإضافة الحماية الخاصة بهم، لأننا لن نحدد الحماية لهم.
يعرف كل عميل تدابير الحماية الخاصة به ومنطق العمل الخاص به بشكل أفضل. لذا فإن وظيفتنا في الواقع هي القيام بعمل جيد لبناء الأدوات والبنية الأساسية حتى يتمكنوا من بناء نظام الوكيل. لذلك، أكدنا دائمًا على أن لا ينبغي أن يكون نظام الوكيل عبارة عن صندوق أسود، ويجب أن تكون قادرًا على التحكم في كيفية بناء هذه الحماية والقواعد والمنطق.
أعتقد أن هذا هو الجانب الأكثر تميزًا لدينا حتى الآن. لقد بذلنا الكثير من الجهد في هذه الأدوات وتوصلنا إلى طرق إبداعية للسماح للأشخاص الذين قد لا يتمتعون بخلفية تقنية فائقة، أو حتى فهم عميق لكيفية عمل نماذج الذكاء الاصطناعي، بإدخال الإجراءات التي يريدون من الذكاء الاصطناعي تنفيذها في نظام الوكيل.
أعتقد أن هذه القدرة سوف تصبح ذات أهمية متزايدة في السنوات القليلة القادمة. وينبغي أن تكون هذه القدرة واحدة من أهم المعايير عند تقييم الأشخاص لأدوات مماثلة، لأنك تريد أن تكون قادرًا على تحسين هذه الأنظمة باستمرار بمرور الوقت.
منطق الأعمال مدفوعًا باللغة الطبيعية
ديريك هاريس: ما هي الاستعدادات التي يمكن للعملاء أو الشركات القيام بها للاستعداد لأي نوع من أنواع الأتمتة، وخاصة استخدام نظام الوكيل هذا؟ على سبيل المثال، كيف يمكنهم تصميم أنظمة البيانات الخاصة بهم أو بنية البرامج أو منطق الأعمال لدعم مثل هذه الأنظمة؟
لأنني أشعر أن الكثير من تقنيات الذكاء الاصطناعي جديدة في البداية، ولكن عندما يتعلق الأمر بالأنظمة القديمة الموجودة، فإنها غالبًا ما تواجه الكثير من الفوضى.
جيسي تشانغ: إذا كان شخص ما يبني من الصفر الآن، فهناك الكثير من أفضل الممارسات التي يمكن أن تجعل مهمتك أسهل. على سبيل المثال، كيفية هيكلة قاعدة المعرفة الخاصة بك. لقد كتبنا عن بعض هذه الممارسات، وقدمنا بعض الأساليب التي يمكن أن تجعل من الأسهل على الذكاء الاصطناعي استيعاب المعلومات وتحسين دقتها. أحد الاقتراحات المحددة هو تقسيم قاعدة المعرفة إلى أجزاء معيارية، بدلاً من وجود مقالة كبيرة واحدة بها إجابات متعددة.
عند إعداد واجهة برمجة التطبيقات، يمكنك جعلها أكثر ملاءمة لنظام العميل، وتعيين الأذونات والإخراج بطريقة تجعل من السهل على نظام العميل استيعاب المعلومات دون الحاجة إلى إجراء الكثير من الحسابات للعثور على الإجابة. هذه بعض التدابير التكتيكية التي يمكن اتخاذها، لكنني لا أقول إنه يجب القيام بأي شيء من أجل استخدام نظام العميل.
ديريك هاريس: التوثيق الجيد مهم دائمًا، ويتعلق في الأساس بتنظيم المعلومات بشكل فعال.
كيمبرلي تان: يبدو الأمر وكأنك إذا حاولت تعليم الأشخاص كيفية توجيه نظام العميل للعمل بالطريقة التي تناسب عملائهم أو حالات الاستخدام المحددة بشكل أفضل، فقد تكون هناك حاجة إلى الكثير من التجارب مع تصميم واجهة المستخدم وتجربة المستخدم، أو قد يتعين عليك شق مسارات جديدة في هذا المجال الجديد تمامًا، لأنه مختلف تمامًا عن البرامج التقليدية.
أنا فضولي، ما رأيك في هذا؟ كيف ينبغي أن تبدو واجهة المستخدم وتجربة المستخدم في عالم يضع العميل في المقام الأول؟ كيف تعتقد أنه سيتغير في السنوات القليلة القادمة؟
جيسي تشانغ: لا أستطيع أن أقول إننا حللنا هذه المشكلة. أعتقد أننا ربما توصلنا إلى حل محلي مثالي يناسب عملائنا الحاليين، لكن هذا لا يزال مجالاً للبحث المستمر، بالنسبة لنا وللعديد من الآخرين.
تعود القضية الأساسية إلى ما ذكرناه سابقًا، وهو أن لديك نظام وكيل. أولاً، كيف يمكنك أن ترى بوضوح ما يفعله وكيف يتخذ القرارات؟ ثم، كيف يمكنك استخدام هذه المعلومات لتحديد ما يحتاج إلى تحديث وما هي الملاحظات التي يجب تقديمها للذكاء الاصطناعي؟ هذه هي النقطة التي تتجمع فيها عناصر واجهة المستخدم، وخاصة الجزء الثاني.
نعتقد أنه بمرور الوقت، ستصبح واجهة المستخدم وتجربة المستخدم تعتمدان بشكل متزايد على اللغة الطبيعية، لأن هذه هي الطريقة التي يفكر بها نظام العميل، أو هذا هو الأساس لتدريب نماذج اللغة الكبيرة (LLMs).
في الحالات القصوى، إذا كان لديك عميل فائق الذكاء يفكر مثل الإنسان، فيمكنك أن تعرض عليه أشياء، وتشرح له أشياء، وتقدم له ملاحظات، وسيقوم بتحديث "عقله" الخاص. يمكنك أن تتخيل انضمام شخص كفء للغاية إلى فريقك، وتعلمه شيئًا ما، ويبدأ في العمل، ثم تستمر في تقديم الملاحظات له، ويمكنك أن تعرض عليه أشياء جديدة، ومستندات جديدة، ومخططات، وما إلى ذلك.
أعتقد أنه في الحالة القصوى، سوف يتطور الأمر في هذا الاتجاه: تصبح الأشياء أكثر تفاعلية، وتعتمد على اللغة الطبيعية بشكل أكبر، ويتوقف الناس عن بناء أنظمة ذات أشجار قرار معقدة كما اعتادوا، والتقاط ما تريد، ولكن هذا النهج يمكن أن ينهار بسهولة. اعتدنا على القيام بذلك لأنه لم يكن هناك LLMs في ذلك الوقت، ولكن الآن بعد أن أصبحت أنظمة الوكيل أكثر قوة، ستصبح واجهة المستخدم وتجربة المستخدم أكثر تفاعلية.
كيمبرلي تان: منذ عام ونصف تقريبًا، عندما بدأت شركة Decagon لأول مرة، كان هناك تصور عام بأن LLM كان قابلاً للتطبيق للغاية في العديد من حالات الاستخدام، ولكن في الواقع كان مجرد نوع من "غلاف GPT"، حيث يمكن للشركات استدعاء نموذج أساسي من خلال واجهة برمجة التطبيقات وحل مشكلات الدعم الخاصة بها على الفور.
ولكن من الواضح أن الشركات التي تختار استخدام حلول مثل Decagon بدلاً من اتباع هذا المسار بشكل مباشر، تبين أن هذا ليس هو الحال. كنت أتساءل عما إذا كان بإمكانك شرح سبب ذلك. ما الذي جعل تحديات البناء داخليًا أكثر تعقيدًا مما كان متوقعًا؟ ما هي المفاهيم الخاطئة التي كانت لديهم حول المفهوم؟
جيسي تشانغ: لا يوجد خطأ في أن تكون "غلافًا لـ GPT"، يمكنك القول إن Purcell عبارة عن غلاف لـ AWS أو شيء من هذا القبيل. عادةً، عندما يستخدم الناس هذا المصطلح، فإن ذلك يعني شيئًا مهينًا.
وجهة نظري الشخصية هي أنه إذا كنت تقوم ببناء نظام وكيل، فمن المؤكد أنك ستستخدم LLM كأداة. لذا فإنك في الواقع تبني على شيء موجود بالفعل، تمامًا كما تفعل عادةً عند البناء على AWS أو GCP.
لكن المشكلة الحقيقية التي قد تواجهها هي إذا لم يكن البرنامج الذي تبنيه على أساس LLM "ثقيلًا" أو معقدًا بما يكفي لإحداث فرق.
عند النظر إلى الوراء، نجد أن ما نبيعه في الأساس هو البرمجيات. فنحن في الواقع مثل أي شركة برمجيات عادية، إلا أننا نستخدم LLM كجزء من البرمجيات وكأحد الأدوات. ولكن عندما يشتري الناس هذا النوع من المنتجات، فإنهم يريدون في المقام الأول البرمجيات نفسها. إنهم يريدون أدوات يمكنها مراقبة الذكاء الاصطناعي، والتي يمكنها التعمق في تفاصيل كل محادثة يجريها الذكاء الاصطناعي، والتي يمكنها تقديم الملاحظات، والتي يمكنها بناء النظام وتعديله باستمرار.
لذا، هذا هو جوهر برنامجنا. حتى مع نظام العميل نفسه، فإن المشكلة التي يواجهها الناس هي أنه من الرائع إجراء عرض توضيحي، ولكن إذا كنت تريد جعله جاهزًا للإنتاج وموجهًا للعملاء حقًا، فيجب عليك حل العديد من المشكلات القديمة، مثل منع ظاهرة "الوهم" والتعامل مع الجهات السيئة التي تحاول التسبب في الفوضى. يتعين علينا أيضًا التأكد من أن زمن الوصول منخفض بما يكفي، وأن النغمة مناسبة، وما إلى ذلك.
لقد تحدثنا إلى العديد من الفرق، وأجروا بعض التجارب، وبنوا نسخة أولية، ثم أدركوا أنهم لا يريدون أن يكونوا هم من يستمرون في بناء هذه التفاصيل في المراحل اللاحقة. كما أنهم لا يريدون أن يكونوا هم من يستمرون في إضافة منطق جديد إلى فريق خدمة العملاء. لذا في هذه المرحلة، يبدو من المناسب اختيار التعاون مع الآخرين.
كيمبرلي تان: لقد ذكرت بعض القضايا طويلة الأمد، مثل الحاجة إلى التعامل مع الجهات السيئة، وما إلى ذلك.أعتقد أن العديد من المستمعين الذين يفكرون في استخدام AI Agent قلقون بشأن مسارات الهجوم الأمني الجديدة التي قد تنشأ بعد تقديم LLMs، أو المخاطر الأمنية الجديدة التي قد تنشأ بعد تقديم نظام Agent. ما رأيك في هذه القضايا؟ وما هي أفضل الممارسات لضمان أمن المؤسسة من الدرجة الأولى عند التعامل مع عامل?
جيسي تشانغ: من الناحية الأمنية، هناك بعض التدابير الواضحة التي يمكن اتخاذها، والتي ذكرتها سابقًا، مثل الحاجة إلى تدابير الحماية. والقضية الأساسية هي أن مخاوف الناس بشأن شهادات الماجستير في القانون هي أنها ليست حتمية.
ولكن الخبر السار هو أنه يمكنك بالفعل وضع أغلب العمليات الحساسة والمعقدة خلف جدار حتمي، وتحدث العمليات الحسابية هناك عندما تستدعي واجهة برمجة التطبيقات. لذا فإنك لا تعتمد بالكامل على LLM للتعامل معها، وهذا يتجنب الكثير من المشاكل الأساسية.
ولكن لا تزال هناك مواقف حيث يتدخل شخص سيء أو يحاول شخص ما جعل النظام يهلوس. لقد لاحظنا أنه في العديد من العملاء الرئيسيين الذين نعمل معهم، تدخل فرق الأمن الخاصة بهم وتجري اختبار "الفريق الأحمر" على منتجاتنا، وتقضي أسابيع في إطلاق هجمات محتملة مختلفة على النظام لمحاولة العثور على نقاط ضعف. ومع تزايد شعبية AI Agent، فقد نرى حدوث ذلك بشكل متكرر، لأن هذه واحدة من أفضل الطرق لاختبار ما إذا كان النظام فعالاً. إنه إلقاء شيء عليه من خلال اختبار الفريق الأحمر ومعرفة ما إذا كان يمكنه اختراق الدفاعات.
هناك أيضًا شركات ناشئة تعمل على تطوير أدوات الفريق الأحمر أو تمكين الأشخاص من إجراء مثل هذه الأنواع من الاختبارات بأنفسهم، وهو الاتجاه الذي نشهده الآن. في مرحلة لاحقة من دورة المبيعات، ستطلب العديد من الشركات التي نعمل معها من فريق الأمن الخاص بها، أو تعمل مع فريق خارجي، إجراء اختبارات ضغط على النظام. بالنسبة لنا، فإن القدرة على اجتياز مثل هذه الأنواع من الاختبارات أمر ضروري. لذا، في النهاية، هذا هو ما يتلخص فيه الأمر.
ديريك هاريس: هل هذا شيء تشجع عملاءك على القيام به؟ لأنه عندما نتحدث عن سياسات الذكاء الاصطناعي، فإننا نذكر جانبًا مهمًا، وهو طبقة التطبيق، ونؤكد على وضع فإن إن المسؤولية تقع على عاتق مستخدمي LLM والأشخاص الذين يديرون التطبيق، بدلاً من إلقاء اللوم على النموذج نفسه ببساطة. وهذا يعني أن العملاء يجب أن يجروا اختبارات الفريق الأحمر، ويحددوا حالات الاستخدام ومسارات الهجوم المحددة، ويحددوا نقاط الضعف التي تحتاج إلى الحماية، بدلاً من الاعتماد ببساطة على الحماية الأمنية التي أنشأتها بالفعل OpenAI أو شركات أخرى.
جيسي تشانغ: أوافق تمامًا. أعتقد أيضًا أنه قد تكون هناك موجة جديدة من متطلبات الإشعارات الناشئة، على غرار شهادة SOC 2 وشهادة HIPAA التي يقوم بها الجميع الآن، والتي تعد مطلوبة في صناعات مختلفة. عادةً، عندما تبيع منتجًا عامًا من SaaS، سيطلب العملاء اختبار الاختراق، ويجب علينا أيضًا تقديم تقرير اختبار الاختراق الخاص بنا. بالنسبة لـ AI Agent، قد تكون هناك متطلبات مماثلة في المستقبل، وقد يسميها شخص ما، لكن هذه في الأساس طريقة جديدة لاختبار ما إذا كان نظام Agent قويًا بما يكفي.
كيمبرلي تان: من الأمور المثيرة للاهتمام أن الجميع متحمسون للغاية للتطورات الجديدة في مجال النماذج والتطورات التكنولوجية التي تقدمها جميع المختبرات الكبرى. وباعتبارك شركة تعمل في مجال الذكاء الاصطناعي، فمن الواضح أنك لا تجري أبحاثك الخاصة، بل تستفيد من هذا البحث وتبني الكثير من البرامج حوله لتقديمه إلى العميل النهائي.
لكن عملك يعتمد على التكنولوجيا المتغيرة بسرعة. أنا فضولي، كشركة للذكاء الاصطناعي التطبيقي، كيف تواكب التغييرات التكنولوجية الجديدة وتفهم كيف تؤثر على الشركة بينما تكون قادرًا على التنبؤ بخريطة طريق منتجك وبناء احتياجات المستخدم؟ وعلى نطاق أوسع، ما هي الاستراتيجيات التي يجب أن تتبناها شركات الذكاء الاصطناعي التطبيقي في مواقف مماثلة؟
جيسي تشانغ: يمكنك تقسيم المجموعة بأكملها إلى أجزاء مختلفة. على سبيل المثال، توجد LLM في الأسفل إذا نظرت إلى طبقة التطبيق. قد يكون لديك بعض الأدوات في المنتصف والتي تساعدك في إدارة LLM أو إجراء بعض التقييمات وأشياء من هذا القبيل. بعد ذلك، الجزء العلوي هو ما بنيناه بشكل أساسي، وهو في الواقع أشبه بـ SaaS القياسي.
لذا، فإن أغلب أعمالنا لا تختلف كثيرًا عن البرامج العادية، باستثناء أننا نمتلك عنصرًا بحثيًا إضافيًا - حيث تتغير برامج LLM بسرعة كبيرة. نحتاج إلى البحث في ما يمكنهم فعله، وما يجيدونه، وأي نموذج يجب استخدامه لأداء مهمة معينة. هذه مشكلة كبيرة لأن كلًا من OpenAI وAnthropic تطلقان تقنيات جديدة، كما تتحسن Gemini تدريجيًا.
لذلك، يجب أن يكون لديك آلية تقييم خاصة بك لفهم النموذج المناسب للاستخدام في أي موقف. في بعض الأحيان، تحتاج أيضًا إلى إجراء ضبط دقيق، ولكن السؤال هو: متى يتم إجراء الضبط الدقيق؟ متى يكون الضبط الدقيق مفيدًا؟ ربما تكون هذه هي القضايا البحثية الرئيسية المتعلقة بـ LLMs التي نركز عليها. ولكن حتى الآن على الأقل، لا نشعر بأن SaaS يتغير بسرعة، لأننا لا نعتمد على الطبقة الوسطى. لذا، فإن LLMs هي التي تتغير بشكل أساسي. فهي لا تتغير كثيرًا، وعندما تتغير، يكون ذلك عادةً بمثابة ترقية. على سبيل المثال، تم تحديث Claude 3.5 sonnet قبل بضعة أشهر، وفي ذلك الوقت فكرنا، "حسنًا، هل يجب أن ننتقل إلى النموذج الجديد بدلاً من الاستمرار في استخدام النموذج القديم؟"
كل ما نحتاجه هو إجراء سلسلة من التقييمات، وبمجرد أن ننتقل إلى النموذج الجديد، فلن نفكر في الأمر بعد الآن لأنك تستخدم النموذج الجديد بالفعل. ثم ظهرت نسخة o1، وكان الموقف مشابهًا. فكر في المكان الذي يمكن استخدامه فيه. في حالتنا، يعد o1 بطيئًا بعض الشيء بالنسبة لمعظم حالات الاستخدام التي يواجهها العملاء، لذا يمكننا استخدامه لبعض الأعمال الخلفية. في النهاية، نحتاج فقط إلى نظام جيد لأبحاث النموذج.
كيمبرلي تان: ما مدى تكرار قيامك بتقييم نموذج جديد وتقرر ما إذا كنت ترغب في استبداله؟
جيسي تشانغ: نقوم بالتقييم في كل مرة يتم فيها طرح نموذج جديد. عليك التأكد من أنه على الرغم من أن النموذج الجديد أكثر ذكاءً، إلا أنه لا يعطل بعض حالات الاستخدام التي قمت بإنشائها بالفعل. هذا يمكن أن يحدث. على سبيل المثال، قد يكون النموذج الجديد أكثر ذكاءً بشكل عام، ولكن في بعض الحالات القصوى، يكون أداؤه ضعيفًا في اختيار A/B في أحد سير العمل لديك. هذا ما نقوم بالتقييم من أجله.
أعتقد أن نوع الذكاء الذي نهتم به بشكل عام هو ما أسميه "القدرة على اتباع التعليمات". نريد أن يصبح النموذج أفضل فأفضل في اتباع التعليمات. إذا كان الأمر كذلك، فهذا مفيد لنا بالتأكيد، وهذا أمر جيد للغاية.
يبدو أن الأبحاث الحديثة ركزت بشكل أكبر على نوع الذكاء الذي يتطلب التفكير المنطقي، مثل تحسين البرمجة والعمليات الحسابية. وهذا يساعدنا أيضًا، لكنه ليس بنفس أهمية تحسين القدرة على متابعة التعليمات.
كيمبرلي تان: هناك نقطة واحدة مثيرة للاهتمام للغاية ذكرتها، وأعتقد أنها أيضًا فريدة جدًا بالنسبة لشركة Decagon، وهي أنك قمت ببناء الكثير من البنية التحتية للتقييم داخليًا للتأكد من أنك تعرف بالضبط كيفية أداء كل نموذج ضمن مجموعة الاختبارات التي تقدمها.
هل يمكنك توضيح ذلك؟ ما مدى أهمية البنية التحتية للتقييم الداخلي، وعلى وجه التحديد كيف تمنحك أنت وعملاؤك الثقة في أداء الوكيل؟ لأن بعض هذه التقييمات تتعلق أيضًا بالعملاء.
جيسي تشانغ: أعتقد أن هذا مهم جدًا، لأنه بدون هذه البنية التحتية للتقييم، سيكون من الصعب جدًا علينا تكرار العمل بسرعة.
إذا شعرت أن كل تغيير يحمل احتمالية عالية لإحداث ضرر ما، فلن تتمكن من إجراء التغييرات بسرعة. ولكن إذا كان لديك آلية تقييم، فعند حدوث تغيير كبير أو تحديث للنموذج أو ظهور شيء جديد، يمكنك مقارنته مباشرة بجميع اختبارات التقييم. وإذا كانت نتائج التقييم جيدة، فيمكنك أن تشعر: حسنًا، لقد حققنا تحسنًا، أو يمكنك إصداره بثقة دون القلق كثيرًا.
لذا، في مجالنا، يتطلب التقييم مدخلات من العميل، لأن العميل هو الذي يقرر ما إذا كان شيء ما صحيحًا أم لا. بالطبع، يمكننا التحقق من بعض المشكلات عالية المستوى، ولكن عادةً ما يقدم العميل حالات استخدام محددة ويخبرنا ما هي الإجابة الصحيحة، أو ما يجب أن تكون عليه، وما هي النبرة التي يجب أن تحافظ عليها، وما يجب أن تقوله.
يعتمد التقييم على هذا. لذا يتعين علينا التأكد من أن نظام التقييم لدينا قوي بما فيه الكفاية. في البداية، قمنا ببنائه بأنفسنا، ولم يكن من الصعب الحفاظ عليه. كما نعلم أن هناك بعض شركات التقييم، وقد استكشفنا بعضها. ربما في مرحلة ما، سنفكر فيما إذا كان ينبغي لنا تبنيها، ولكن في الوقت الحالي، لم يعد نظام التقييم يشكل مشكلة بالنسبة لنا.
كيمبرلي تان: هناك موضوع شائع جدًا اليوم وهو تعدد الوسائط، مما يعني أن عملاء الذكاء الاصطناعي يجب أن يكونوا قادرين على التفاعل عبر جميع الأشكال التي يستخدمها البشر اليوم، سواء كانت نصًا أو فيديو أو صوتًا وما إلى ذلك. أعلم أن Decagon بدأ كبرنامج قائم على النص. من وجهة نظرك، ما مدى أهمية هو متعدد الوسائط إلى وكلاء الذكاء الاصطناعي؟ ما هو الإطار الزمني الذي تعتقد أنه سيصبح سائدًا أو حتى معيارًا؟
جيسي تشانغ: من المهم، ومن منظور الشركة، ليس من الصعب بشكل خاص إضافة نمط جديد. الأمر ليس بسيطًا، لكن جوهر الأمر هو: إذا قمت بحل مشكلات أخرى، مثل تلك التي ذكرتها - على سبيل المثال، بناء الذكاء الاصطناعي ومراقبته والحصول على المنطق الصحيح - فإن إضافة نمط جديد ليس بالأمر الصعب. لذا بالنسبة لنا، فإن وجود جميع الأنماط أمر منطقي للغاية، ويوسع سوقنا. نحن في الأساس لا نعتمد على نمط معين، ونقوم ببناء وكيلنا الخاص لكل نمط.
بشكل عام، هناك عاملان محددان: أولاً، هل العميل مستعد لتبني الطريقة الجديدة؟ أعتقد أنه من المنطقي أن نبدأ بالرسائل النصية، لأن هذه هي الطريقة التي يتبناها الناس بشكل أكثر نشاطًا، وهي أقل خطورة بالنسبة لهم، وأسهل في المراقبة، وأسهل في الفهم. الطريقة الكبيرة الأخرى هي الصوت. من الواضح أنني أعتقد أن هناك مجالًا في السوق، ولا يزال قبول المستخدم للصوت بحاجة إلى التحسن. في الوقت الحالي، نرى بعض المستخدمين الأوائل الذين بدأوا في تبني وكلاء الصوت، وهو أمر مثير للغاية. الجانب الآخر هو التحديات الفنية. يتفق معظم الناس على أن المستوى مرتفع للغاية للصوت. إذا كنت تتحدث إلى شخص ما على الهاتف، فأنت بحاجة إلى زمن انتقال صوتي قصير جدًا. إذا قاطعت شخصًا ما، فيجب أن يستجيب بشكل طبيعي.
نظرًا لأن زمن الاستجابة للكلام أقل، فيجب أن تكون أكثر ذكاءً في طريقة الحساب. إذا كنت في محادثة وكان وقت الاستجابة من خمس إلى ثماني ثوانٍ، فلن تلاحظ ذلك بالكاد ويبدو طبيعيًا جدًا. ولكن إذا استغرق الأمر من خمس إلى ثماني ثوانٍ للرد على الهاتف، فيبدو الأمر غير طبيعي بعض الشيء. لذا فهناك المزيد من التحديات الفنية المتعلقة بالكلام. ومع حل هذه التحديات الفنية وزيادة الاهتمام بتبني الكلام في السوق، سيصبح الكلام كطريقة جديدة سائدًا.
نموذج أعمال يتخطى الثقة
كيمبرلي تان: قبل أن نستمر، أود أن أتحدث أكثر قليلاً عن نموذج عمل وكيل الذكاء الاصطناعي. عندما تبدأ في استخدام الذكاء الاصطناعي، تم البناء هل فاجأك أي شيء أثناء تواجدك مع عميل AI أو ناقشت مع العملاء النظام الذي يستخدمونه والبيانات التي يعالجونها ومخاوفهم؟ ما هي بعض الأشياء غير البديهية أو المفاجئة التي كان على Decagon القيام بها من أجل تقديم خدمة أفضل لعملاء المؤسسات؟
جيسي تشانغ: أعتقد أن أكثر ما أثار دهشتي هو مدى استعداد الناس للتحدث إلينا عندما بدأنا العمل. ففي النهاية، لم يكن هناك سوى اثنين منا. وقد بدأنا كلينا شركتين من قبل، لذا كنا نعرف الكثير من الناس، ولكن على الرغم من ذلك، بالنسبة لكل رائد أعمال، عندما تريد بدء محادثة إحالة، إذا لم يكن ما تقوله مقنعًا بشكل خاص، فإن المحادثة تكون فاترة إلى حد ما.
ولكن عندما بدأنا الحديث عن حالة الاستخدام هذه، وجدت أنه من المدهش حقًا مدى حماس الناس للحديث عنها. لأن الفكرة تبدو واضحة للغاية. قد تعتقد أنه نظرًا لأنها فكرة واضحة للغاية، فلا بد أن شخصًا آخر قد قام بها بالفعل، أو لا بد أن يكون هناك حل بالفعل، أو لا بد أن شخصًا آخر قد توصل بالفعل إلى نوع من الحلول. لكنني أعتقد أننا التقطنا لحظة جيدة، فحالة الاستخدام هذه كبيرة حقًا ويهتم بها الناس حقًا. وكما ذكرت من قبل، فإن حالة الاستخدام هذه مناسبة حقًا لأخذ AI Agent ودفعه إلى الإنتاج، لأنه يمكنك تنفيذه تدريجيًا وتكون قادرًا على تتبع عائد الاستثمار.
كانت هذه مفاجأة سارة بالنسبة لي، ولكن من الواضح أن هناك الكثير من العمل الذي يتعين القيام به بعد ذلك، حيث يتعين عليك العمل مع العملاء، وبناء المنتج، وتحديد الطريق الذي يجب اتباعه. في المرحلة الأولية، كان الاكتشاف مدهشًا حقًا.
ديريك هاريس: كيمبرلي، أشعر أنني يجب أن أذكر منشور المدونة الذي كتبته، RIP to RPA، والذي يتناول الكثير من فإن مهام الأتمتة والشركات الناشئة.هل تعتقد أن هناك ظاهرة حيث هذه المهام أو الحلول الآلية ليست مثالية، وبالتالي يبحث الناس دائمًا عن طريقة أفضل؟
كيمبرلي تان: نعم، أعتقد ذلك. وأود أن أقول بعض الأشياء. أولاً، إذا كانت الفكرة واضحة للجميع، ولكن لا توجد شركة واضحة لحلها، أو لا يشير أحد إلى شركة ويقول، "يجب عليك استخدام هذا"، فهذا يعني أن المشكلة لم يتم حلها فعليًا.
بمعنى ما، إنها فرصة مفتوحة تمامًا للشركة لتطوير حل. لأنه، كما قلت، كنا نتابع Decagon كمستثمر منذ البداية. لقد شاهدناهم يتنقلون عبر المتاهة الإبداعية، وعندما قرروا الذهاب في هذا الاتجاه وبدأوا في التحدث إلى العملاء، أصبح من الواضح أن جميع العملاء كانوا يائسين للحصول على نوع من الحلول المدعومة بالذكاء الاصطناعي الأصلي. هذه واحدة من المشكلات التي ذكرتها سابقًا، حيث يعتقد الكثير من الناس أنها مجرد غلاف GPT. لكن اهتمام العملاء الذي تلقته Decagon منذ البداية جعلنا ندرك في وقت مبكر أن العديد من هذه المشكلات أكثر تعقيدًا مما يتوقعه الناس.
أعتقد أن هذه الظاهرة تحدث في مختلف الصناعات، سواء كانت خدمة العملاء أو الأتمتة المهنية في قطاعات معينة. أعتقد أن إحدى النقاط التي لا تحظى بالتقدير الكافي، كما ذكر جيسي سابقًا، هي القدرة على قياس العائد على الاستثمار (ROI) من أتمتة المهام بوضوح. لأنه إذا كنت تريد أن تجعل شخصًا ما يقبل وكيل الذكاء الاصطناعي، فهو في الواقع يتخذ درجة من "القفزة الإيمانية" لأنها منطقة غير مألوفة جدًا بالنسبة للكثير من الناس.
إذا كان بإمكانك أتمتة عملية محددة للغاية والتي تعد إما عملية توليد إيرادات واضحة، أو عملية كانت تشكل في السابق عنق زجاجة في العمل، أو مركز تكلفة رئيسي يتزايد بشكل خطي مع نمو العملاء أو نمو الإيرادات، فسيكون من الأسهل الحصول على قبول لوكيل الذكاء الاصطناعي. إن القدرة على تحويل مثل هذه المشاكل إلى عملية أكثر إنتاجية يمكن توسيع نطاقها مثل البرامج التقليدية أمر جذاب للغاية.
كيمبرلي تان: لدي سؤال أخير قبل أن ننتقل إلى الموضوع التالي. أتذكر أن جيسي كان يقول دائمًا في مناقشاتنا السابقة إن التحدي الأكبر الذي تواجهه الشركات التي تتبنى البرامج أو وكلاء الذكاء الاصطناعي هو الهلوسة. لكنك أخبرتني ذات مرة أن هذه ليست المشكلة الرئيسية في الواقع. هل يمكنك توضيح سبب تضليل تصور الهلوسة إلى حد ما وما الذي يقلق الناس أكثر في الواقع؟
جيسي تشانغ: أعتقد أن الناس يهتمون بالهلوسة، لكنهم أكثر اهتمامًا بالقيمة التي يمكن أن تقدمها. تركز جميع الشركات التي نعمل معها تقريبًا على نفس القضايا القليلة، تقريبًا نفس الشيء: ما هي النسبة المئوية للمحادثات التي يمكنك حلها؟ ما مدى رضا عملائي؟ ثم يمكن تصنيف مشكلة الهلوسة كفئة ثالثة، وهي مدى دقتها. بشكل عام، يكون العاملان الأولان أكثر أهمية عند التقييم.
لنفترض أنك تتحدث إلى شركة جديدة وأنك قمت بعمل جيد حقًا في أول عاملين، وحصلت على الكثير من الدعم من القيادة وكل فرد في الفريق. يقولون، "يا إلهي، تجربة العملاء لدينا مختلفة. كل عميل لديه الآن مساعد شخصي يمكنه الاتصال بنا في أي وقت. لقد قدمنا لهم إجابات رائعة، وهم راضون جدًا، والمساعد متعدد اللغات ومتاح على مدار الساعة طوال أيام الأسبوع". هذا مجرد جزء من الأمر، كما أنك وفرت الكثير من المال أيضًا.
لذا بمجرد تحقيق هذه الأهداف، ستحصل على الكثير من الدعم والكثير من الرياح المؤاتية لدفع العمل. بالطبع، يجب حل مشكلة الوهم في النهاية، لكنها ليست الشيء الذي يثير قلقهم أكثر من غيره. الطريقة لحل الوهم هي نفس الطريقة التي ذكرتها من قبل - سيختبرك الناس. قد تكون هناك مرحلة إثبات المفهوم حيث تدير محادثات حقيقية ويكون لديهم أعضاء الفريق يراقبون ويتحققون من الدقة. إذا سارت الأمور على ما يرام، فعادةً ما يتم ذلك.
كما ذكرت سابقًا، يمكنك إعداد بعض تدابير الحماية الصارمة للمعلومات الحساسة، مثل عدم الحاجة بالضرورة إلى جعل المحتوى الحساس عامًا. لذا فإن قضية الوهم هي نقطة نقاش في معظم المعاملات. إنها ليست موضوعًا غير مهم. سوف تمر بهذه العملية، لكنها ليست محور المحادثة أبدًا.
كيمبرلي تان: الآن دعنا ننتقل إلى نموذج عمل وكلاء الذكاء الاصطناعي. اليوم، هناك موضوع كبير حول كيفية تسعير وكلاء الذكاء الاصطناعي.
تاريخيًا، يتم تسعير العديد من برامج SaaS بناءً على عدد المقاعد لأنها برامج سير عمل تستهدف الموظفين الأفراد وتستخدم لتحسين إنتاجية الموظفين. ومع ذلك، لا يرتبط AI Agent بإنتاجية الموظفين الأفراد مثل البرامج التقليدية.
يعتقد الكثير من الناس أن طريقة التسعير القائمة على عدد المقاعد قد لا تكون قابلة للتطبيق بعد الآن. أنا أشعر بالفضول بشأن كيف لقد فكرت في هذه المعضلة في الأيام الأولى وكيف قررت في النهاية تحديد سعر Decagon. أيضًا، ما هو الاتجاه المستقبلي لتسعير البرامج في رأيك مع انتشار AI Agent بشكل متزايد؟
جيسي تشانغ: إن وجهة نظرنا بشأن هذه القضية هي أنه في الماضي، كان يتم تسعير البرامج حسب المقعد لأن حجمها كان يعتمد بشكل تقريبي على عدد الأشخاص الذين يمكنهم استخدام البرنامج. ولكن بالنسبة لمعظم وكلاء الذكاء الاصطناعي، فإن القيمة التي تقدمها لا تعتمد على عدد الأشخاص الذين يقومون بصيانتها، بل على كمية العمل المنتج. وهذا يتفق مع النقطة التي ذكرتها سابقًا: إذا كان العائد على الاستثمار قابلاً للقياس للغاية، فإن مستوى الناتج من العمل يكون واضحًا للغاية أيضًا.
إن وجهة نظرنا هي أن التسعير بناءً على عدد المقاعد لا ينطبق بالتأكيد. يمكنك تحديد السعر بناءً على ناتج العمل. لذا، يجب أن يكون نموذج التسعير الذي تقدمه هو أنه كلما زاد العمل المنجز، زاد المبلغ الذي تدفعه.
بالنسبة لنا، هناك طريقتان واضحتان للتسعير. يمكنك إما تسعير المحادثات، أو يمكنك تسعير المحادثات التي يحلها الذكاء الاصطناعي بالفعل. أعتقد أن أحد الدروس المثيرة للاهتمام التي تعلمناها هو أن معظم الناس اختاروا نموذج تسعير المحادثة. والسبب هو أن الميزة الرئيسية للتسعير حسب الحل هي أنك تدفع مقابل ما تحصل عليه. فإن الذكاء الاصطناعي يفعل ذلك.
ولكن السؤال الذي يطرح نفسه هنا هو: ما الذي يمكن اعتباره "حلاً"؟ أولاً وقبل كل شيء، لا أحد يرغب في الخوض في هذا الأمر بعمق، لأن الأمر يصبح على النحو التالي: "إذا جاء شخص غاضب وطردته، فلماذا ندفع ثمن ذلك؟"
وهذا يخلق موقفًا محرجًا ويجعل الحوافز المقدمة لمقدمي خدمات الذكاء الاصطناعي غريبة بعض الشيء، لأن الفوترة حسب الحل تعني "نحن بحاجة فقط إلى حل أكبر عدد ممكن من المحادثات ودفع بعض الأشخاص بعيدًا". ولكن هناك العديد من الحالات حيث يكون من الأفضل تصعيد المشكلة بدلاً من دفعها بعيدًا، والعملاء لا يحبون هذا النوع من التعامل. لذلك، فإن الفوترة حسب المحادثة ستجلب المزيد من البساطة والقدرة على التنبؤ.
كيمبرلي تان: إلى متى تعتقد أن نموذج التسعير المستقبلي سوف يستمر؟لأنه في الوقت الحالي عندما تذكر عائد الاستثمار، فإنه يعتمد عادةً على الإنفاق السابق الذي ربما تم استخدامه لتغطية تكاليف العمالة. مع تزايد شيوع وكلاء الذكاء الاصطناعي، هل تعتقد أنه في الأمد البعيد، سيتم مقارنة الذكاء الاصطناعي بتكاليف العمالة وأن هذا هو المعيار المناسب؟ إذا لم يكن الأمر كذلك، فكيف ترى التسعير في الأمد البعيد بما يتجاوز تكاليف العمالة؟
جيسي تشانغ: أعتقد أنه على المدى الطويل، قد يظل تسعير وكيل الذكاء الاصطناعي مرتبطًا في المقام الأول بتكاليف العمالة، لأن هذا هو جمال الوكيل - حيث يمكن الآن تحويل إنفاقك السابق على الخدمات إلى البرامج.
قد يكون هذا الجزء من الإنفاق أكبر من إنفاق البرمجيات بعشرة إلى مائة مرة، لذا فإن الكثير من التكلفة سوف تنتقل إلى البرمجيات. وبالتالي، فإن تكاليف العمالة سوف تصبح بطبيعة الحال معيارًا. وبالنسبة لعملائنا، فإن العائد على الاستثمار واضح للغاية. إذا كان بإمكانك توفير X مليون دولار من تكاليف العمالة، فمن المنطقي أن تتبنى هذا الحل. ولكن على المدى الطويل، قد يكون هذا في منتصف الطريق.
لأن بعض المنتجات التي لا تضاهي جودة وكيلنا ستقبل أسعارًا أقل. وهذا يشبه موقف SaaS الكلاسيكي، حيث يتنافس الجميع على حصة السوق.
كيمبرلي تان: ما رأيك في مستقبل شركات SaaS الحالية، وخاصة تلك التي قد لا تكون منتجاتها مصممة للذكاء الاصطناعي بشكل أصلي أو تلك التي يتم تسعيرها لكل مقعد وبالتالي لا يمكنها التكيف مع نموذج التسعير الموجه نحو النتائج؟
جيسي تشانغ: بالنسبة لبعض الشركات التقليدية، فإن الأمر صعب بعض الشيء إذا حاولت إطلاق منتج AI Agent لأنها لا تستطيع تسعيره باستخدام نموذج المقعد. إذا لم تعد بحاجة إلى عدد كبير من الوكلاء، فسيكون من الصعب الحفاظ على الإيرادات بالمنتج الحالي. هذه مشكلة للشركات التقليدية، لكن من الصعب القول. تتمتع الشركات التقليدية دائمًا بميزة قنوات التوزيع. حتى إذا لم يكن المنتج جيدًا مثل الشركة الجديدة، فإن الناس يترددون في بذل الجهد لقبول مورد جديد بجودة 80% فقط.
لذا، أولاً، إذا كنت شركة ناشئة مثلنا، فيجب عليك التأكد من أن منتجك أفضل بثلاث مرات من المنتج التقليدي. ثانيًا، هذه منافسة نموذجية بين الشركات التقليدية والشركات الناشئة. تتمتع الشركات التقليدية بطبيعة الحال بتحمل أقل للمخاطر لأن لديها عددًا كبيرًا من العملاء. إذا ارتكبت خطأ في التكرار السريع، فسيؤدي ذلك إلى خسائر فادحة. ومع ذلك، يمكن للشركات الناشئة التكرار بشكل أسرع، وبالتالي فإن عملية التكرار نفسها يمكن أن تؤدي إلى منتج أفضل. هذه هي الدورة المعتادة. بالنسبة لنا، كنا دائمًا فخورين بسرعة التسليم وجودة المنتج وتنفيذ فريقنا. لهذا السبب فزنا بالصفقة الحالية.
كيمبرلي تان: هل يمكنك تقديم بعض التوقعات حول مستقبل الذكاء الاصطناعي في مكان العمل؟ على سبيل المثال، كيف سيغير احتياجات الموظفين أو قدراتهم، أو كيف يتفاعل الموظفون البشريون ووكلاء الذكاء الاصطناعي؟ما هي أفضل الممارسات أو المعايير الجديدة التي تعتقد أنها ستصبح القاعدة في مكان العمل مع انتشار وكلاء الذكاء الاصطناعي على نطاق أوسع؟
جيسي تشانغ: التغيير الأول والأهم هو أننا مقتنعون بأنه في المستقبل، سوف يقضي الموظفون وقتًا أطول بكثير في مكان العمل لبناء وإدارة وكلاء الذكاء الاصطناعي، على غرار دور مشرفي الذكاء الاصطناعي. حتى لو لم يكن منصبك رسميًا هو "مشرف الذكاء الاصطناعي"، فإن الكثير من الوقت الذي اعتدت أن تقضيه في أداء وظيفتك سيتم تحويله إلى إدارة هؤلاء الوكلاء، لأن الوكلاء يمكن أن يمنحوك قدرًا كبيرًا من النفوذ.
لقد رأينا هذا في العديد من المهام حيث يقضي الأشخاص الذين كانوا في السابق قادة فرق الكثير من الوقت في مراقبة الذكاء الاصطناعي، على سبيل المثال، للتأكد من عدم وجود مشاكل فيه أو لإجراء التعديلات. إنهم يراقبون الأداء العام لمعرفة ما إذا كانت هناك مجالات محددة تحتاج إلى الاهتمام، وما إذا كانت هناك فجوات في قاعدة المعرفة التي يمكن أن تساعد الذكاء الاصطناعي على التحسن، وما إذا كان الذكاء الاصطناعي قادرًا على سد هذه الفجوات.
إن العمل الذي يصاحب العمل مع وكيل يعطي انطباعًا بأن الموظفين في المستقبل سوف يقضون قدرًا كبيرًا من الوقت في التفاعل مع وكلاء الذكاء الاصطناعي. وهذا مفهوم أساسي لشركتنا، كما ذكرت سابقًا. لذلك، تم تصميم منتجنا بالكامل لتزويد الأشخاص بالأدوات والتصور والقدرة على التفسير والتحكم. أعتقد أنه خلال عام واحد، سيصبح هذا اتجاهًا كبيرًا.
كيمبرلي تان: هذا منطقي للغاية. ما هي القدرات التي تعتقد أن المشرفين على الذكاء الاصطناعي سيحتاجون إليها في المستقبل؟ ما هي مجموعة المهارات اللازمة لهذا الدور؟
جيسي تشانغ: هناك جانبين. الأول هو القدرة على الملاحظة والتفسير، أي القدرة على فهم ما يفعله الذكاء الاصطناعي بسرعة وكيفية اتخاذه للقرارات. والثاني هو القدرة على اتخاذ القرار، أو الجزء المتعلق بالبناء، وكيفية تقديم الملاحظات وكيفية بناء منطق جديد. أعتقد أن هذين وجهان لعملة واحدة.
كيمبرلي تان: ما هي المهام التي تعتقد أنها ستظل خارج قدرات وكيل الذكاء الاصطناعي على المدى المتوسط أو الطويل وستظل بحاجة إلى الإدارة والتنفيذ بشكل صحيح من قبل البشر؟
جيسي تشانغ: أعتقد أن الأمر سيعتمد بشكل أساسي على متطلب "الكمال" الذي ذكرته سابقًا. هناك العديد من المهام التي تتمتع بتسامح منخفض جدًا مع الخطأ. في هذه الحالات، تكون أي أداة ذكاء اصطناعي بمثابة مساعدة أكثر من كونها وكيلًا كاملًا.
على سبيل المثال، في بعض الصناعات الأكثر حساسية، مثل الرعاية الصحية أو الأمن، حيث يتعين عليك أن تكون مثاليًا تقريبًا، ففي هذه المجالات، قد تصبح وكلاء الذكاء الاصطناعي أقل استقلالية، لكن هذا لا يعني أنهم عديمو الفائدة. أعتقد أن الأسلوب سيكون مختلفًا، ففي منصة مثل منصتنا، تقوم في الواقع بنشر هؤلاء الوكلاء للسماح لهم بأتمتة المهمة بأكملها.
ديريك هاريس: هذا كل شيء في هذه الحلقة. إذا وجدت هذا الموضوع مثيرًا للاهتمام أو ملهمًا، فيرجى تقييم البودكاست الخاص بنا ومشاركته مع المزيد من الأشخاص.نتوقع إصدار الحلقة الأخيرة قبل نهاية العام وسنعمل على إعادة تصميم المحتوى للعام الجديد. شكرًا لاستماعكم ونتمنى لكم موسم عطلات رائعًا (إذا كنتم تستمعون خلال العطلات).
الفيديو الأصلي: هل يمكن لوكلاء Al إصلاح دعم العملاء أخيرًا؟?