Ανταύγειες

  • Η μαγεία των LLM είναι ότι είναι πολύ ευέλικτοι, μπορούν να προσαρμοστούν σε πολλές διαφορετικές καταστάσεις και έχουν βασική νοημοσύνη.
  • Πιστεύουμε ότι με την πάροδο του χρόνου, το UI και το UX θα βασίζονται όλο και περισσότερο στη φυσική γλώσσα, επειδή αυτός είναι ο τρόπος με τον οποίο σκέφτεται ένα σύστημα Agent ή αυτή είναι βασικά η βάση της εκπαίδευσης για μεγάλα γλωσσικά μοντέλα (LLM).
  • Εάν θέλετε κάποιος να δεχτεί έναν πράκτορα AI, στην πραγματικότητα κάνει ένα βαθμό «άλμα πίστης» γιατί για πολλούς ανθρώπους, αυτό είναι ένα πολύ άγνωστο πεδίο.

Το AI Agent αναδιαμορφώνει την εμπειρία του πελάτη

Jesse Zhang: Πώς κατασκευάζεται πραγματικά ένας Πράκτορας; Η άποψή μας είναι ότι με την πάροδο του χρόνου, θα γίνεται όλο και περισσότερο σαν ένας Πράκτορας που βασίζεται σε φυσική γλώσσα, επειδή έτσι εκπαιδεύονται τα μεγάλα γλωσσικά μοντέλα (LLM).

Μακροπρόθεσμα, εάν έχετε έναν εξαιρετικά ευφυή πράκτορα που είναι στην πραγματικότητα σαν άνθρωπος, μπορείτε να του δείξετε πράγματα, να του εξηγήσετε, να του δώσετε σχόλια και θα ενημερώσει τις πληροφορίες στο μυαλό του.

Μπορείτε να φανταστείτε ότι έχετε ένα πολύ ικανό ανθρώπινο μέλος της ομάδας. Όταν εντάσσονται για πρώτη φορά, τους διδάσκεις κάτι, αρχίζουν να εργάζονται και μετά τους δίνεις σχόλια και τους δείχνεις νέες πληροφορίες.

Τελικά, θα αναπτυχθεί προς αυτή την κατεύθυνση – θα γίνει πιο συνομιλητικό και περισσότερο βασισμένο στη φυσική γλώσσα, και ο τρόπος που οι άνθρωποι επικοινωνούν μεταξύ τους θα γίνει πιο φυσικός. Και οι άνθρωποι δεν θα χρησιμοποιούν πλέον αυτά τα περίπλοκα δέντρα αποφάσεων για να συλλάβουν απαιτήσεις, οι οποίες μπορούν να λειτουργήσουν αλλά είναι επιρρεπείς σε κατάρρευση.

Στο παρελθόν, έπρεπε να το κάνουμε αυτό γιατί δεν είχαμε μεγάλο γλωσσικό μοντέλο. Αλλά τώρα, με τη συνεχή πρόοδο του Agent, η εμπειρία χρήστη (UX) και η διεπαφή χρήστη (UI) θα γίνουν πιο συνομιλητικά.

Derrick Harris: Γεια σε όλους, καλώς ήρθατε στο A16z AI Podcast. Είμαι ο Derrick Harris και σήμερα θα βρεθούν μαζί μου ο Jesse Zhang, συνιδρυτής και Διευθύνων Σύμβουλος της Decagon, και η Kimberly Tan, συνεργάτης στο a16z. Η Kimberly θα συντονίσει τη συζήτηση και ο Jesse θα μοιραστεί την εμπειρία του στην κατασκευή του Decagon και των προϊόντων του.

Εάν δεν γνωρίζετε πολλά για αυτό, η Decagon είναι μια startup που παρέχει πράκτορες AI σε επιχειρήσεις για να βοηθήσουν με την υποστήριξη πελατών. Αυτοί οι πράκτορες δεν είναι ούτε chatbot ούτε περιτυλίγματα LLM για μία μόνο κλήση API, αλλά εξαιρετικά προσαρμοσμένοι προηγμένοι πράκτορες που μπορούν να χειριστούν περίπλοκες ροές εργασίας με βάση τις συγκεκριμένες ανάγκες μιας εταιρείας.

Εκτός από την εξήγηση γιατί δημιούργησαν το Decagon και πώς έχει σχεδιαστεί για να χειρίζεται διαφορετικά περιβάλλοντα LLM και πελατών, ο Jesse μιλά επίσης για τα οφέλη ενός επιχειρηματικού μοντέλου που χρεώνει ανά συνομιλία και πώς οι Agents AI θα αλλάξουν τις δεξιότητες που απαιτούνται από τους ηγέτες υποστήριξης πελατών.

Αξίζει επίσης να αναφέρουμε ότι η Kimberly έγραψε πρόσφατα μια ανάρτηση ιστολογίου με τίτλο «RIP to RPA, The Rise of Intelligent Automation», την οποία συζητάμε εν συντομία σε αυτό το επεισόδιο.

Είναι ένα εξαιρετικό σημείο εκκίνησης για να κατανοήσετε πώς απογειώνεται η αυτοματοποίηση στις επιχειρηματικές διαδικασίες και θα παρέχουμε έναν σύνδεσμο στις σημειώσεις της εκπομπής. Τέλος, υπενθυμίζουμε ότι το περιεχόμενο αυτού του άρθρου είναι μόνο για ενημερωτικούς σκοπούς και δεν πρέπει να θεωρείται νομική, επιχειρηματική, φορολογική ή επενδυτική συμβουλή, ούτε πρέπει να χρησιμοποιείται για την αξιολόγηση οποιασδήποτε επένδυσης ή ασφάλειας και δεν απευθύνεται σε επενδυτές κεφαλαίων a16z ή δυνητικό επενδυτή.

Jesse Zhang: Μια σύντομη εισαγωγή στον εαυτό μου. Γεννήθηκα και μεγάλωσα στο Μπόλντερ και συμμετείχα σε πολλούς μαθηματικούς διαγωνισμούς και παρόμοια ως παιδί. Σπούδασα επιστήμη υπολογιστών στο Χάρβαρντ και μετά ίδρυσα μια εταιρεία που υποστηριζόταν επίσης από την a16z. Μας εξαγόρασε τελικά η Niantic.

Μετά ξεκινήσαμε να χτίζουμε το Decagon. Η επιχείρησή μας είναι η δημιουργία αντιπροσώπων AI για την εξυπηρέτηση πελατών. Στην αρχή το κάναμε αυτό γιατί θέλαμε να κάνουμε κάτι που ήταν πολύ κοντά στην καρδιά μας.

Φυσικά, κανείς δεν χρειάζεται να διδαχθεί για τον ρόλο των πρακτόρων AI στην εξυπηρέτηση πελατών, σωστά; Έχουμε όλοι τηλέφωνο με αεροπορικές εταιρείες, ξενοδοχεία κ.λπ., και περιμέναμε σε αναμονή. Από εκεί λοιπόν ήρθε η ιδέα.

Μιλήσαμε με πολλούς πελάτες για να μάθουμε ακριβώς τι είδους προϊόν πρέπει να κατασκευάσουμε. Ένα πράγμα που ξεχώρισε για εμάς ήταν ότι καθώς μάθαμε περισσότερα για τους πράκτορες AI, αρχίσαμε να σκεφτόμαστε πώς θα ήταν το μέλλον όταν υπήρχαν πολλοί από αυτούς. Νομίζω ότι όλοι πιστεύουν ότι θα υπάρχουν πολλοί Πράκτορες AI στο μέλλον.

Αυτό που σκεφτόμαστε είναι τι θα κάνουν οι υπάλληλοι που εργάζονται γύρω από πράκτορες AI; Τι είδους εργαλεία θα έχουν; Πώς θα ελέγχουν ή θα βλέπουν τους πράκτορες με τους οποίους συνεργάζονται ή διαχειρίζονται;

Αυτός είναι λοιπόν ο πυρήνας του τρόπου με τον οποίο χτίσαμε την εταιρεία γύρω από αυτό το ερώτημα. Νομίζω ότι αυτό είναι επίσης που μας ξεχωρίζει αυτή τη στιγμή, επειδή παρέχουμε σε αυτούς τους πράκτορες AI διάφορα εργαλεία για να βοηθήσουμε τους ανθρώπους με τους οποίους συνεργαζόμαστε να δημιουργήσουν και να διαμορφώσουν αυτούς τους πράκτορες έτσι ώστε να μην είναι πλέον ένα «μαύρο κουτί». Έτσι χτίζουμε το brand μας.

Derrick Harris: Τι σας ενέπνευσε, δεδομένου ότι η τελευταία σας εταιρεία ήταν μια εταιρεία βίντεο που απευθύνεται σε καταναλωτές, να προχωρήσετε στο επιχειρηματικό λογισμικό;

Jesse Zhang: Μεγάλη ερώτηση. Νομίζω ότι οι ιδρυτές είναι συχνά «αγνωστικιστές του θέματος» όταν πρόκειται για την επιλογή ενός θέματος, γιατί στην πραγματικότητα, όταν προσεγγίζεις έναν νέο τομέα, συνήθως είσαι αρκετά αφελής. Επομένως, υπάρχει ένα πλεονέκτημα να βλέπεις τα πράγματα από μια νέα οπτική γωνία. Έτσι, όταν το σκεφτόμασταν, δεν υπήρχαν σχεδόν περιορισμοί θέματος.

Νομίζω ότι αυτό είναι ένα πολύ κοινό μοτίβο για άτομα με πιο ποσοτικά υπόβαθρα, συμπεριλαμβανομένου και εμένα. Αφού δοκιμάσετε καταναλωτικά προϊόντα, τείνετε να έλκεστε περισσότερο προς το εταιρικό λογισμικό επειδή το εταιρικό λογισμικό έχει πιο συγκεκριμένα προβλήματα.

Έχετε πραγματικούς πελάτες με πραγματικές ανάγκες και προϋπολογισμούς και τέτοια πράγματα, και μπορείτε να βελτιστοποιήσετε και να λύσετε προβλήματα για αυτούς. Η καταναλωτική αγορά είναι επίσης πολύ ελκυστική, αλλά βασίζεται περισσότερο στη διαίσθηση παρά στον πειραματισμό. Για μένα προσωπικά, το εταιρικό λογισμικό ταιριάζει καλύτερα.

Kimberly Tan: Πρώτον, μπορούμε να ξεκινήσουμε με αυτήν την ερώτηση: Ποιες είναι οι πιο κοινές κατηγορίες υποστήριξης με τις οποίες ασχολείται σήμερα ο Decagon; Μπορείτε να αναλύσετε πώς χρησιμοποιείτε μεγάλα γλωσσικά μοντέλα (LLM) για να λύσετε αυτά τα προβλήματα και τι μπορείτε να κάνετε τώρα που δεν μπορούσατε να κάνετε πριν;

Jesse Zhang: Αν κοιτάξετε πίσω στον προηγούμενο αυτοματισμό, μπορεί να έχετε χρησιμοποιήσει δέντρα αποφάσεων για να κάνετε κάτι απλό, για να καθορίσετε ποιο μονοπάτι να ακολουθήσετε. Αλλά όλοι έχουμε χρησιμοποιήσει chatbot και είναι μια αρκετά απογοητευτική εμπειρία.

Συχνά η ερώτησή σας δεν μπορεί να απαντηθεί πλήρως από ένα δέντρο αποφάσεων. Έτσι καταλήγετε να κατευθύνεστε σε μια διαδρομή ερώτησης που σχετίζεται με την ερώτηση αλλά δεν ταιριάζει ακριβώς με αυτήν. Τώρα, έχουμε μεγάλα γλωσσικά μοντέλα (LLM). Η μαγεία των LLM είναι ότι είναι πολύ ευέλικτοι, μπορούν να προσαρμοστούν σε πολλές διαφορετικές καταστάσεις και έχουν βασική νοημοσύνη.

Όταν το εφαρμόζετε στην υποστήριξη πελατών ή όταν ένας πελάτης κάνει μια ερώτηση, μπορείτε να παρέχετε μια πιο εξατομικευμένη υπηρεσία. Αυτό είναι το πρώτο σημείο, το επίπεδο εξατομίκευσης έχει βελτιωθεί πολύ. Αυτό ξεκλειδώνει υψηλότερες μετρήσεις. Μπορείτε να λύσετε περισσότερα προβλήματα, οι πελάτες είναι πιο ικανοποιημένοι και η ικανοποίηση των πελατών αυξάνεται.

Το επόμενο φυσικό βήμα είναι: εάν έχετε αυτή τη νοημοσύνη, θα πρέπει να μπορείτε να κάνετε περισσότερα από τα πράγματα που μπορούν να κάνουν οι άνθρωποι. Τα πράγματα που μπορούν να κάνουν οι άνθρωποι είναι ότι μπορούν να αντλούν δεδομένα σε πραγματικό χρόνο, μπορούν να αναλάβουν δράση και μπορούν να συλλογιστούν μέσω πολλών βημάτων. Εάν ένας πελάτης κάνει μια σχετικά περίπλοκη ερώτηση, ίσως «θέλω να κάνω αυτό και εκείνο» και η τεχνητή νοημοσύνη είναι έτοιμη να χειριστεί μόνο την πρώτη ερώτηση. Το LLM είναι αρκετά έξυπνο για να αναγνωρίσει ότι υπάρχουν δύο ερωτήσεις εδώ. Πρώτα, θα λύσει το πρώτο πρόβλημα και μετά θα σας βοηθήσει να λύσετε το δεύτερο πρόβλημα.

Πριν εμφανιστεί το LLM, αυτό ήταν βασικά αδύνατο. Βλέπουμε λοιπόν τώρα μια σταδιακή αλλαγή στο τι μπορεί να κάνει η τεχνολογία, και αυτό χάρη στο LLM.

Kimberly Tan: Σε αυτό το πλαίσιο, πώς θα ορίζατε έναν πράκτορα AI; Καθώς η λέξη "Agent" χρησιμοποιείται ευρέως, είμαι περίεργος να μάθω τι σημαίνει στην πραγματικότητα στο πλαίσιο του Decagon.

Jesse Zhang: Θα έλεγα ότι το Agent αναφέρεται περισσότερο σε ένα σύστημα όπου πολλαπλά συστήματα LLM (μεγάλο μοντέλο γλώσσας) συνεργάζονται. Έχετε μια επίκληση LLM, η οποία βασικά περιλαμβάνει την αποστολή μιας προτροπής και τη λήψη απάντησης. Για έναν Πράκτορα, θέλετε να μπορείτε να συνδέσετε πολλές τέτοιες επικλήσεις, ίσως ακόμη και αναδρομικά.

Για παράδειγμα, έχετε μια κλήση LLM που καθορίζει τον τρόπο χειρισμού του μηνύματος και, στη συνέχεια, μπορεί να ενεργοποιήσει άλλες κλήσεις που αντλούν περισσότερα δεδομένα, εκτελούν ενέργειες και επαναλαμβάνουν αυτά που είπε ο χρήστης, ίσως ακόμη και να κάνουν ερωτήσεις παρακολούθησης. Επομένως, για εμάς, ένας Πράκτορας μπορεί να γίνει κατανοητός ως ένα δίκτυο κλήσεων σχεδόν LLM, κλήσεων API ή άλλης λογικής που συνεργάζονται για να παρέχουν καλύτερη εμπειρία.

Kimberly Tan: Σε αυτό το θέμα, ίσως μπορούμε να μιλήσουμε περισσότερο για την υποδομή Agent που έχετε πραγματικά δημιουργήσει. Νομίζω ότι ένα πολύ ενδιαφέρον σημείο είναι ότι υπάρχουν πολλές επιδείξεις AI Agents στην αγορά, αλλά νομίζω ότι υπάρχουν πολύ λίγα παραδείγματα αυτών που μπορούν πραγματικά να λειτουργήσουν σταθερά σε περιβάλλον παραγωγής. Και είναι δύσκολο να ξέρεις απ' έξω τι είναι πραγματικό και τι όχι.

Επομένως, κατά τη γνώμη σας, ποιες πτυχές των σημερινών πρακτόρων AI τα πάνε καλά και ποιες πτυχές απαιτούν ακόμη τεχνολογικές ανακαλύψεις για να γίνουν πιο ισχυροί και αξιόπιστοι;

Jesse Zhang: Η άποψή μου είναι στην πραγματικότητα λίγο διαφορετική. Η διαφορά μεταξύ του προσδιορισμού του εάν ένας Πράκτορας AI είναι απλώς ένα demo ή «πραγματικά λειτουργεί» δεν βρίσκεται εξ ολοκλήρου στη στοίβα τεχνολογίας, επειδή νομίζω ότι οι περισσότεροι άνθρωποι μπορεί να χρησιμοποιούν περίπου την ίδια τεχνολογία. Νομίζω ότι αφού προχωρήσετε παραπέρα στην ανάπτυξη της εταιρείας σας, για παράδειγμα, η εταιρεία μας έχει ιδρυθεί για περισσότερο από ένα χρόνο, θα δημιουργήσετε κάτι πολύ συγκεκριμένο που να ταιριάζει στην περίπτωση χρήσης σας.

Αλλά σε τελική ανάλυση, όλοι μπορούν να έχουν πρόσβαση στο ίδιο μοντέλο και να χρησιμοποιούν παρόμοια τεχνολογία. Νομίζω ότι η μεγαλύτερη διαφοροποίηση για το αν ένας πράκτορας AI μπορεί να λειτουργήσει αποτελεσματικά βρίσκεται στην πραγματικότητα στη μορφή της περίπτωσης χρήσης. Είναι δύσκολο να το γνωρίζουμε αυτό στην αρχή, αλλά κοιτάζοντας πίσω, θα διαπιστώσετε ότι υπάρχουν δύο χαρακτηριστικά που είναι πολύ σημαντικά για έναν πράκτορα AI να προχωρήσει πέρα από την επίδειξη και να εισέλθει στην πρακτική εφαρμογή.

Το πρώτο είναι ότι η περίπτωση χρήσης που επιλύετε πρέπει να έχει ποσοτικοποιήσιμο ROI (απόδοση επένδυσης). Αυτό είναι πολύ σημαντικό, γιατί εάν η απόδοση επένδυσης δεν μπορεί να προσδιοριστεί ποσοτικά, θα είναι δύσκολο να πείσετε τους ανθρώπους να χρησιμοποιήσουν πραγματικά το προϊόν σας και να πληρώσουν για αυτό. Στην περίπτωσή μας, ο ποσοτικός δείκτης είναι: ποιο ποσοστό των αιτημάτων υποστήριξης επιλύετε; Επειδή αυτός ο αριθμός είναι σαφής, οι άνθρωποι μπορούν να τον καταλάβουν – ω, εντάξει, αν επιλύσετε περισσότερα, μπορώ να συγκρίνω αυτό το αποτέλεσμα με τα τρέχοντα έξοδα και τον χρόνο που ξοδεύω. Έτσι, εάν υπάρχει αυτός ο δείκτης, ένας άλλος δείκτης που είναι πολύ σημαντικός για εμάς είναι η ικανοποίηση των πελατών. Επειδή το ROI μπορεί εύκολα να ποσοτικοποιηθεί, οι άνθρωποι θα το υιοθετήσουν πραγματικά.

Ο δεύτερος παράγοντας είναι ότι οι περιπτώσεις χρήσης πρέπει να είναι σταδιακά πιο δύσκολες. Θα ήταν επίσης πολύ δύσκολο αν χρειαζόσασταν έναν Πράκτορα να είναι υπεράνθρωπος από την αρχή, λύνοντας σχεδόν 100% των περιπτώσεων χρήσης. Επειδή, όπως γνωρίζουμε, τα LLM δεν είναι ντετερμινιστικά, πρέπει να έχετε κάποιο είδος σχεδίου έκτακτης ανάγκης. Ευτυχώς, υπάρχει ένα εξαιρετικό χαρακτηριστικό των περιπτώσεων χρήσης υποστήριξης, και αυτό είναι ότι μπορείτε πάντα να κλιμακωθείτε σε άνθρωπο. Ακόμα κι αν μπορείτε να λύσετε μόνο τα μισά προβλήματα, εξακολουθεί να είναι πολύ πολύτιμο για τους ανθρώπους.

Νομίζω λοιπόν ότι αυτή η υποστήριξη έχει αυτό το χαρακτηριστικό που την καθιστά πολύ κατάλληλη για AI Agent. Νομίζω ότι υπάρχουν πολλοί άλλοι τομείς όπου οι άνθρωποι μπορούν να δημιουργήσουν εντυπωσιακά demo όπου δεν χρειάζεται καν να κοιτάξετε προσεκτικά για να καταλάβετε γιατί το AI Agent θα ήταν χρήσιμο. Αλλά αν πρέπει να είναι τέλειο από την αρχή, τότε είναι πολύ δύσκολο. Αν συμβαίνει αυτό, σχεδόν κανείς δεν θα θέλει να το δοκιμάσει ή να το χρησιμοποιήσει, επειδή οι συνέπειες της ατέλειάς του μπορεί να είναι πολύ σοβαρές – για παράδειγμα, όσον αφορά την ασφάλεια.

Για παράδειγμα, όταν οι άνθρωποι κάνουν προσομοιώσεις, έχουν πάντα αυτή την κλασική σκέψη: «Ω, θα ήταν υπέροχο αν το LLM μπορούσε να το διαβάσει αυτό». Αλλά είναι δύσκολο να φανταστεί κανείς κάποιον να λέει, «Εντάξει, πράκτορα AI, βάλε το. Πιστεύω ότι μπορείς να το κάνεις." Γιατί αν κάνει λάθος, οι συνέπειες μπορεί να είναι πολύ σοβαρές.

Jesse Zhang: Αυτό συνήθως αποφασίζουν οι πελάτες μας, και μάλιστα βλέπουμε ένα πολύ μεγάλο εύρος διαφορών. Στο ένα άκρο, μερικοί άνθρωποι κάνουν πραγματικά τον Πράκτορά τους να μοιάζει με άνθρωπο, επομένως υπάρχει ένα ανθρώπινο avatar, ένα ανθρώπινο όνομα και οι απαντήσεις είναι πολύ φυσικές. Από την άλλη, ο Πράκτορας δηλώνει απλώς ότι είναι AI και το κάνει ξεκάθαρο στον χρήστη. Νομίζω ότι οι διάφορες εταιρείες με τις οποίες συνεργαζόμαστε έχουν διαφορετικές θέσεις σχετικά με αυτό.

Συνήθως, εάν είστε σε μια ρυθμιζόμενη βιομηχανία, πρέπει να το καταστήσετε σαφές. Αυτό που βρίσκω ενδιαφέρον τώρα είναι ότι η συμπεριφορά των πελατών αλλάζει. Επειδή πολλοί από τους πελάτες μας λαμβάνουν πολλά σχόλια στα μέσα κοινωνικής δικτύωσης, όπως, "Θεέ μου, αυτή είναι η πρώτη εμπειρία συνομιλίας που έχω δοκιμάσει ποτέ και η οποία είναι πραγματικά τόσο αληθινή" ή "Αυτό είναι απλά μαγικό". Και αυτό είναι υπέροχο για αυτούς, γιατί τώρα οι πελάτες τους μαθαίνουν, αν πρόκειται για εμπειρία τεχνητής νοημοσύνης, μπορεί στην πραγματικότητα να είναι καλύτερη από έναν άνθρωπο. Αυτό δεν ίσχυε στο παρελθόν, γιατί οι περισσότεροι από εμάς είχαμε στο παρελθόν αυτό το είδος εμπειρίας εξυπηρέτησης πελατών μέσω τηλεφώνου: «Εντάξει, AI, AI, AI…»

Kimberly Tan: Αναφέρατε την έννοια της εξατομίκευσης μερικές φορές. Όλοι χρησιμοποιούν την ίδια υποκείμενη αρχιτεκτονική τεχνολογίας, αλλά έχουν διαφορετικές ανάγκες εξατομίκευσης όσον αφορά τις υπηρεσίες υποστήριξης. Μπορείτε να μιλήσετε για αυτό; Συγκεκριμένα, πώς επιτυγχάνετε την εξατομίκευση, ώστε οι άνθρωποι να μπορούν να πουν στο διαδίκτυο, "Θεέ μου, αυτή είναι η καλύτερη εμπειρία υποστήριξης που είχα ποτέ";

Jesse Zhang: Για εμάς, Η εξατομίκευση προέρχεται από την προσαρμογή για τον χρήστη. Πρέπει να κατανοήσετε τις βασικές πληροφορίες του χρήστη, που είναι το πρόσθετο πλαίσιο που απαιτείται. Δεύτερον, πρέπει επίσης να κατανοήσετε την επιχειρηματική λογική των πελατών μας.Αν συνδυάσετε τα δύο, μπορείτε να προσφέρετε μια πολύ καλή εμπειρία.

Προφανώς, αυτό ακούγεται απλό, αλλά στην πραγματικότητα είναι πολύ δύσκολο να αποκτήσετε όλο το απαιτούμενο πλαίσιο. Επομένως, το μεγαλύτερο μέρος της δουλειάς μας είναι πώς να δημιουργήσουμε τα σωστά πρωτόγονα στοιχεία, έτσι ώστε όταν ένας πελάτης αναπτύσσει το σύστημά μας, να μπορεί εύκολα να αποφασίσει: «Εντάξει, αυτή είναι η επιχειρηματική λογική που θέλουμε». Για παράδειγμα, πρώτα πρέπει να κάνετε αυτά τα τέσσερα βήματα και εάν το τρίτο βήμα αποτύχει, πρέπει να πάτε στο βήμα πέντε.

Θέλετε να μπορείτε να διδάξετε το AI πολύ εύκολα, αλλά και να του δώσετε πρόσβαση σε πληροφορίες όπως, «Αυτά είναι τα στοιχεία του λογαριασμού του χρήστη. Εάν χρειάζεστε περισσότερες πληροφορίες, μπορείτε να καλέσετε αυτά τα API." Αυτά τα επίπεδα είναι ένα επίπεδο συντονισμού πάνω από το μοντέλο, και κατά κάποιο τρόπο, κάνουν τον Πράκτορα πραγματικά χρησιμοποιήσιμο.

Kimberly Tan: Ακούγεται ότι σε αυτήν την περίπτωση, χρειάζεστε πολλή πρόσβαση στα επιχειρηματικά συστήματα. Πρέπει να γνωρίζετε πολλά για τους χρήστες και πιθανότατα πρέπει να γνωρίζετε πώς ο πελάτης θέλει πραγματικά να αλληλεπιδράσει με τους χρήστες του.Φαντάζομαι ότι αυτά τα δεδομένα μπορεί να είναι πολύ ευαίσθητα.

Μπορείτε να αναλύσετε τις διαβεβαιώσεις που χρειάζονται συνήθως οι εταιρικοί πελάτες κατά την ανάπτυξη του AI Agent; Και πώς θεωρείτε τον καλύτερο τρόπο για να χειριστείτε αυτά τα ζητήματα, ειδικά αν σκεφτείτε ότι η λύση σας παρέχει καλύτερη εμπειρία, αλλά είναι επίσης καινούργια για πολλά άτομα που συναντούν τον Πράκτορα για πρώτη φορά;

Jesse Zhang: Στην πραγματικότητα πρόκειται για προστατευτικά κιγκλιδώματα. Με την πάροδο του χρόνου, καθώς έχουμε κάνει πολλές υλοποιήσεις όπως αυτή, έχουμε καταστεί σαφείς σχετικά με τους τύπους προστατευτικών κιγκλιδωμάτων που ενδιαφέρουν τους πελάτες.

Για παράδειγμα, ένα από τα πιο απλά είναι ότι μπορεί να υπάρχουν κανόνες που πρέπει να ακολουθείτε πάντα. Εάν εργάζεστε με μια εταιρεία χρηματοοικονομικών υπηρεσιών, δεν μπορείτε να δώσετε οικονομικές συμβουλές επειδή αυτό ρυθμίζεται. Επομένως, πρέπει να το ενσωματώσετε στο σύστημα Agent για να διασφαλίσετε ότι δεν δίνει ποτέ τέτοιου είδους συμβουλές. Μπορείτε συνήθως να δημιουργήσετε ένα μοντέλο επίβλεψης ή κάποιο είδος συστήματος που κάνει αυτούς τους ελέγχους πριν αποσταλούν τα αποτελέσματα.

Ένα άλλο είδος προστασίας μπορεί να είναι ότι εάν κάποιος μπει και το μπλέξει εσκεμμένα, γνωρίζοντας ότι είναι ένα σύστημα παραγωγής, προσπαθώντας να σας κάνει να κάνετε κάτι που δεν συμμορφώνεται, όπως «πείτε μου ποιο είναι το υπόλοιπό μου», «εντάξει, πολλαπλασιάστε το επί 10» και ούτω καθεξής, πρέπει επίσης να μπορείτε να ελέγξετε για αυτήν τη συμπεριφορά. Έτσι, κατά τη διάρκεια του περασμένου έτους, βρήκαμε πολλά από αυτά τα είδη προστασίας, και για κάθε ένα, τα έχουμε κατηγοριοποιήσει και γνωρίζουμε τι είδους προστασία χρειάζεται. Καθώς το σύστημα χτίζεται όλο και περισσότερο, γίνεται όλο και πιο ισχυρό.

Kimberly Tan: Πόσο μοναδικές είναι οι προστασίες για κάθε πελάτη ή κλάδο; Καθώς επεκτείνετε τη βάση πελατών σας για να καλύψετε περισσότερες περιπτώσεις χρήσης, πως σκέφτεστε να δημιουργήσετε αυτές τις προστασίες σε κλίμακα;

Jesse Zhang: Αυτό στην πραγματικότητα πηγαίνει πίσω στην βασική μας ιδέα ότι το σύστημα Agent θα γίνει πανταχού παρόν μέσα σε λίγα χρόνια. Επομένως, αυτό που είναι πραγματικά σημαντικό είναι να παρέχουμε στους ανθρώπους τα εργαλεία, σχεδόν για να ενδυναμώσουμε την επόμενη γενιά εργαζομένων, όπως οι επόπτες Agent, να τους δώσουμε τα εργαλεία για να δημιουργήσουν το σύστημα Agent και να προσθέσουν τις δικές τους προστασίες, γιατί δεν πρόκειται να ορίσουμε τις προστασίες για αυτούς.

Κάθε πελάτης γνωρίζει καλύτερα τα δικά του μέτρα προστασίας και επιχειρηματική λογική. Επομένως, η δουλειά μας είναι στην πραγματικότητα να κάνουμε καλή δουλειά στην κατασκευή των εργαλείων και της υποδομής, ώστε να μπορούν να δημιουργήσουν το σύστημα Agent. Ως εκ τούτου, τονίζαμε πάντα ότι η Το σύστημα αντιπροσώπων δεν πρέπει να είναι ένα μαύρο κουτί και θα πρέπει να μπορείτε να ελέγχετε πώς να δημιουργήσετε αυτές τις προστασίες, τους κανόνες και τη λογική.

Νομίζω ότι αυτή είναι ίσως η πιο διαφοροποιητική πτυχή μας μέχρι στιγμής. Καταβάλαμε μεγάλη προσπάθεια σε αυτά τα εργαλεία και βρήκαμε δημιουργικούς τρόπους για να επιτρέψουμε σε άτομα που μπορεί να μην έχουν σούπερ τεχνικό υπόβαθρο ή ακόμα και βαθιά κατανόηση του τρόπου λειτουργίας των μοντέλων τεχνητής νοημοσύνης, να συνεχίσουν να εισάγουν τις ενέργειες που θέλουν να εκτελεί το AI στο σύστημα Agent.

Νομίζω ότι θα γίνει μια ολοένα και πιο σημαντική ικανότητα τα επόμενα χρόνια. Αυτό θα πρέπει να είναι ένα από τα πιο σημαντικά κριτήρια όταν οι άνθρωποι αξιολογούν παρόμοια εργαλεία, επειδή θέλετε να μπορείτε να βελτιστοποιείτε και να βελτιώνετε συνεχώς αυτά τα συστήματα με την πάροδο του χρόνου.

Επιχειρηματική λογική με γνώμονα τη φυσική γλώσσα

Derrick Harris: Τι προετοιμασίες μπορούν να κάνουν οι πελάτες ή οι επιχειρήσεις για να προετοιμαστούν για οποιονδήποτε τύπο αυτοματισμού, και ιδιαίτερα τη χρήση αυτού του συστήματος Agent; Για παράδειγμα, πώς μπορούν να σχεδιάσουν τα συστήματα δεδομένων, την αρχιτεκτονική λογισμικού ή την επιχειρηματική τους λογική για να υποστηρίξουν τέτοια συστήματα;

Επειδή πιστεύω ότι πολλές τεχνολογίες τεχνητής νοημοσύνης είναι καινοτόμες στην αρχή, αλλά όταν πρόκειται για υπάρχοντα συστήματα παλαιού τύπου, συχνά αντιμετωπίζει πολύ χάος.

Jesse Zhang: Εάν κάποιος κατασκευάζει από την αρχή τώρα, υπάρχουν πολλές βέλτιστες πρακτικές που μπορούν να κάνουν τη δουλειά σας πιο εύκολη. Για παράδειγμα, πώς να δομήσετε τη βάση γνώσεων σας. Έχουμε γράψει για μερικά από αυτά και παρουσιάσαμε ορισμένες μεθόδους που μπορούν να διευκολύνουν την τεχνητή νοημοσύνη να απορροφήσει πληροφορίες και να βελτιώσει την ακρίβειά τους. Μια συγκεκριμένη πρόταση είναι να χωρίσετε τη βάση γνώσεων σε αρθρωτά μέρη, αντί να έχετε ένα μεγάλο άρθρο με πολλές απαντήσεις.

Κατά τη ρύθμιση του API, μπορείτε να τα κάνετε πιο κατάλληλα για το σύστημα Agent και να ορίσετε δικαιώματα και έξοδο με τρόπο που να διευκολύνει το σύστημα Agent να απορροφά πληροφορίες χωρίς να χρειάζεται να κάνει πολλούς υπολογισμούς για να βρει την απάντηση. Αυτά είναι μερικά μέτρα τακτικής που μπορούν να ληφθούν, αλλά δεν θα έλεγα ότι πρέπει να γίνει κάτι για να χρησιμοποιηθεί το σύστημα Agent.

Derrick Harris: Η καλή τεκμηρίωση είναι πάντα σημαντική, ουσιαστικά πρόκειται για την αποτελεσματική οργάνωση των πληροφοριών.

Kimberly Tan: Ακούγεται ότι αν προσπαθήσετε να διδάξετε στους ανθρώπους πώς να κατευθύνουν το σύστημα Agent ώστε να λειτουργεί με τρόπο που ταιριάζει καλύτερα στους πελάτες τους ή σε συγκεκριμένες περιπτώσεις χρήσης, τότε μπορεί να απαιτηθεί πολύς πειραματισμός με τη σχεδίαση UI και UX ή πρέπει να ανοίξετε νέα μονοπάτια σε αυτό το εντελώς νέο πεδίο, επειδή είναι πολύ διαφορετικό από το παραδοσιακό λογισμικό.

Είμαι περίεργος, πώς το σκέφτεσαι αυτό; Πώς πρέπει να μοιάζουν το UI και το UX σε έναν Agent-first κόσμο; Πώς πιστεύετε ότι θα αλλάξει τα επόμενα χρόνια;

Jesse Zhang: Δεν θα έλεγα ότι λύσαμε αυτό το πρόβλημα. Νομίζω ότι μπορεί να έχουμε βρει ένα τοπικό βέλτιστο που λειτουργεί για τους τρέχοντες πελάτες μας, αλλά εξακολουθεί να είναι ένας συνεχής τομέας έρευνας, για εμάς και πολλούς άλλους.

Το βασικό ζήτημα επιστρέφει σε αυτό που αναφέραμε προηγουμένως, το οποίο είναι ότι έχετε ένα σύστημα Agent. Πρώτον, πώς μπορείτε να δείτε καθαρά τι κάνει και πώς λαμβάνει αποφάσεις; Στη συνέχεια, πώς μπορείτε να χρησιμοποιήσετε αυτές τις πληροφορίες για να αποφασίσετε τι πρέπει να ενημερωθεί και ποια ανατροφοδότηση θα πρέπει να δοθεί στην τεχνητή νοημοσύνη; Εδώ ενώνονται τα στοιχεία διεπαφής χρήστη, ειδικά το δεύτερο μέρος.

Πιστεύουμε ότι με την πάροδο του χρόνου, το UI και το UX θα βασίζονται όλο και περισσότερο σε φυσικές γλώσσες, επειδή έτσι σκέφτεται το σύστημα Agent ή αυτή είναι βασικά η βάση για την εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLM).

Στην ακραία περίπτωση, αν έχετε έναν υπερ-έξυπνο πράκτορα που βασικά σκέφτεται σαν άνθρωπος, μπορείτε να του δείξετε πράγματα, να του εξηγήσετε πράγματα, να του δώσετε ανατροφοδότηση και θα ενημερώσει στο δικό του «μυαλό». Μπορείτε να φανταστείτε ότι έχετε ένα πολύ ικανό άτομο στην ομάδα σας, του διδάσκετε κάτι, αρχίζει να εργάζεται και μετά συνεχίζετε να του δίνετε σχόλια, μπορείτε να του δείχνετε νέα πράγματα, νέα έγγραφα, διαγράμματα κ.λπ.

Νομίζω ότι στην ακραία περίπτωση, θα εξελιχθεί προς αυτή την κατεύθυνση: τα πράγματα γίνονται πιο ομιλητικά, πιο φυσικές στη γλώσσα και οι άνθρωποι σταματούν να χτίζουν συστήματα με πολύπλοκα δέντρα αποφάσεων όπως παλιά, καταγράφοντας αυτό που θέλετε, αλλά αυτή η προσέγγιση μπορεί εύκολα να καταρρεύσει. Κάποτε έπρεπε να το κάνουμε αυτό επειδή δεν υπήρχαν LLM τότε, αλλά τώρα που τα συστήματα Agent γίνονται όλο και πιο ισχυρά, το UI και το UX θα γίνονται πιο συνομιλητικά.

Kimberly Tan: Πριν από ενάμιση χρόνο περίπου, όταν πρωτοξεκίνησε το Decagon, υπήρχε μια γενική αντίληψη ότι το LLM ήταν πολύ εφαρμόσιμο σε πολλές περιπτώσεις χρήσης, αλλά στην πραγματικότητα ήταν απλώς ένα είδος "περιτύλιγμα GPT", όπου οι εταιρείες μπορούσαν απλώς να καλέσουν ένα υποκείμενο μοντέλο μέσω ενός API και να λύσουν άμεσα τα προβλήματα υποστήριξής τους.

Αλλά προφανώς, καθώς οι εταιρείες επιλέγουν να χρησιμοποιήσουν λύσεις όπως το Decagon αντί να ακολουθήσουν απευθείας αυτή τη διαδρομή, αποδεικνύεται ότι αυτό δεν συμβαίνει. Αναρωτιόμουν αν θα μπορούσατε να εξηγήσετε γιατί συμβαίνει αυτό. Τι ακριβώς έκανε τις προκλήσεις της εσωτερικής δόμησης πιο περίπλοκες από το αναμενόμενο; Τι λανθασμένες αντιλήψεις είχαν για την ιδέα;

Jesse Zhang: Δεν υπάρχει τίποτα κακό στο να είσαι "περιτύλιγμα GPT", θα μπορούσες να πεις ότι το Purcell είναι ένα περιτύλιγμα AWS ή κάτι τέτοιο. Συνήθως, όταν οι άνθρωποι χρησιμοποιούν αυτόν τον όρο, σημαίνει κάτι υποτιμητικό.

Η προσωπική μου άποψη είναι ότι εάν δημιουργείτε ένα σύστημα αντιπροσώπων, εξ ορισμού θα χρησιμοποιείτε σίγουρα το LLM ως εργαλείο. Έτσι, στην πραγματικότητα χτίζετε πάνω από κάτι που υπάρχει ήδη, όπως θα χτίζατε κανονικά σε AWS ή GCP.

Αλλά το πραγματικό πρόβλημα που μπορείτε να αντιμετωπίσετε είναι εάν το λογισμικό που δημιουργείτε πάνω από το LLM δεν είναι «βαρύ» ή αρκετά περίπλοκο για να κάνει τη διαφορά.

Κοιτάζοντας πίσω, για εμάς, αυτό που πουλάμε είναι βασικά λογισμικό. Στην πραγματικότητα είμαστε σαν μια κανονική εταιρεία λογισμικού, με τη διαφορά ότι χρησιμοποιούμε το LLM ως μέρος του λογισμικού και ως ένα από τα εργαλεία. Αλλά όταν οι άνθρωποι αγοράζουν αυτό το είδος προϊόντος, θέλουν κυρίως το ίδιο το λογισμικό. Θέλουν εργαλεία που μπορούν να παρακολουθούν την τεχνητή νοημοσύνη, που μπορούν να σκάβουν βαθιά στις λεπτομέρειες κάθε συνομιλίας που έχει η τεχνητή νοημοσύνη, που μπορούν να δίνουν ανατροφοδότηση, που μπορούν να χτίζουν και να προσαρμόζουν συνεχώς το σύστημα.

Αυτός είναι λοιπόν ο πυρήνας του λογισμικού μας. Ακόμη και με το ίδιο το σύστημα Agent, το πρόβλημα που έχουν οι άνθρωποι είναι ότι είναι ωραίο να κάνεις ένα demo, αλλά αν θέλεις να το κάνεις έτοιμο για παραγωγή και πραγματικά στραμμένο προς τους πελάτες, πρέπει να λύσεις πολλά μακροχρόνια προβλήματα, όπως η πρόληψη του φαινομένου της «ψευδής» και η αντιμετώπιση κακών ηθοποιών που προσπαθούν να προκαλέσουν χάος. Πρέπει επίσης να βεβαιωθούμε ότι η καθυστέρηση είναι αρκετά χαμηλή, ο τόνος είναι κατάλληλος και ούτω καθεξής.

Μιλήσαμε με πολλές ομάδες και έκαναν κάποια πειράματα, έφτιαξαν μια προκαταρκτική έκδοση και μετά θα συνειδητοποιούσαν, «Ω, πραγματικά, δεν θέλουμε να είμαστε αυτοί που συνεχίζουν να χτίζουν αυτές τις λεπτομέρειες σε μεταγενέστερα στάδια». Επίσης, δεν ήθελαν να είναι αυτοί που προσθέτουν συνεχώς νέα λογική στην ομάδα εξυπηρέτησης πελατών. Σε αυτό το σημείο, λοιπόν, φαίνεται πιο σωστό να επιλέξεις να συνεργαστείς με άλλους.

Kimberly Tan: Αναφέρατε κάποια μακροπρόθεσμα ζητήματα, όπως η ανάγκη αντιμετώπισης κακών ηθοποιών κ.λπ.Πιστεύω ότι πολλοί ακροατές που σκέφτονται να χρησιμοποιήσουν το AI Agent ανησυχούν για νέα μονοπάτια επίθεσης ασφαλείας που μπορεί να προκύψουν μετά την εισαγωγή των LLM ή για νέους κινδύνους ασφαλείας που μπορεί να προκύψουν μετά την εισαγωγή του συστήματος Agent. Τι πιστεύετε για αυτά τα θέματα; Και ποιες είναι οι βέλτιστες πρακτικές για τη διασφάλιση κορυφαίας εταιρικής ασφάλειας κατά την αντιμετώπιση Μέσο?

Jesse Zhang: Όσον αφορά την ασφάλεια, υπάρχουν κάποια προφανή μέτρα που μπορούν να ληφθούν, τα οποία ανέφερα προηγουμένως, όπως η ανάγκη για προστατευτικά μέτρα. Το βασικό ζήτημα είναι ότι οι ανησυχίες των ανθρώπων για τα LLM είναι ότι δεν είναι ντετερμινιστικά.

Αλλά τα καλά νέα είναι ότι μπορείτε πραγματικά να τοποθετήσετε τις περισσότερες από τις ευαίσθητες και πολύπλοκες λειτουργίες πίσω από έναν ντετερμινιστικό τοίχο και ο υπολογισμός γίνεται εκεί όταν καλεί το API. Επομένως, δεν βασίζεστε αποκλειστικά στο LLM για να το χειριστείτε, και αυτό αποφεύγει πολλά από τα βασικά προβλήματα.

Αλλά εξακολουθούν να υπάρχουν καταστάσεις όπου, για παράδειγμα, ένας κακός ηθοποιός παρεμβαίνει ή κάποιος προσπαθεί να κάνει το σύστημα να έχει παραισθήσεις. Παρατηρήσαμε ότι σε πολλούς από τους μεγάλους πελάτες με τους οποίους συνεργαζόμαστε, οι ομάδες ασφαλείας τους θα εισέλθουν και βασικά θα πραγματοποιήσουν μια δοκιμή «κόκκινης ομάδας» στα προϊόντα μας, περνώντας εβδομάδες συνεχώς εξαπολύοντας διάφορες πιθανές επιθέσεις στο σύστημα για να προσπαθήσουν να βρουν τρωτά σημεία. Καθώς το AI Agent γίνεται όλο και πιο δημοφιλές, μπορεί να το βλέπουμε αυτό να συμβαίνει όλο και πιο συχνά, επειδή αυτός είναι ένας από τους καλύτερους τρόπους για να ελέγξετε εάν ένα σύστημα είναι αποτελεσματικό. Είναι να ρίξεις κάτι σε αυτό μέσω ενός τεστ της κόκκινης ομάδας και να δεις αν μπορεί να σπάσει τις άμυνες.

Υπάρχουν επίσης νεοφυείς επιχειρήσεις που αναπτύσσουν εργαλεία κόκκινης ομάδας ή δίνουν τη δυνατότητα στους ανθρώπους να κάνουν οι ίδιοι αυτού του είδους τις δοκιμές, κάτι που είναι μια τάση που βλέπουμε αυτή τη στιγμή. Πολλές από τις εταιρείες με τις οποίες συνεργαζόμαστε, σε μεταγενέστερο στάδιο του κύκλου πωλήσεων, θα έχουν την ομάδα ασφαλείας τους ή θα συνεργαστούν με μια εξωτερική ομάδα, να κάνουν τεστ αντοχής στο σύστημα. Για εμάς, το να μπορούμε να περάσουμε τέτοιου είδους τεστ είναι απαραίτητο. Έτσι, τελικά, αυτό είναι που καταλήγει.

Derrick Harris: Είναι κάτι που ενθαρρύνετε τους πελάτες σας να κάνουν; Επειδή όταν μιλάμε για πολιτικές τεχνητής νοημοσύνης, αναφέρουμε μια σημαντική πτυχή, που είναι το επίπεδο εφαρμογής, και δίνουμε έμφαση στην τοποθέτηση το ευθύνη των χρηστών του LLM και των ανθρώπων που εκτελούν την εφαρμογή, αντί να κατηγορούν απλώς το ίδιο το μοντέλο. Δηλαδή, οι πελάτες θα πρέπει να διεξάγουν δοκιμές κόκκινης ομάδας, να προσδιορίζουν συγκεκριμένες περιπτώσεις χρήσης και μονοπάτια επίθεσης και να προσδιορίζουν ποιες ευπάθειες πρέπει να προστατεύονται, αντί να βασίζονται απλώς στην προστασία ασφαλείας που έχει ήδη δημιουργηθεί από την OpenAI ή άλλες εταιρείες.

Jesse Zhang: Συμφωνώ απόλυτα. Πιστεύω επίσης ότι μπορεί να εμφανιστεί ένα νέο κύμα απαιτήσεων ειδοποίησης, παρόμοιο με την πιστοποίηση SOC 2 και την πιστοποίηση HIPAA που κάνουν όλοι τώρα, οι οποίες απαιτούνται σε διαφορετικούς κλάδους. Συνήθως, όταν πουλάτε ένα γενικό προϊόν SaaS, οι πελάτες θα απαιτούν δοκιμή διείσδυσης και πρέπει επίσης να παρέχουμε την αναφορά δοκιμών διείσδυσης. Για το AI Agent, μπορεί να υπάρχουν παρόμοιες απαιτήσεις στο μέλλον και κάποιος μπορεί να το ονομάσει, αλλά αυτός είναι βασικά ένας νέος τρόπος για να ελέγξετε εάν το σύστημα Agent είναι αρκετά ισχυρό.

Kimberly Tan: Ένα πράγμα που είναι ενδιαφέρον είναι ότι προφανώς όλοι είναι πολύ ενθουσιασμένοι με τις ανακαλύψεις του νέου μοντέλου και τις τεχνολογικές ανακαλύψεις που παρουσιάζονται από όλα τα μεγάλα εργαστήρια. Ως εταιρεία τεχνητής νοημοσύνης, προφανώς δεν κάνετε τη δική σας έρευνα, αλλά αξιοποιείτε αυτήν την έρευνα και δημιουργείτε πολύ λογισμικό γύρω από αυτό για να το παραδώσετε στον τελικό πελάτη.

Αλλά η δουλειά σας βασίζεται σε τεχνολογία που αλλάζει ταχέως. Είμαι περίεργος, ως εταιρεία εφαρμοσμένης τεχνητής νοημοσύνης, πώς συμβαδίζετε με τις νέες τεχνολογικές αλλαγές και κατανοείτε πώς επηρεάζουν την εταιρεία, ενώ μπορείτε να προβλέψετε τον δικό σας οδικό χάρτη προϊόντων και να δημιουργήσετε τις ανάγκες των χρηστών; Γενικότερα, ποιες στρατηγικές θα πρέπει να υιοθετήσουν οι εταιρείες τεχνητής νοημοσύνης που εφαρμόζονται σε παρόμοιες καταστάσεις;

Jesse Zhang: Μπορείτε πραγματικά να διαιρέσετε ολόκληρη τη στοίβα σε διαφορετικά μέρη. Για παράδειγμα, το LLM βρίσκεται στο κάτω μέρος αν κοιτάξετε το επίπεδο εφαρμογής. Μπορεί να έχετε κάποια εργαλεία στη μέση που σας βοηθούν να διαχειριστείτε το LLM ή να κάνετε κάποια αξιολόγηση και άλλα παρόμοια. Στη συνέχεια, το πάνω μέρος είναι βασικά αυτό που κατασκευάσαμε, το οποίο είναι στην πραγματικότητα σαν ένα τυπικό SaaS.

Έτσι, το μεγαλύτερο μέρος της δουλειάς μας στην πραγματικότητα δεν διαφέρει τόσο από το κανονικό λογισμικό, εκτός από το ότι έχουμε ένα επιπλέον ερευνητικό στοιχείο - το LLM αλλάζει πολύ γρήγορα. Πρέπει να ερευνήσουμε τι μπορούν να κάνουν, σε τι είναι καλοί και ποιο μοντέλο πρέπει να χρησιμοποιηθεί για να εκτελέσει μια συγκεκριμένη εργασία. Αυτό είναι ένα μεγάλο ζήτημα γιατί τόσο το OpenAI όσο και το Anthropic λανσάρουν νέες τεχνολογίες και το Gemini επίσης βελτιώνεται σταδιακά.

Επομένως, πρέπει να έχετε τον δικό σας μηχανισμό αξιολόγησης για να κατανοήσετε ποιο μοντέλο είναι κατάλληλο για χρήση σε ποια κατάσταση. Μερικές φορές χρειάζεται επίσης να βελτιστοποιήσετε, αλλά το ερώτημα είναι: πότε να τελειοποιήσετε; Πότε αξίζει η τελειοποίηση; Αυτά είναι πιθανώς τα κύρια ερευνητικά ζητήματα που σχετίζονται με τα LLM στα οποία εστιάζουμε. Αλλά τουλάχιστον μέχρι στιγμής, δεν αισθανόμαστε ότι το SaaS αλλάζει γρήγορα, επειδή δεν εξαρτόμαστε από το μεσαίο στρώμα. Οπότε, βασικά, είναι τα LLM που αλλάζουν. Δεν αλλάζουν πολύ συχνά, και όταν αλλάζουν, είναι συνήθως μια αναβάθμιση. Για παράδειγμα, το σονέτο Claude 3.5 ενημερώθηκε πριν από μερικούς μήνες και εκείνη την εποχή σκεφτήκαμε, "Εντάξει, πρέπει να μεταβούμε στο νέο μοντέλο αντί να συνεχίσουμε να χρησιμοποιούμε το παλιό;"

Χρειάζεται απλώς να εκτελέσουμε μια σειρά αξιολογήσεων και αφού μεταβούμε στο νέο μοντέλο, δεν το σκεφτόμαστε πια γιατί χρησιμοποιείτε ήδη το νέο μοντέλο. Μετά, βγήκε η έκδοση o1, και η κατάσταση ήταν παρόμοια. Σκεφτείτε πού μπορεί να χρησιμοποιηθεί. Στην περίπτωσή μας, το o1 είναι λίγο αργό για τις περισσότερες περιπτώσεις χρήσης που αντιμετωπίζουν πελάτες, επομένως μπορούμε να το χρησιμοποιήσουμε για κάποια εργασία στο παρασκήνιο. Τελικά, χρειάζεται απλώς να έχουμε ένα καλό σύστημα για την έρευνα μοντέλων.

Kimberly Tan: Πόσο συχνά αξιολογείτε ένα νέο μοντέλο και αποφασίζετε αν θα το αντικαταστήσετε;

Jesse Zhang: Αξιολογούμε κάθε φορά που βγαίνει ένα νέο μοντέλο. Πρέπει να βεβαιωθείτε ότι παρόλο που το νέο μοντέλο είναι πιο έξυπνο, δεν θα σπάσει ορισμένες από τις περιπτώσεις χρήσης που έχετε ήδη δημιουργήσει. Αυτό μπορεί να συμβεί. Για παράδειγμα, το νέο μοντέλο μπορεί να είναι πιο έξυπνο συνολικά, αλλά σε ορισμένες ακραίες περιπτώσεις, δεν έχει καλή απόδοση σε μια επιλογή A/B σε μία από τις ροές εργασίας σας. Για αυτό αξιολογούμε.

Νομίζω ότι συνολικά, ο τύπος νοημοσύνης που μας ενδιαφέρει περισσότερο είναι αυτό που θα ονόμαζα «ικανότητα παρακολούθησης οδηγιών». Θέλουμε το μοντέλο να γίνεται όλο και καλύτερο ακολουθώντας τις οδηγίες. Αν είναι έτσι, τότε είναι σίγουρα ωφέλιμο για εμάς και αυτό είναι πολύ καλό.

Φαίνεται ότι η πρόσφατη έρευνα έχει επικεντρωθεί περισσότερο στο είδος της νοημοσύνης που περιλαμβάνει συλλογισμό, όπως καλύτερο προγραμματισμό και καλύτερες μαθηματικές πράξεις. Αυτό μας βοηθά επίσης, αλλά δεν είναι τόσο σημαντικό όσο η βελτίωση της ικανότητας παρακολούθησης των οδηγιών.

Kimberly Tan: Ένα πολύ ενδιαφέρον σημείο που αναφέρατε, και νομίζω ότι είναι επίσης πολύ μοναδικό για τον Decagon, είναι ότι έχετε δημιουργήσει πολλές υποδομές αξιολόγησης εσωτερικά για να βεβαιωθείτε ότι γνωρίζετε ακριβώς πώς αποδίδει κάθε μοντέλο στο σύνολο των δοκιμών που παρέχετε.

Μπορείτε να το αναλύσετε αυτό; Πόσο σημαντική είναι αυτή η εσωτερική υποδομή αξιολόγησης και συγκεκριμένα πώς δίνει σε εσάς και τους πελάτες σας εμπιστοσύνη στην απόδοση του Agent; Επειδή ορισμένες από αυτές τις αξιολογήσεις είναι επίσης πελατειακές.

Jesse Zhang: Νομίζω ότι είναι πολύ σημαντικό, γιατί χωρίς αυτήν την υποδομή αξιολόγησης, θα ήταν πολύ δύσκολο για εμάς να επαναλάβουμε γρήγορα.

Αν νιώθετε ότι κάθε αλλαγή έχει μεγάλη πιθανότητα να σπάσει κάτι, τότε δεν θα κάνετε αλλαγές γρήγορα. Αλλά αν έχετε έναν μηχανισμό αξιολόγησης, τότε όταν υπάρχει μια σημαντική αλλαγή, μια ενημέρωση μοντέλου ή κάτι νέο, μπορείτε να το συγκρίνετε απευθείας με όλα τα τεστ αξιολόγησης. Εάν τα αποτελέσματα της αξιολόγησης είναι καλά, μπορείτε να αισθανθείτε: εντάξει, κάναμε μια βελτίωση ή μπορείτε να την απελευθερώσετε με σιγουριά χωρίς να ανησυχείτε πολύ.

Έτσι, στον τομέα μας, Η αξιολόγηση απαιτεί πληροφορίες από τον πελάτη, γιατί ο πελάτης είναι αυτός που αποφασίζει αν κάτι είναι σωστό ή όχι. Φυσικά, μπορούμε να ελέγξουμε ορισμένα ζητήματα υψηλού επιπέδου, αλλά συνήθως ο πελάτης παρέχει συγκεκριμένες περιπτώσεις χρήσης και μας λέει ποια είναι η σωστή απάντηση ή ποια πρέπει να είναι, τι τόνο πρέπει να διατηρήσει, τι πρέπει να πει.

Η αξιολόγηση βασίζεται σε αυτό. Επομένως, πρέπει να βεβαιωθούμε ότι το σύστημα αξιολόγησής μας είναι αρκετά ισχυρό. Στην αρχή το φτιάξαμε μόνοι μας και δεν είναι τόσο δύσκολο να το συντηρήσουμε. Γνωρίζουμε επίσης ότι υπάρχουν ορισμένες εταιρείες αξιολόγησης και έχουμε εξερευνήσει μερικές από αυτές. Ίσως κάποια στιγμή να σκεφτούμε αν θα τα υιοθετήσουμε, αλλά προς το παρόν το σύστημα αξιολόγησης δεν είναι πλέον ένα σημείο πόνου για εμάς.

Kimberly Tan: Ένα πολύ δημοφιλές θέμα σήμερα είναι η πολυτροπικότητα, που σημαίνει ότι οι πράκτορες τεχνητής νοημοσύνης θα πρέπει να μπορούν να αλληλεπιδρούν σε όλες τις μορφές που χρησιμοποιούν οι άνθρωποι σήμερα, είτε πρόκειται για κείμενο, βίντεο, φωνή κ.λπ. Ξέρω ότι ο Decagon ξεκίνησε ως βασισμένος σε κείμενο. Από τη δική σας οπτική γωνία, πόσο σημαντικό είναι πολυτροπικότητα σε πράκτορες AI; Ποιο πιστεύετε ότι είναι το χρονοδιάγραμμα για να γίνει mainstream ή ακόμα και πρότυπο;

Jesse Zhang: Είναι σημαντικό, και από την προοπτική της εταιρείας, δεν είναι ιδιαίτερα δύσκολο να προστεθεί ένας νέος τρόπος. Δεν είναι απλό, αλλά ο πυρήνας είναι: εάν λύσετε άλλα προβλήματα, όπως αυτά που ανέφερα – για παράδειγμα, να δημιουργήσετε το AI, να το παρακολουθήσετε και να έχετε τη σωστή λογική – τότε η προσθήκη μιας νέας τροπικότητας δεν είναι το πιο δύσκολο πράγμα. Έτσι, για εμάς, το να έχουμε όλες τις λεπτομέρειες είναι πολύ λογικό και διευρύνει την αγορά μας. Βασικά είμαστε αγνωστικιστές της τροπικότητας και χτίζουμε τον δικό μας Πράκτορα για κάθε τρόπο.

Σε γενικές γραμμές, υπάρχουν δύο περιοριστικοί παράγοντες: πρώτον, είναι ο πελάτης έτοιμος να υιοθετήσει τη νέα μέθοδο; Νομίζω ότι είναι πολύ λογικό να ξεκινάμε με κείμενο, γιατί αυτός είναι ο τρόπος με τον οποίο οι άνθρωποι υιοθετούν πιο ενεργά και είναι λιγότερο επικίνδυνο γι' αυτούς, πιο εύκολο στην παρακολούθηση και πιο κατανοητό. Ο άλλος μεγάλος τρόπος είναι η φωνή. Προφανώς, πιστεύω ότι υπάρχει ακόμα χώρος στην αγορά και η αποδοχή της φωνής από τους χρήστες πρέπει ακόμα να βελτιωθεί. Αυτή τη στιγμή, βλέπουμε κάποιους πρώιμους χρήστες που έχουν αρχίσει να υιοθετούν φωνητικούς πράκτορες, κάτι που είναι πολύ συναρπαστικό. Η άλλη πτυχή είναι οι τεχνικές προκλήσεις. Οι περισσότεροι άνθρωποι θα συμφωνούσαν ότι ο πήχης είναι υψηλότερος για τη φωνή. Εάν μιλάτε με κάποιον στο τηλέφωνο, χρειάζεστε πολύ σύντομη καθυστέρηση φωνής. Εάν διακόψετε κάποιον, πρέπει να ανταποκριθεί φυσικά.

Επειδή η καθυστέρηση της ομιλίας είναι μικρότερη, πρέπει να είστε πιο έξυπνοι στον τρόπο που υπολογίζετε. Εάν είστε σε μια συνομιλία και ο χρόνος απόκρισης είναι πέντε έως οκτώ δευτερόλεπτα, δεν το παρατηρείτε σχεδόν καθόλου και αισθάνεστε πολύ φυσικό. Αλλά αν χρειάζονται πέντε έως οκτώ δευτερόλεπτα για να απαντήσετε στο τηλέφωνο, αισθάνεστε λίγο αφύσικο. Έτσι, υπάρχουν περισσότερες τεχνικές προκλήσεις με την ομιλία. Καθώς αυτές οι τεχνικές προκλήσεις επιλύονται και το ενδιαφέρον για την υιοθέτηση της ομιλίας αυξάνεται στην αγορά, η ομιλία ως νέος τρόπος θα γίνει mainstream.

Ένα επιχειρηματικό μοντέλο που ξεπερνά την εμπιστοσύνη

Kimberly Tan: Πριν συνεχίσουμε, θα ήθελα να μιλήσω λίγο περισσότερο για το επιχειρηματικό μοντέλο AI Agent. Όταν εσύ για πρώτη φορά χτίστηκε το Πράκτορας AI ή συζητήσατε με πελάτες το σύστημα που χρησιμοποιούν, τα δεδομένα που επεξεργάζονται και τις ανησυχίες τους, υπήρχε κάτι που σας εξέπληξε; Ποια είναι μερικά από τα μη διαισθητικά ή εκπληκτικά πράγματα που έπρεπε να κάνει ο Decagon για να εξυπηρετήσει καλύτερα τους εταιρικούς πελάτες;

Jesse Zhang: Νομίζω ότι το πιο εκπληκτικό ήταν ο βαθμός στον οποίο οι άνθρωποι ήταν πρόθυμοι να μας μιλήσουν όταν ξεκινήσαμε. Άλλωστε ήμασταν μόνο δύο. Είχαμε ξεκινήσει και οι δύο εταιρείες στο παρελθόν, επομένως γνωρίζαμε πολλούς ανθρώπους, αλλά ακόμα κι έτσι, για κάθε επιχειρηματία, όταν θέλετε να ξεκινήσετε μια συζήτηση παραπομπής, αν αυτό που λέτε δεν είναι ιδιαίτερα συναρπαστικό, η συζήτηση είναι συνήθως πολύ χλιαρή.

Αλλά όταν αρχίσαμε να μιλάμε για αυτήν την περίπτωση χρήσης, πραγματικά μου έκανε έκπληξη το πόσο ενθουσιασμένοι ήταν οι άνθρωποι που μιλούσαν γι 'αυτό. Γιατί η ιδέα φαίνεται τόσο προφανής. Μπορεί να σκεφτείτε ότι αφού είναι μια τόσο προφανής ιδέα, κάποιος άλλος πρέπει να το έχει ήδη κάνει, ή πρέπει να υπάρχει ήδη μια λύση ή κάποιος άλλος πρέπει να έχει ήδη βρει κάποιο είδος λύσης. Αλλά νομίζω ότι πιάσαμε μια καλή στιγμή, αυτή η περίπτωση χρήσης είναι πραγματικά μεγάλη και οι άνθρωποι ενδιαφέρονται πραγματικά γι 'αυτό. Όπως ανέφερα προηγουμένως, αυτή η περίπτωση χρήσης είναι πολύ κατάλληλη για τη λήψη του AI Agent και την ώθησή του στην παραγωγή, επειδή μπορείτε να το εφαρμόσετε σταδιακά και να μπορείτε να παρακολουθείτε την απόδοση επένδυσης (ROI).

Ήταν μια ευχάριστη έκπληξη για μένα, αλλά προφανώς υπάρχει πολλή δουλειά που πρέπει να γίνει μετά από αυτό, πρέπει να συνεργαστείς με τους πελάτες, πρέπει να φτιάξεις το προϊόν, πρέπει να βρεις ποιο δρόμο να ακολουθήσεις. Στην αρχική φάση, ήταν πραγματικά μια εκπληκτική ανακάλυψη.

Derrick Harris: Kimberly, νιώθω ότι πρέπει να αναφέρω αυτήν την ανάρτηση ιστολογίου που έγραψες, RIP to RPA, η οποία αγγίζει πολλά το εργασίες αυτοματισμού και εκκινήσεις.Πιστεύετε ότι υπάρχει φαινόμενο στο οποίο αυτές οι αυτοματοποιημένες εργασίες ή λύσεις δεν είναι τόσο ιδανικές, ώστε οι άνθρωποι να αναζητούν πάντα έναν καλύτερο τρόπο;

Κίμπερλι Ταν: Ναι, έτσι νομίζω. Θα ήθελα να πω μερικά πράγματα. Πρώτον, εάν μια ιδέα είναι προφανής σε όλους, αλλά δεν υπάρχει ξεκάθαρη εταιρεία για να τη λύσει, ή κανείς δεν δείχνει σε μια εταιρεία και λέει, «Θα πρέπει να το χρησιμοποιήσετε αυτό», τότε σημαίνει ότι το πρόβλημα δεν έχει λυθεί στην πραγματικότητα.

Κατά μία έννοια, είναι μια εντελώς ανοιχτή ευκαιρία για μια εταιρεία να αναπτύξει μια λύση. Διότι, όπως είπατε, ακολουθούσαμε τον Decagon ως επενδυτής από την αρχή. Τους παρακολουθήσαμε να περιηγούνται στον δημιουργικό λαβύρινθο και όταν αποφάσισαν να πάνε προς αυτή την κατεύθυνση και άρχισαν να μιλάνε με πελάτες, έγινε σαφές ότι όλοι οι πελάτες αναζητούσαν απελπισμένα κάποιο είδος εγγενούς λύσης με δυνατότητα AI. Αυτό είναι ένα από τα προβλήματα που ανέφερα νωρίτερα, όπου πολλοί άνθρωποι πιστεύουν ότι είναι απλώς ένα περιτύλιγμα GPT. Αλλά το ενδιαφέρον των πελατών που έλαβε ο Decagon από την αρχή μας έκανε να συνειδητοποιήσουμε από νωρίς ότι πολλά από αυτά τα ζητήματα είναι πολύ πιο περίπλοκα από ό,τι περιμένουν οι άνθρωποι.

Νομίζω ότι αυτό το φαινόμενο συμβαίνει σε όλους τους κλάδους, είτε πρόκειται για εξυπηρέτηση πελατών είτε για επαγγελματικό αυτοματισμό σε ορισμένες κλάδους. Νομίζω ότι ένα από τα υποτιμημένα σημεία είναι, όπως ανέφερε προηγουμένως ο Jesse, η δυνατότητα μέτρησης της απόδοσης επένδυσης (ROI) των αυτοματοποιημένων εργασιών. Διότι, αν πρόκειται να κάνετε κάποιον να δεχτεί έναν πράκτορα AI, στην πραγματικότητα κάνει ένα βαθμό «άλμα πίστης» επειδή είναι μια πολύ άγνωστη περιοχή για πολλούς ανθρώπους.

Εάν μπορείτε να αυτοματοποιήσετε μια πολύ συγκεκριμένη διαδικασία που είναι είτε μια προφανής διαδικασία δημιουργίας εσόδων είτε μια διαδικασία που προηγουμένως αποτελούσε εμπόδιο στην επιχείρηση ή ένα σημαντικό κέντρο κόστους που αυξάνεται γραμμικά με την αύξηση των πελατών ή την αύξηση των εσόδων, τότε θα είναι πιο εύκολο να γίνει αποδοχή του AI Agent. Η δυνατότητα μετατροπής τέτοιων προβλημάτων σε μια πιο παραγωγική διαδικασία που μπορεί να κλιμακωθεί όπως το παραδοσιακό λογισμικό είναι πολύ ελκυστική.

Kimberly Tan: Έχω μια τελευταία ερώτηση πριν προχωρήσουμε. Θυμάμαι τον Jesse, σε προηγούμενες συζητήσεις μας, να έλεγε πάντα ότι η μεγαλύτερη πρόκληση για τις εταιρείες που υιοθετούν λογισμικό ή πράκτορες AI θα ήταν οι παραισθήσεις. Αλλά μου είπες κάποτε ότι στην πραγματικότητα δεν είναι αυτό το κύριο πρόβλημα. Μπορείτε να εξηγήσετε γιατί η αντίληψη των παραισθήσεων είναι κάπως παραπλανητική και τι ενδιαφέρει περισσότερο τους ανθρώπους;

Jesse Zhang: Νομίζω ότι οι άνθρωποι νοιάζονται για τις παραισθήσεις, αλλά ανησυχούν περισσότερο για την αξία που μπορούν να προσφέρουν. Σχεδόν όλες οι εταιρείες με τις οποίες συνεργαζόμαστε επικεντρώνονται στα ίδια λίγα θέματα, σχεδόν ακριβώς τα ίδια: ποιο ποσοστό συνομιλιών μπορείτε να λύσετε; Πόσο ικανοποιημένοι είναι οι πελάτες μου; Στη συνέχεια, το θέμα της ψευδαίσθησης μπορεί να ταξινομηθεί ως τρίτη κατηγορία, δηλαδή πόσο ακριβές είναι. Σε γενικές γραμμές, οι δύο πρώτοι παράγοντες είναι πιο σημαντικοί κατά την αξιολόγηση.

Ας υποθέσουμε ότι μιλάτε σε μια νέα επιχείρηση και ότι έχετε κάνει πολύ καλή δουλειά στους δύο πρώτους παράγοντες και έχετε μεγάλη υποστήριξη από την ηγεσία και όλους στην ομάδα. Λένε, «Θεέ μου, η εμπειρία των πελατών μας είναι διαφορετική. Κάθε πελάτης έχει πλέον τον προσωπικό του βοηθό που μπορεί να επικοινωνήσει μαζί μας ανά πάσα στιγμή. Τους δώσαμε εξαιρετικές απαντήσεις, είναι πολύ ικανοποιημένοι και είναι πολύγλωσσο και διαθέσιμο 24/7.” Αυτό είναι μόνο μέρος του, και έχετε εξοικονομήσει επίσης πολλά χρήματα.

Έτσι, μόλις επιτύχετε αυτούς τους στόχους, λαμβάνετε πολλή υποστήριξη και πολλούς ουρανούς ανέμους για να οδηγήσετε τη δουλειά. Φυσικά, το θέμα της ψευδαίσθησης πρέπει τελικά να επιλυθεί, αλλά δεν είναι αυτό που τους απασχολεί περισσότερο. Ο τρόπος για να λύσετε την ψευδαίσθηση είναι με τον ίδιο τρόπο που ανέφερα προηγουμένως – οι άνθρωποι θα σας δοκιμάσουν. Ενδέχεται να υπάρχει μια φάση απόδειξης της ιδέας όπου εκτελείτε πραγματικά πραγματικές συνομιλίες και τα μέλη της ομάδας παρακολουθούν και ελέγχουν για ακρίβεια. Αν αυτό πάει καλά, τότε συνήθως περνάει.

Επίσης, όπως ανέφερα προηγουμένως, μπορείτε να ορίσετε ορισμένα αυστηρά μέτρα προστασίας για ευαίσθητες πληροφορίες, όπως δεν χρειάζεται απαραίτητα να κάνετε το ευαίσθητο περιεχόμενο γενικό. Άρα το θέμα της ψευδαίσθησης είναι θέμα συζήτησης στις περισσότερες συναλλαγές. Δεν είναι ένα ασήμαντο θέμα. Θα περάσετε από αυτή τη διαδικασία, αλλά ποτέ δεν είναι το επίκεντρο της συζήτησης.

Kimberly Tan: Τώρα ας περάσουμε στο επιχειρηματικό μοντέλο του AI Agent. Σήμερα, υπάρχει ένα μεγάλο θέμα σχετικά με το πώς να τιμολογήσετε αυτούς τους πράκτορες AI.

Ιστορικά, πολλά λογισμικά SaaS τιμολογούνται με βάση τον αριθμό των θέσεων επειδή είναι λογισμικό ροής εργασίας που στοχεύει μεμονωμένους υπαλλήλους και χρησιμοποιείται για τη βελτίωση της παραγωγικότητας των εργαζομένων. Ωστόσο, το AI Agent δεν συνδέεται με την παραγωγικότητα μεμονωμένων εργαζομένων όπως το παραδοσιακό λογισμικό.

Έτσι, πολλοί άνθρωποι πιστεύουν ότι η μέθοδος τιμολόγησης με βάση τον αριθμό των θέσεων μπορεί να μην ισχύει πλέον. Είμαι περίεργος για πως σκεφτήκατε αυτό το δίλημμα τις πρώτες μέρες και πώς αποφασίσατε τελικά να τιμολογήσετε το Decagon. Επίσης, ποια πιστεύετε ότι θα είναι η μελλοντική τάση της τιμολόγησης λογισμικού καθώς το AI Agent γίνεται όλο και πιο κοινό;

Jesse Zhang: Η άποψή μας για αυτό το θέμα είναι ότι στο παρελθόν, το λογισμικό τιμολογούνταν ανά θέση επειδή η κλίμακα του βασιζόταν κατά προσέγγιση στον αριθμό των ατόμων που μπορούσαν να χρησιμοποιήσουν το λογισμικό. Αλλά για τους περισσότερους πράκτορες AI, η αξία που παρέχετε δεν εξαρτάται από τον αριθμό των ατόμων που το διατηρούν, αλλά από την ποσότητα της παραγόμενης εργασίας. Αυτό είναι συνεπές με το σημείο που ανέφερα προηγουμένως: εάν η απόδοση της επένδυσης (ROI) είναι πολύ μετρήσιμη, τότε το επίπεδο της παραγωγής εργασίας είναι επίσης πολύ σαφές.

Η άποψή μας είναι ότι η τιμολόγηση με βάση τον αριθμό των θέσεων σίγουρα δεν ισχύει. Μπορείτε να τιμολογήσετε με βάση το αποτέλεσμα της εργασίας. Έτσι, το μοντέλο τιμολόγησης που προσφέρετε θα πρέπει να είναι ότι όσο περισσότερη δουλειά γίνεται, τόσο περισσότερα πληρώνετε.

Για εμάς, υπάρχουν δύο προφανείς τρόποι τιμολόγησης. Μπορείτε είτε να τιμολογήσετε τις συνομιλίες είτε να τιμολογήσετε τις συνομιλίες που λύνει πραγματικά το AI. Νομίζω ότι ένα από τα ενδιαφέροντα μαθήματα που μάθαμε είναι ότι οι περισσότεροι άνθρωποι επέλεξαν το μοντέλο τιμολόγησης συνομιλίας. Ο λόγος είναι ότι το κύριο πλεονέκτημα της τιμολόγησης ανά λύση είναι ότι πληρώνεις για τι το Το AI κάνει.

Όμως το ερώτημα που ακολουθεί είναι τι θεωρείται «λύση»; Πρώτα απ 'όλα, κανείς δεν θέλει να εμβαθύνει σε αυτό, γιατί γίνεται: "Αν κάποιος μπει θυμωμένος και τον διώξεις, γιατί να το πληρώσουμε;"

Αυτό δημιουργεί μια άβολη κατάσταση και επίσης κάνει τα κίνητρα για τους παρόχους τεχνητής νοημοσύνης λίγο περίεργα, επειδή η χρέωση μέσω λύσης σημαίνει: «Απλώς πρέπει να λύσουμε όσο το δυνατόν περισσότερες συζητήσεις και να απωθήσουμε μερικούς ανθρώπους». Υπάρχουν όμως πολλές περιπτώσεις όπου είναι καλύτερο να κλιμακωθεί το ζήτημα αντί να το απομακρύνετε απλώς, και στους πελάτες δεν αρέσει αυτό το είδος χειρισμού. Επομένως, η χρέωση μέσω συνομιλίας θα φέρει περισσότερη απλότητα και προβλεψιμότητα.

Kimberly Tan: Πόσο καιρό πιστεύετε ότι θα διαρκέσει το μελλοντικό μοντέλο τιμολόγησης;Επειδή αυτή τη στιγμή, όταν αναφέρετε την απόδοση επένδυσης (ROI), συνήθως βασίζεται σε προηγούμενες δαπάνες που μπορεί να είχαν χρησιμοποιηθεί για την κάλυψη του κόστους εργασίας. Καθώς οι Πράκτορες AI γίνονται πιο συνηθισμένοι, πιστεύετε ότι μακροπρόθεσμα, η τεχνητή νοημοσύνη θα συγκριθεί με το κόστος εργασίας και ότι αυτό είναι το κατάλληλο σημείο αναφοράς; Εάν όχι, πώς βλέπετε τη μακροπρόθεσμη τιμολόγηση πέρα από το κόστος εργασίας;

Jesse Zhang: Νομίζω ότι μακροπρόθεσμα, η τιμολόγηση του AI Agent μπορεί να εξακολουθεί να συνδέεται κυρίως με το κόστος εργασίας, επειδή αυτή είναι η ομορφιά του Agent – οι προηγούμενες δαπάνες σας για υπηρεσίες μπορούν τώρα να μεταφερθούν στο λογισμικό.

Αυτό το μέρος των δαπανών θα μπορούσε να είναι 10 έως 100 φορές μεγαλύτερο από αυτό των δαπανών λογισμικού, επομένως μεγάλο μέρος του κόστους θα μεταφερθεί στο λογισμικό. Ως εκ τούτου, το κόστος εργασίας θα γίνει φυσικά σημείο αναφοράς. Για τους πελάτες μας, το ROI είναι πολύ σαφές. Εάν μπορείτε να εξοικονομήσετε X εκατομμύρια σε κόστος εργασίας, τότε είναι λογικό να υιοθετήσετε αυτήν τη λύση. Αλλά μακροπρόθεσμα, αυτό μπορεί να είναι στη μέση.

Διότι ακόμη και ορισμένα προϊόντα που δεν είναι τόσο καλά όσο ο Αντιπρόσωπός μας θα δεχτούν χαμηλότερες τιμές. Αυτό μοιάζει με την κλασική κατάσταση SaaS, όπου όλοι ανταγωνίζονται για μερίδιο αγοράς.

Kimberly Tan: Τι πιστεύετε ότι επιφυλάσσει το μέλλον για τις τρέχουσες εταιρείες SaaS, ειδικά εκείνες των οποίων τα προϊόντα μπορεί να μην έχουν κατασκευαστεί για τεχνητή νοημοσύνη εγγενώς ή οι οποίες έχουν τιμή ανά θέση και επομένως δεν μπορούν να προσαρμοστούν σε ένα μοντέλο τιμολόγησης προσανατολισμένο στο αποτέλεσμα;

Jesse Zhang: Για ορισμένες παραδοσιακές εταιρείες, είναι πράγματι λίγο δύσκολο αν προσπαθήσουν να λανσάρουν ένα προϊόν AI Agent επειδή δεν μπορούν να το τιμολογήσουν χρησιμοποιώντας ένα μοντέλο καθίσματος. Εάν δεν χρειάζεστε πλέον τόσους Αντιπροσώπους, είναι δύσκολο να διατηρήσετε τα έσοδα με το υπάρχον προϊόν. Αυτό είναι ένα πρόβλημα για τις παραδοσιακές εταιρείες, αλλά είναι δύσκολο να το πούμε. Οι παραδοσιακές εταιρείες έχουν πάντα το πλεονέκτημα των καναλιών διανομής. Ακόμα κι αν το προϊόν δεν είναι τόσο καλό όσο η νέα εταιρεία, οι άνθρωποι διστάζουν να ξοδέψουν την προσπάθεια για να δεχτούν έναν νέο προμηθευτή με μόνο 80% ποιότητας.

Έτσι, πρώτα, εάν είστε μια startup όπως εμείς, πρέπει να βεβαιωθείτε ότι το προϊόν σας είναι τρεις φορές καλύτερο από το παραδοσιακό προϊόν. Δεύτερον, πρόκειται για έναν τυπικό ανταγωνισμό μεταξύ παραδοσιακών εταιρειών και νεοφυών επιχειρήσεων. Οι παραδοσιακές εταιρείες έχουν φυσικά χαμηλότερη ανοχή κινδύνου επειδή έχουν μεγάλο αριθμό πελατών. Εάν κάνουν λάθος στη γρήγορη επανάληψη, θα προκαλέσουν τεράστιες απώλειες. Ωστόσο, οι νεοφυείς επιχειρήσεις μπορούν να επαναλάβουν γρηγορότερα, επομένως η ίδια η διαδικασία επανάληψης μπορεί να οδηγήσει σε ένα καλύτερο προϊόν. Αυτός είναι ο συνηθισμένος κύκλος. Για εμάς, ήμασταν πάντα περήφανοι για την ταχύτητα παράδοσης, την ποιότητα των προϊόντων και την εκτέλεση της ομάδας μας. Αυτός είναι ο λόγος που κερδίσαμε την τρέχουσα συμφωνία.

Kimberly Tan: Μπορείτε να κάνετε κάποιες προβλέψεις για το μέλλον της τεχνητής νοημοσύνης στο χώρο εργασίας; Για παράδειγμα, πώς θα αλλάξει τις ανάγκες ή τις δυνατότητες των εργαζομένων ή πώς αλληλεπιδρούν ανθρώπινοι υπάλληλοι και πράκτορες τεχνητής νοημοσύνης;Ποιες νέες βέλτιστες πρακτικές ή κανόνες πιστεύετε ότι θα γίνουν ο κανόνας στον χώρο εργασίας καθώς οι Πράκτορες AI γίνονται πιο διαδεδομένοι;

Jesse Zhang: Η πρώτη και πιο σημαντική αλλαγή είναι ότι είμαστε πεπεισμένοι ότι στο μέλλον, οι εργαζόμενοι θα περνούν πολύ περισσότερο χρόνο στον χώρο εργασίας δημιουργώντας και διαχειριζόμενοι πράκτορες τεχνητής νοημοσύνης, παρόμοιο με τον ρόλο των εποπτών AI. Ακόμα κι αν η θέση σας δεν είναι επίσημα «επόπτης τεχνητής νοημοσύνης», πολύς από τον χρόνο που ξοδεύατε για να κάνετε τη δουλειά σας θα μετατοπιστεί στη διαχείριση αυτών των Αντιπροσώπων, επειδή οι Πράκτορες μπορούν να σας προσφέρουν μεγάλη μόχλευση.

Το έχουμε δει αυτό σε πολλές αναπτύξεις όπου οι άνθρωποι που κάποτε ήταν αρχηγοί ομάδων τώρα αφιερώνουν πολύ χρόνο παρακολουθώντας την τεχνητή νοημοσύνη, για παράδειγμα, για να βεβαιωθούν ότι δεν έχει προβλήματα ή για να κάνουν προσαρμογές. Παρακολουθούν τη συνολική απόδοση για να δουν εάν υπάρχουν συγκεκριμένοι τομείς που χρειάζονται προσοχή, εάν υπάρχουν κενά στη βάση γνώσεων που θα μπορούσαν να βοηθήσουν την τεχνητή νοημοσύνη να γίνει καλύτερη και εάν η τεχνητή νοημοσύνη μπορεί να καλύψει αυτά τα κενά.

Η εργασία που συνοδεύει την εργασία με έναν Πράκτορα δίνει την εντύπωση ότι στο μέλλον, οι εργαζόμενοι θα περνούν σημαντικό χρόνο αλληλεπιδρώντας με τους πράκτορες AI. Αυτή είναι η βασική ιδέα της εταιρείας μας, όπως ανέφερα προηγουμένως. Επομένως, ολόκληρο το προϊόν μας βασίζεται στην παροχή εργαλείων, οπτικοποίησης, ερμηνείας και ελέγχου στους ανθρώπους. Νομίζω ότι μέσα σε ένα χρόνο, αυτό θα γίνει μια τεράστια τάση.

Kimberly Tan: Αυτό είναι πολύ λογικό. Ποιες δυνατότητες πιστεύετε ότι θα χρειαστούν οι επόπτες τεχνητής νοημοσύνης στο μέλλον; Ποιο είναι το σύνολο δεξιοτήτων για αυτόν τον ρόλο;

Jesse Zhang: Υπάρχουν δύο πτυχές. Το ένα είναι η παρατηρησιμότητα και η ερμηνευσιμότητα, η ικανότητα γρήγορης κατανόησης του τι κάνει η τεχνητή νοημοσύνη και πώς λαμβάνει αποφάσεις. Το άλλο είναι η ικανότητα λήψης αποφάσεων, ή το οικοδόμημα, πώς να δίνετε ανατροφοδότηση και πώς να χτίσετε νέα λογική. Νομίζω ότι αυτά τα δύο είναι οι δύο όψεις του ίδιου νομίσματος.

Kimberly Tan: Ποια καθήκοντα πιστεύετε ότι θα παραμείνουν πέρα από τις δυνατότητες του πράκτορα τεχνητής νοημοσύνης μεσοπρόθεσμα ή μακροπρόθεσμα και θα πρέπει ακόμα να τα διαχειρίζονται και να τα εκτελούν σωστά οι άνθρωποι;

Jesse Zhang: Νομίζω ότι θα εξαρτηθεί κυρίως από την απαίτηση για «τελειότητα» που ανέφερα προηγουμένως. Υπάρχουν πολλές εργασίες που έχουν πολύ χαμηλή ανοχή σε σφάλματα. Σε αυτές τις περιπτώσεις, οποιοδήποτε εργαλείο τεχνητής νοημοσύνης είναι περισσότερο βοήθεια παρά ένας πλήρως ανεπτυγμένος πράκτορας.

Για παράδειγμα, σε ορισμένες πιο ευαίσθητες βιομηχανίες, όπως η υγειονομική περίθαλψη ή η ασφάλεια, όπου πρέπει να είστε σχεδόν τέλειοι, τότε σε αυτούς τους τομείς, οι Πράκτορες AI μπορεί να γίνουν λιγότερο αυτόνομοι, αλλά αυτό δεν σημαίνει ότι είναι άχρηστοι. Νομίζω ότι το στυλ θα είναι διαφορετικό, σε μια πλατφόρμα σαν τη δική μας, στην πραγματικότητα αναπτύσσετε αυτούς τους Agents για να τους επιτρέψετε να αυτοματοποιήσουν ολόκληρη την εργασία.

Derrick Harris: Και αυτό είναι όλο για αυτό το επεισόδιο. Εάν βρήκατε αυτό το θέμα ενδιαφέρον ή εμπνευσμένο, αξιολογήστε το podcast μας και μοιραστείτε το με περισσότερα άτομα.Αναμένουμε να κυκλοφορήσει το τελευταίο επεισόδιο πριν από το τέλος του έτους και θα ανανεώσουμε το περιεχόμενο για τη νέα χρονιά. Ευχαριστούμε για την ακρόαση και να έχετε υπέροχες διακοπές (αν ακούτε κατά τη διάρκεια των διακοπών).

Πρωτότυπο βίντεο: Μπορούν τελικά οι Al Agents να διορθώσουν την υποστήριξη πελατών?

Παρόμοιες θέσεις

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *