Esiletõstmised
- LLM-ide võlu seisneb selles, et nad on väga paindlikud, suudavad kohaneda paljude erinevate olukordadega ja neil on elementaarne intelligentsus.
- Usume, et aja jooksul muutuvad kasutajaliides ja UX üha loomulikumaks keelepõhiseks, sest nii mõtleb Agent-süsteem või see on põhimõtteliselt suurte keelemudelite (LLM) koolituse aluseks.
- Kui soovite, et keegi AI-agendi vastu võtaks, teeb ta tegelikult teatud "usuhüppe", sest paljude inimeste jaoks on see väga võõras valdkond.
AI Agent kujundab kliendikogemuse ümber
Jesse Zhang: Kuidas agent tegelikult konstrueeritakse? Meie seisukoht on, et aja jooksul muutub see üha enam loomuliku keelepõhise agendi sarnaseks, sest nii koolitatakse suuri keelemudeleid (LLM).
Kui teil on pikas perspektiivis üliintelligentne agent, kes on tegelikult nagu inimene, saate talle asju näidata, selgitada, tagasisidet anda ja ta värskendab teavet oma mõtetes.
Võite ette kujutada, et teil on väga võimekas meeskonnaliige. Kui nad esimest korda liituvad, õpetate neile midagi, nad hakkavad tööle ja seejärel annate neile tagasisidet ja näitate neile uut teavet.
Pikapeale see selles suunas areneb – muutub vestluslikumaks ja loomulikumaks keeleks ning inimestevaheline suhtlus muutub loomulikumaks. Ja inimesed ei kasuta enam neid keerulisi otsustuspuid nõuete hõivamiseks, mis võivad toimida, kuid võivad kokku kukkuda.
Varem pidime seda tegema, kuna meil polnud suurt keelemudelit. Kuid nüüd, agendi pideva arenguga, muutuvad kasutajakogemus (UX) ja kasutajaliides (UI) vestluslikumaks.
Derrick Harris: Tere kõigile, tere tulemast A16z AI Podcasti. Mina olen Derrick Harris ja täna liituvad minuga Decagoni kaasasutaja ja tegevjuht Jesse Zhang ning a16z partner Kimberly Tan. Kimberly juhib arutelu ning Jesse jagab oma kogemusi Decagoni ja selle toodete ehitamisel.
Kui te sellest palju ei tea, on Decagon idufirma, mis pakub ettevõtetele tehisintellekti agente, kes abistavad klienditoega. Need agendid ei ole vestlusrobotid ega LLM-i ümbrised ühe API-kõne jaoks, vaid väga kohandatud täiustatud agendid, mis saavad hakkama keerukate töövoogudega, mis põhinevad ettevõtte spetsiifilistel vajadustel.
Lisaks selgitamisele, miks nad Decagoni lõid ja kuidas see on üles ehitatud erinevate LLM-i ja kliendikeskkondade käsitlemiseks, räägib Jesse ka vestluse eest tasu võtva ärimudeli eelistest ja sellest, kuidas AI agendid muudavad klienditoe juhtidelt nõutavaid oskusi.
Samuti väärib mainimist, et Kimberly kirjutas hiljuti blogipostituse pealkirjaga "RIP to RPA, The Rise of Intelligent Automation", mida me selles osas lühidalt käsitleme.
See on suurepärane lähtepunkt selleks, et mõista, kuidas automatiseerimine äriprotsessides edeneb, ja anname saate märkustes lingi. Ja lõpuks, meeldetuletuseks, selle artikli sisu on ainult informatiivsel eesmärgil ja seda ei tohiks pidada juriidiliseks, äri-, maksu- ega investeerimisnõustamiseks, samuti ei tohiks seda kasutada investeeringu või väärtpaberi hindamiseks ning see ei ole suunatud ühelegi a16z fondi investorile ega potentsiaalsele investorile.
Jesse Zhang: Lühitutvustus iseendale. Olen sündinud ja kasvanud Boulderis ning osalesin lapsepõlves paljudel matemaatikavõistlustel jms. Õppisin Harvardis arvutiteadust ja asutasin seejärel ettevõtte, mida toetas ka a16z. Lõpuks omandas meid Niantic.
Siis hakkasime ehitama Decagonit. Meie ettevõte loob klienditeeninduseks tehisintellekti agente. Alguses tegime seda sellepärast, et tahtsime teha midagi, mis on meile väga südamelähedane.
Muidugi ei pea kedagi õpetama AI agentide rolli kohta klienditeeninduses, eks? Oleme kõik olnud telefonis lennufirmade, hotellide jnega ja oodanud. Nii et see idee tuli sealt.
Rääkisime paljude klientidega, et täpselt teada, millist toodet peaksime ehitama. Üks asi, mis meie jaoks silma paistis, oli see, et tehisintellekti agentide kohta rohkem teada saades hakkasime mõtlema, milline oleks tulevik, kui neid on palju. Ma arvan, et kõik usuvad, et tulevikus on palju tehisintellekti agente.
Mida me mõtleme, mida teevad AI-agentidega töötavad töötajad? Milliseid tööriistu neil on? Kuidas nad kontrollivad või vaatavad agente, kellega nad töötavad või mida nad juhivad?
Nii et see on tuum, kuidas me selle küsimuse ümber ettevõtte üles ehitasime. Ma arvan, et see eristab meid ka praegu, sest pakume neile tehisintellekti agentidele erinevaid tööriistu, mis aitavad inimestel, kellega koos töötame, neid agente luua ja konfigureerida nii, et need poleks enam "must kast". Nii ehitame oma brändi.
Derrick Harris: Mis inspireeris teid, kuna teie viimane ettevõte oli tarbijatele suunatud videoettevõte, ettevõtte tarkvara kasutusele võtma?
Jesse Zhang: Suurepärane küsimus. Arvan, et asutajad on teema valimisel sageli teemaagnostikud, sest tegelikult oled uuele valdkonnale lähenedes tavaliselt üsna naiivne. Seega on eelis, kui vaadata asju uuest vaatenurgast. Nii et kui me sellele mõtlesime, siis teemapiiranguid peaaegu polnud.
Ma arvan, et see on väga levinud muster kvantitatiivsema taustaga inimeste puhul, kaasa arvatud mina. Pärast tarbekaupade proovimist kaldute rohkem ettevõttetarkvara poole, sest ettevõtte tarkvaral on konkreetsemaid probleeme.
Teil on tegelikke kliente, kellel on tegelikud vajadused ja eelarved ja muud sellised asjad, ning saate nende jaoks optimeerida ja probleeme lahendada. Tarbijaturg on samuti väga atraktiivne, kuid see põhineb pigem intuitsioonil kui eksperimenteerimisel. Minu jaoks isiklikult sobib ettevõtte tarkvara paremini.
Kimberly Tan: Esiteks võime alustada järgmisest küsimusest: millised on kõige levinumad tugikategooriad, millega Decagon täna tegeleb? Kas saate täpsustada, kuidas kasutate suuri keelemudeleid (LLM) nende probleemide lahendamiseks ja mida saate nüüd teha, mida te varem teha ei saanud?
Jesse Zhang: Kui vaatate tagasi eelmisele automatiseerimisele, olete võib-olla kasutanud otsustuspuid millegi lihtsa tegemiseks, et määrata, millist teed valida. Kuid me kõik oleme kasutanud vestlusroboteid ja see on üsna masendav kogemus.
Tihti ei saa teie küsimusele otsustuspuu abil täielikult vastata. Nii suunatakse teid lõpuks küsimuse teele, mis on küsimusega seotud, kuid ei vasta sellele täpselt. Nüüd on meil suured keelemudelid (LLM). LLM-ide võlu seisneb selles, et nad on väga paindlikud, suudavad kohaneda paljude erinevate olukordadega ja neil on elementaarne intelligentsus.
Kui rakendate seda klienditoele või kui klient esitab küsimuse, saate pakkuda isikupärasemat teenust. See on esimene punkt, isikupärastamise tase on oluliselt paranenud. See avab kõrgemad mõõdikud. Saate lahendada rohkem probleeme, kliendid on rahulolevamad ja klientide rahulolu suureneb.
Järgmine loomulik samm on: kui teil on see intelligentsus, peaksite suutma teha rohkem asju, mida inimesed suudavad. Asjad, mida inimesed saavad teha, on see, et nad saavad andmeid reaalajas koguda, nad saavad tegutseda ja nad saavad mitme sammu kaudu arutleda. Kui klient küsib suhteliselt keeruka küsimuse, võib-olla "tahan seda ja teist teha" ja tehisintellekt on valmis lahendama ainult esimest küsimust. LLM on piisavalt tark, et mõista, et siin on kaks küsimust. Esiteks lahendab see esimese probleemi ja seejärel aitab teil lahendada teise probleemi.
Enne LLM-i ilmumist oli see põhimõtteliselt võimatu. Nii et me näeme nüüd järkjärgulist muutust selles, mida tehnoloogia on võimeline tegema, ja seda tänu LLM-ile.
Kimberly Tan: Kuidas määratleksite selles kontekstis tehisintellekti agenti? Kuna sõna "agent" kasutatakse laialdaselt, huvitab mind, mida see Decagoni kontekstis tegelikult tähendab.
Jesse Zhang: Ma ütleksin, et agent viitab rohkem süsteemile, kus töötavad koos mitu LLM-i (suure keele mudeli) süsteemi. Teil on LLM-i kutse, mis põhimõtteliselt hõlmab viipa saatmist ja vastuse saamist. Agendi puhul soovite ühendada mitu sellist kutset, võib-olla isegi rekursiivselt.
Näiteks on teil LLM-kõne, mis määrab, kuidas sõnumit käsitleda, ja seejärel võib see käivitada muid kõnesid, mis koguvad rohkem andmeid, sooritavad toiminguid ja kordavad seda, mida kasutaja ütles, võib-olla isegi küsides järelküsimusi. Nii et meie jaoks võib agenti mõista peaaegu LLM-i kõnede, API-kõnede või muu loogika võrgustikuna, mis töötavad koos parema kogemuse pakkumiseks.
Kimberly Tan: Sellel teemal võime ehk rohkem rääkida agentide infrastruktuurist, mille olete tegelikult ehitanud. Ma arvan, et üks väga huvitav punkt on see, et turul on palju tehisintellekti agentide esitlusi, kuid ma arvan, et nendest on väga vähe näiteid, mis suudavad tootmiskeskkonnas stabiilselt töötada. Ja väljastpoolt on raske teada, mis on tõeline ja mis mitte.
Niisiis, millistel aspektidel tänapäeva tehisintellekti agentidel teie arvates läheb hästi ja millised aspektid nõuavad veel tehnoloogilisi läbimurdeid, et muuta need tugevamaks ja usaldusväärsemaks?
Jesse Zhang: Minu nägemus on tegelikult veidi erinev. Erinevus selle vahel, kas tehisintellekti agent on lihtsalt demo või "tõesti töötav", ei seisne täielikult tehnoloogiavirnas, sest arvan, et enamik inimesi võib kasutada ligikaudu sama tehnoloogiat. Arvan, et kui oled oma ettevõtte arengus kaugemale jõudnud, näiteks meie ettevõte on tegutsenud juba üle aasta, siis loote midagi väga spetsiifilist, mis sobib teie kasutusjuhtumiga.
Kuid lõppkokkuvõttes pääsevad kõik ligi samale mudelile ja kasutavad sarnast tehnoloogiat. Ma arvan, et suurim erinevus selles, kas AI agent saab tõhusalt töötada, seisneb tegelikult kasutusjuhtumi vormis. Alguses on seda raske teada, kuid tagasi vaadates leiate, et on kaks omadust, mis on tehisintellekti agendi jaoks väga olulised, et minna kaugemale demonstreerimisest ja siseneda praktilisse rakendusse.
Esimene on see, et lahendatud kasutusjuhtumil peab olema mõõdetav ROI (investeeringutasuvus). See on väga oluline, sest kui ROI-d ei saa kvantifitseerida, on raske veenda inimesi teie toodet reaalselt kasutama ja selle eest maksma. Meie puhul on kvantitatiivne näitaja: mitu protsenti toetustaotlustest lahendate? Kuna see number on selge, saavad inimesed sellest aru – oh, okei, kui lahendate rohkem, saan võrrelda seda tulemust oma jooksvate kulutuste ja ajakuluga. Seega, kui see näitaja on olemas, siis teine meie jaoks väga oluline näitaja on klientide rahulolu. Kuna ROI-d on lihtne kvantifitseerida, võtavad inimesed selle tõesti omaks.
Teine tegur on see, et kasutusjuhud peavad olema järk-järgult keerulisemad. Samuti oleks väga raske, kui vajate agenti, kes oleks algusest peale üliinimlik, lahendades peaaegu 100% kasutusjuhtu. Kuna nagu me teame, on LLM-id mittedeterministlikud, peab teil olema mingi situatsiooniplaan. Õnneks on toe kasutusjuhtudel üks suurepärane funktsioon ja see on see, et saate alati eskaleerida inimeseni. Isegi kui suudad lahendada vaid pooled probleemidest, on see inimestele ikkagi väga väärtuslik.
Seega arvan, et sellel toel on see omadus, mis muudab selle AI-agendi jaoks väga sobivaks. Ma arvan, et on palju muid valdkondi, kus inimesed saavad luua muljetavaldavaid demosid, kus te ei pea isegi tähelepanelikult uurima, et mõista, miks AI agent oleks kasulik. Aga kui see peab olema algusest peale täiuslik, siis on see väga raske. Kui see nii on, ei taha peaaegu keegi seda proovida ega kasutada, sest selle ebatäiuslikkuse tagajärjed võivad olla väga tõsised – näiteks turvalisuse mõttes.
Näiteks kui inimesed teevad simulatsioone, on neil alati klassikaline mõte: "Oh, oleks tore, kui LLM saaks seda lugeda." Kuid on raske ette kujutada, et keegi ütleks: „Okei, AI agent, lase käia. Usun, et saate sellega hakkama." Sest kui see teeb vea, võivad tagajärjed olla väga tõsised.
Jesse Zhang: Selle otsustavad tavaliselt meie kliendid ja tegelikult näeme me väga erinevaid erinevusi. Ühes äärmuses muudavad mõned inimesed oma agendi tõesti inimese moodi, seega on inimese avatar, inimese nimi ja vastused on väga loomulikud. Teisest küljest teatab agent lihtsalt, et see on AI, ja teeb selle kasutajale selgeks. Arvan, et erinevatel ettevõtetel, kellega me töötame, on selles osas erinevad seisukohad.
Tavaliselt, kui tegutsete reguleeritud tööstuses, peate selle selgeks tegema. Huvitav on see, et klientide käitumine on muutumas. Kuna paljud meie kliendid saavad sotsiaalmeedias palju tagasisidet, näiteks: "Issand jumal, see on esimene vestluskogemus, mida ma kunagi proovisin ja mis tundub nii reaalne" või "See on lihtsalt maagia." Ja see on nende jaoks suurepärane, sest nüüd õpivad nende kliendid. Hei, kui see on AI-kogemus, võib see tegelikult olla parem kui inimene. Varem see nii ei olnud, sest enamikul meist on varem olnud selline telefoniklienditeeninduse kogemus: „Olgu, AI, AI, AI…”
Kimberly Tan: Mainisite paar korda isikupärastamise kontseptsiooni. Kõik kasutavad sama aluseks olevat tehnoloogiaarhitektuuri, kuid neil on tugiteenuste osas erinevad isikupärastamisvajadused. Kas saate sellest rääkida? Täpsemalt, kuidas saavutada isikupärastamine, et inimesed saaksid veebis öelda: "Issand, see on parim tugikogemus, mis mul kunagi olnud on"?
Jesse Zhang: meie jaoks isikupärastamine tuleneb kasutaja kohandamisest. Peate mõistma kasutaja taustteavet, mis on vajalik lisakontekst. Teiseks peate mõistma ka meie klientide äriloogikat.Kui ühendate need kaks, saate pakkuda päris hea kogemuse.
Ilmselgelt kõlab see lihtsalt, kuid tegelikult on kogu vajaliku konteksti hankimine väga keeruline. Seetõttu tegeleme enamiku meie tööga õigete primitiivsete komponentide loomisega, et kui klient meie süsteemi juurutab, saaks ta hõlpsasti otsustada: „Olgu, see on äriloogika, mida me tahame.” Näiteks peate esmalt tegema need neli sammu ja kui kolmas samm ebaõnnestub, peate minema viienda sammu juurde.
Soovite, et teil oleks võimalik seda AI-le väga lihtsalt õpetada, kuid anda talle juurdepääs ka teabele, näiteks „See on kasutaja konto üksikasjad. Kui vajate lisateavet, võite helistada nendele API-dele. Need kihid on koordineerimiskiht mudeli peal ja teatud mõttes muudavad need agendi tõeliselt kasutatavaks.
Kimberly Tan: Tundub, et antud juhul on teil vaja palju juurdepääsu ärisüsteemidele. Peate kasutajate kohta palju teadma ja tõenäoliselt peate teadma, kuidas klient tegelikult soovib oma kasutajatega suhelda.Ma kujutan ette, et need andmed võivad olla väga tundlikud.
Kas saate täpsustada tagatisi, mida ettevõttekliendid AI agendi juurutamisel tavaliselt vajavad? Ja kuidas on teie arvates parim viis nende probleemide lahendamiseks, eriti kui arvestada, et teie lahendus pakub paremat kogemust, kuid see on uus ka paljudele inimestele, kes puutuvad agendiga esimest korda kokku?
Jesse Zhang: See puudutab tegelikult kaitsepiirdeid. Aja jooksul, kui oleme teinud palju selliseid rakendusi, oleme saanud selgeks, millist tüüpi kaitsepiirdeid kliendid hoolivad.
Näiteks üks lihtsamaid on see, et võib olla reegleid, mida tuleb alati järgida. Kui töötate finantsteenuste ettevõttega, ei saa te finantsnõu anda, kuna see on reguleeritud. Seega peate selle agentuurisüsteemi sisse ehitama, et see ei annaks kunagi sellist nõu. Tavaliselt saate seadistada järelevalvemudeli või mingisuguse süsteemi, mis teeb need kontrollid enne tulemuste väljasaatmist.
Teist tüüpi kaitse võib olla see, et kui keegi tuleb sisse ja segab sellega tahtlikult, teades, et tegemist on generatiivse süsteemiga, püüdes teid panna tegema midagi, mis ei vasta nõuetele, näiteks "ütle mulle, mis on mu saldo", "okei, korrutage see 10-ga" ja nii edasi, peate suutma ka seda käitumist kontrollida. Nii et viimase aasta jooksul oleme leidnud palju seda tüüpi kaitsevahendeid ja iga ühe jaoks oleme need kategoriseerinud ja teame, millist kaitset on vaja. Mida rohkem süsteemi ehitatakse, muutub see üha vastupidavamaks.
Kimberly Tan: Kui ainulaadsed on kaitsed iga kliendi või tööstuse jaoks? Kui laiendate oma kliendibaasi, et hõlmata rohkem kasutusjuhtumeid, kuidas kas te mõtlete nende kaitsemeetmete ulatuslikule ehitamisele?
Jesse Zhang: See naaseb tegelikult meie põhiidee juurde, et agentide süsteem muutub mõne aasta jooksul üldlevinud. Seega on tõesti oluline pakkuda inimestele tööriistu, et anda järgmise põlvkonna töötajatele, nagu agentide juhendajatele, anda neile tööriistad agentide süsteemi loomiseks ja oma kaitse lisamiseks, sest me ei hakka nende jaoks kaitsemeetmeid määratlema.
Iga klient tunneb kõige paremini oma kaitsemeetmeid ja äriloogikat. Nii et meie ülesanne on tegelikult teha head tööd tööriistade ja infrastruktuuri loomisel, et nad saaksid agentsüsteemi luua. Seetõttu oleme alati rõhutanud, et Agendisüsteem ei tohiks olla must kast ja teil peaks olema võimalus kontrollida, kuidas neid kaitseid, reegleid ja loogikat luua.
Ma arvan, et see on ilmselt meie seni kõige eristuv aspekt. Oleme nende tööriistade kallal palju vaeva näinud ja leidnud loovaid viise, et võimaldada inimestel, kellel ei pruugi olla ülimalt tehnilist tausta või isegi sügavat arusaama tehisintellekti mudelite toimimisest, sisestada agendisüsteemi toimingud, mida nad soovivad tehisintellektiga sooritada.
Ma arvan, et see muutub lähiaastatel üha olulisemaks võimeks. See peaks olema üks olulisemaid kriteeriume, kui inimesed hindavad sarnaseid tööriistu, sest soovite neid süsteeme aja jooksul pidevalt optimeerida ja täiustada.
Loomulikust keelest juhitud äriloogika
Derrick Harris: Milliseid ettevalmistusi saavad kliendid või ettevõtted teha, et valmistuda mis tahes tüüpi automatiseerimiseks ja eriti selle agendisüsteemi kasutamiseks? Näiteks kuidas saavad nad kujundada oma andmesüsteemid, tarkvaraarhitektuur või äriloogika selliste süsteemide toetamiseks?
Sest mulle tundub, et suur osa AI-tehnoloogiast on alguses uudne, kuid kui tegemist on olemasolevate pärandsüsteemidega, tekib sageli suur kaos.
Jesse Zhang: Kui keegi ehitab praegu nullist, on palju parimaid tavasid, mis võivad teie tööd lihtsamaks muuta. Näiteks kuidas struktureerida oma teadmistebaasi. Oleme mõnest neist kirjutanud ja tutvustanud mõningaid meetodeid, mis võivad tehisintellektil teabe neelamist hõlbustada ja selle täpsust parandada. Üks konkreetne soovitus on jagada teadmistebaas modulaarseteks osadeks, selle asemel, et koostada üks suur artikkel koos mitme vastusega.
API seadistamisel saate muuta need agendisüsteemi jaoks sobivamaks ning seada õigused ja väljundid viisil, mis hõlbustab Agent-süsteemil teabe sissevõtmist, ilma et peaksite vastuse leidmiseks palju arvutusi tegema. Need on mõned taktikalised meetmed, mida saab võtta, kuid ma ei ütleks, et agendisüsteemi kasutamiseks tuleb midagi teha.
Derrick Harris: Hea dokumentatsioon on alati oluline, sisuliselt on see teabe tõhus korraldamine.
Kimberly Tan: See kõlab nii, et kui proovite õpetada inimestele, kuidas suunata agendisüsteemi töötama viisil, mis kõige paremini sobib nende klientidele või konkreetsetele kasutusjuhtudele, võib olla vajalik kasutajaliidese ja UX-i disainiga palju katsetamist või peate selles täiesti uues valdkonnas uusi radasid leidma, kuna see erineb traditsioonilisest tarkvarast väga palju.
Mind huvitab, kuidas te sellest arvate? Milline peaks kasutajaliides ja UX välja nägema maailmas, kus on agent-first? Kuidas see teie arvates lähiaastatel muutub?
Jesse Zhang: Ma ei ütleks, et oleme selle probleemi lahendanud. Arvan, et oleme leidnud kohaliku optimumi, mis töötab meie praeguste klientide jaoks, kuid see on meie ja paljude teiste jaoks endiselt käimasolev uurimisvaldkond.
Põhiprobleem ulatub tagasi selle juurde, mida me varem mainisime, st et teil on agendisüsteem. Esiteks, kuidas saate selgelt näha, mida see teeb ja kuidas ta otsuseid teeb? Kuidas saate selle teabe põhjal otsustada, mida on vaja värskendada ja millist tagasisidet tehisintellektile anda? Siin saavad kokku kasutajaliidese elemendid, eriti teine osa.
Arvame, et aja jooksul muutuvad kasutajaliides ja UX üha loomulikumaks keelepõhiseks, sest nii mõtleb Agent-süsteem ehk see on põhimõtteliselt suurte keelemudelite (LLM) koolitamise aluseks.
Äärmisel juhul, kui teil on üliintelligentne agent, kes mõtleb põhimõtteliselt nagu inimene, saate talle asju näidata, asju selgitada, tagasisidet anda ja see uueneb oma "mõistuses". Võite ette kujutada, et teie meeskonnaga liitub väga võimekas inimene, õpetate talle midagi, ta hakkab tööle ja siis annate talle pidevalt tagasisidet, saate talle näidata uusi asju, uusi dokumente, diagramme jne.
Ma arvan, et äärmisel juhul areneb see selles suunas: asjad muutuvad vestluslikumaks, loomulikumaks keelepõhiseks ja inimesed lõpetavad süsteemide ehitamise keerukate otsustuspuudega nagu vanasti, jäädvustades seda, mida soovite, kuid selline lähenemine võib kergesti laguneda. Varem pidime seda tegema, sest tollal polnud LLM-e, kuid nüüd, kui agentide süsteemid muutuvad üha võimsamaks, muutuvad kasutajaliides ja UX rohkem kõneaineks.
Kimberly Tan: Umbes poolteist aastat tagasi, kui Decagon esimest korda alustas, oli üldine arusaam, et LLM on paljude kasutusjuhtumite jaoks väga rakendatav, kuid tegelikult oli see lihtsalt mingi "GPT ümbris", kus ettevõtted said lihtsalt API kaudu alusmudelit kutsuda ja oma tugiprobleemid koheselt lahendada.
Kuid ilmselgelt selgub, et kuna ettevõtted otsustavad kasutada selliseid lahendusi nagu Decagon, selle asemel, et seda teed minna, selgub, et see pole nii. Ma mõtlesin, kas saate selgitada, miks see nii on. Mis täpselt muutis sisemise ehitamise väljakutsed oodatust keerukamaks? Milliseid väärarusaamu neil selle kontseptsiooni kohta tekkis?
Jesse Zhang: GPT-ümbriseks olemises pole midagi halba, võib öelda, et Purcell on AWS-i ümbris või midagi sellist. Tavaliselt, kui inimesed seda terminit kasutavad, tähendab see midagi halvustavat.
Minu isiklik seisukoht on, et kui loote agendisüsteemi, kasutate kindlasti LLM-i tööriistana. Nii et te ehitate tegelikult juba olemasolevale, nagu tavaliselt AWS-ile või GCP-le.
Kuid tegelik probleem, millega võite kokku puutuda, on see, kui tarkvara, mille te LLM-ile ehitate, ei ole piisavalt raske või keeruline, et midagi muuta.
Tagantjärele vaadates on meie jaoks müüdav sisuliselt tarkvara. Oleme tegelikult nagu tavaline tarkvarafirma, ainult et LLM-i kasutame tarkvara osana ja ühe tööriistana. Kuid kui inimesed ostavad sellist toodet, tahavad nad peamiselt tarkvara ennast. Nad tahavad tööriistu, mis suudaksid jälgida tehisintellekti, mis suudaksid süveneda iga tehisintellekti vestluse üksikasjadesse, anda tagasisidet, mis suudavad süsteemi pidevalt üles ehitada ja kohandada.
Nii et see on meie tarkvara tuum. Isegi Agent-süsteemi enda puhul on inimeste probleem selles, et demo on lahe teha, aga kui tahad selle tootmisvalmis ja tõeliselt klientidele suunatud, pead lahendama palju pikaajalisi probleeme, nagu näiteks “illusiooni” fenomeni ärahoidmine ja halbade tegijatega, kes üritavad kaost tekitada. Samuti peame veenduma, et latentsusaeg on piisavalt madal, toon on sobiv jne.
Rääkisime paljude meeskondadega ja nad tegid katseid, koostasid esialgse versiooni ja siis said nad aru: "Oh, tõesti, me ei taha olla need, kes neid detaile hilisemates etappides edasi ehitavad." Samuti ei tahtnud nad olla need, kes klienditeenindusmeeskonda aina uut loogikat lisavad. Seega tundub praegusel hetkel sobivam teha koostööd teistega.
Kimberly Tan: Mainisite mõningaid pikaajalisi probleeme, nagu vajadus tegeleda halbade näitlejatega jne.Usun, et paljud AI-agendi kasutamist kaaluvad kuulajad on mures uute turvaründeteede pärast, mis võivad tekkida pärast LLM-ide kasutuselevõttu, või uute turvariskide pärast, mis võivad tekkida pärast agendisüsteemi kasutuselevõttu. Mida arvate nendest probleemidest? Ja millised on parimad tavad ettevõtte tipptasemel turvalisuse tagamiseks Agent?
Jesse Zhang: Turvalisuse osas võib võtta mõningaid ilmselgeid meetmeid, mida ma varem mainisin, näiteks kaitsemeetmete vajadus. Põhiprobleem on see, et inimesed muretsevad LLM-ide pärast, et nad ei ole deterministlikud.
Kuid hea uudis on see, et saate enamiku tundlikest ja keerulistest toimingutest asetada deterministliku seina taha ja arvutamine toimub seal, kui see kutsub API-d. Nii et te ei tugine selle lahendamisel täielikult LLM-ile ja see väldib paljusid põhiprobleeme.
Aga ikka tuleb ette olukordi, kus näiteks halb näitleja segab või keegi üritab süsteemi hallutsineerida. Oleme täheldanud, et paljudes suuremates klientides, kellega me koostööd teeme, sisenevad nende turvameeskonnad meie toodetele ja sooritavad põhimõtteliselt "punase meeskonna" testi, veetes nädalaid pidevalt erinevaid võimalikke ründeid süsteemi vastu, et leida turvaauke. Kuna AI Agent muutub üha populaarsemaks, võime seda näha üha sagedamini, sest see on üks parimaid viise süsteemi tõhususe testimiseks. See on visata sellele midagi punase meeskonna testi kaudu ja vaadata, kas see suudab kaitsest läbi murda.
On ka idufirmasid, kes arendavad punase meeskonna tööriistu või võimaldavad inimestel selliseid teste ise teha, mis on praegu suundumus. Paljud ettevõtted, kellega me töötame, lasevad müügitsükli hilisemas etapis oma turvameeskond või välismeeskonnaga koostööd teha, et testida süsteemi. Meie jaoks on selliste testide läbimine kohustuslik. Nii et lõpuks see asi taandubki.
Derrick Harris: Kas seda julgustate oma kliente tegema? Sest tehisintellekti poliitikast rääkides mainime olulist aspekti, milleks on rakenduskiht, ja rõhutame putitamist . vastutus LLM-i kasutajate ja rakendust käitavate inimeste kanda, selle asemel, et süüdistada lihtsalt mudelit ennast. See tähendab, et kliendid peaksid läbi viima punase meeskonna testimise, tuvastama konkreetsed kasutusjuhud ja rünnakuteed ning määrama, milliseid haavatavusi tuleb kaitsta, selle asemel, et tugineda lihtsalt OpenAI või teiste ettevõtete poolt juba loodud turvakaitsele.
Jesse Zhang: Nõustun täielikult. Arvan ka, et võib tekkida uus teavitamisnõuete laine, mis sarnaneb SOC 2 sertifikaadi ja HIPAA sertifikaadiga, mida kõik praegu teevad ja mida nõutakse erinevates tööstusharudes. Tavaliselt nõuavad kliendid üldise SaaS-toote müümisel läbitungimistesti ja me peame esitama ka oma läbitungimistesti aruande. AI Agenti puhul võivad tulevikus tekkida sarnased nõuded ja keegi võib seda nimetada, kuid see on põhimõtteliselt uus viis testida, kas Agent süsteem on piisavalt võimas.
Kimberly Tan: Üks huvitav asi on see, et ilmselt on kõik väga põnevil uute mudelite läbimurretest ja tehnoloogilistest läbimurretest, mida kõik suured laborid tutvustavad. AI-ettevõttena ei tee te ilmselgelt ise uurimistööd, vaid kasutate seda uurimistööd ja ehitate selle ümber palju tarkvara, et lõppkliendile tarnida.
Kuid teie töö põhineb kiiresti muutuval tehnoloogial. Mul on rakendusliku tehisintellekti ettevõttena uudishimulik, kuidas te uute tehnoloogiliste muudatustega kursis käite ja mõistate, kuidas need ettevõtet mõjutavad, olles samal ajal suuteline ennustama oma tooteplaani ja koostama kasutajate vajadusi? Laiemalt öeldes, milliseid strateegiaid peaksid rakendatud tehisintellekti ettevõtted sarnastes olukordades kasutama?
Jesse Zhang: Tegelikult saate kogu virna jagada erinevateks osadeks. Näiteks LLM on allosas, kui vaatate rakenduskihti. Teil võib olla keskel mõned tööriistad, mis aitavad teil hallata LLM-i või teha hindamisi ja muud sellist. Seejärel on ülemine osa põhimõtteliselt see, mida me ehitasime, mis on tegelikult nagu tavaline SaaS.
Nii et suurem osa meie tööst ei erinegi tavatarkvarast nii palju, välja arvatud see, et meil on täiendav uurimiskomponent – LLM muutub liiga kiiresti. Peame uurima, mida nad oskavad, milles nad head on ja millist mudelit teatud ülesande täitmiseks kasutada. See on suur probleem, sest nii OpenAI kui ka Anthropic toovad turule uusi tehnoloogiaid ning ka Gemini paraneb järk-järgult.
Seetõttu sul peab olema oma hindamismehhanism, et mõista, milline mudel millises olukorras kasutamiseks sobib. Mõnikord on vaja ka peenhäälestada, aga küsimus on: millal peenhäälestada? Millal tasub peenhäälestada? Need on ilmselt peamised LLM-idega seotud uurimisprobleemid, millele me keskendume. Kuid vähemalt seni ei tunne me, et SaaS kiiresti muutuks, sest me ei sõltu keskmisest kihist. Põhimõtteliselt on LLM-id need, mis muutuvad. Neid ei muudeta väga sageli ja kui muutuvad, on see tavaliselt uuendus. Näiteks Claude 3.5 sonetti uuendati paar kuud tagasi ja sel ajal mõtlesime: "Okei, kas peaksime vana kasutamise jätkamise asemel uuele mudelile üle minema?"
Peame lihtsalt läbi viima rea hindamisi ja kui oleme uuele mudelile üle läinud, ei mõtle me sellele enam, sest te juba kasutate uut mudelit. Siis tuli välja o1 versioon ja olukord oli sarnane. Mõelge, kus seda kasutada saab. Meie puhul on o1 enamiku klientidega seotud kasutusjuhtude jaoks pisut aeglane, nii et saame seda kasutada mõne taustatöö jaoks. Lõppkokkuvõttes on meil lihtsalt vaja mudeliuuringute jaoks head süsteemi.
Kimberly Tan: Kui sageli hindate uut mudelit ja otsustate, kas see välja vahetada?
Jesse Zhang: Hindame iga kord, kui uus mudel välja tuleb. Peate veenduma, et kuigi uus mudel on nutikam, ei lõhuks see mõnda teie juba ehitatud kasutusjuhtu. See võib juhtuda. Näiteks võib uus mudel olla üldiselt nutikam, kuid mõnel äärmuslikul juhul toimib see mõne teie töövoo A/B valiku korral halvasti. Selle eest me hindame.
Ma arvan, et üldiselt on see intelligentsus, millest me kõige rohkem hoolime, see, mida ma nimetaksin "juhiste järgimise võimeks". Soovime, et mudel muutuks juhiste järgimisel üha paremaks. Kui see nii on, siis on see meile kindlasti kasulik ja see on väga hea.
Näib, et hiljutised uuringud on keskendunud rohkem intelligentsusele, mis hõlmab arutluskäiku, nagu parem programmeerimine ja paremad matemaatilised toimingud. See aitab ka meid, kuid see pole nii oluline kui juhendamise järgimise võime parandamine.
Kimberly Tan: Üks väga huvitav punkt, mida mainisite ja ma arvan, et see on ka Decagoni jaoks väga ainulaadne, on see, et olete loonud ettevõttesiseselt palju hindamisinfrastruktuuri, et olla kindel, et teate täpselt, kuidas iga mudel teie pakutavate testide komplekti raames toimib.
Kas saate seda täpsustada? Kui oluline on see ettevõttesisene hindamise infrastruktuur ja kuidas see annab teile ja teie klientidele kindlustunde agendi toimimise suhtes? Kuna osa neist hinnangutest on suunatud ka klientidele.
Jesse Zhang: Ma arvan, et see on väga oluline, sest ilma selle hindamistaristuta oleks meil väga raske kiiresti itereerida.
Kui tunned, et igal muudatusel on suur tõenäosus midagi rikkuda, siis sa ei tee muudatusi kiiresti. Aga kui teil on hindamismehhanism, siis kui toimub suur muudatus, mudeliuuendus või midagi uut, saate seda otse võrrelda kõigi hindamistestidega. Kui hindamistulemused on head, võite tunda: okei, tegime parandusi või võite selle julgelt vabastada, ilma liigselt muretsemata.
Nii et meie valdkonnas hindamine nõuab kliendi sisendit, sest klient on see, kes otsustab, kas miski on õige või mitte. Muidugi saame kontrollida mõnda kõrgetasemelist probleemi, kuid tavaliselt annab klient konkreetsed kasutusjuhud ja ütleb meile, mis on õige vastus või mis see peab olema, mis tooni peab säilitama, mida ta peab ütlema.
Hinnang põhineb sellel. Seega peame tagama, et meie hindamissüsteem on piisavalt tugev. Alguses ehitasime ise ja seda pole nii raske hooldada. Teame ka, et on olemas hindamisettevõtted, ja oleme mõnda neist uurinud. Võib-olla ühel hetkel kaalume, kas need kasutusele võtta, aga praegu pole hindamissüsteem meie jaoks enam valupunkt.
Kimberly Tan: Tänapäeval on väga populaarne teema multimodaalsus, mis tähendab, et tehisintellekti agendid peaksid suutma suhelda kõigis tänapäeval kasutatavates vormides, olgu selleks siis tekst, video, hääl jne. Ma tean, et Decagon sai alguse tekstipõhisest. Teie vaatenurgast, kui oluline on multimodaalsus AI agentidele? Mis on teie arvates ajakava, mille jooksul see muutuks peavooluks või isegi standardiks?
Jesse Zhang: See on oluline ja ettevõtte vaatenurgast pole uue modaalsuse lisamine eriti keeruline. See pole lihtne, kuid põhiline on: kui lahendada muid probleeme, nagu need, mida mainisin – näiteks tehisintellekti ehitamine, selle jälgimine ja õige loogika omamine –, siis pole uue modaalsuse lisamine just kõige keerulisem. Nii et meie jaoks on kõigi viiside omamine väga mõttekas ja see laiendab meie turgu. Oleme põhimõtteliselt modaalsuse agnostikud ja loome iga modaalsuse jaoks oma agendi.
Üldiselt on kaks piiravat tegurit: esiteks, kas klient on valmis uut viisi kasutusele võtma? Ma arvan, et tekstiga alustamine on mõttekas, sest see on viis, kuidas inimesed kõige aktiivsemalt omaks võtavad ja see on nende jaoks vähem riskantne, kergemini jälgitav ja arusaadav. Teine suur moodus on hääl. Ilmselgelt arvan, et turul on veel ruumi ja kasutajate hääle aktsepteerimine vajab veel paranemist. Praegu näeme mõningaid varaseid kasutajaid, kes on hakanud hääleagente kasutusele võtma, mis on väga põnev. Teine aspekt on tehnilised väljakutsed. Enamik inimesi nõustub, et hääle latt on seatud kõrgemale. Kui räägite kellegagi telefonis, vajate väga lühikest hääle latentsust. Kui katkestate kellegi, peab ta sellele loomulikult reageerima.
Kuna kõne latentsus on madalam, peate arvutamisel olema nutikam. Kui olete vestluses ja reageerimisaeg on viis kuni kaheksa sekundit, ei pane te seda peaaegu tähele ja see tundub väga loomulik. Aga kui telefonis vastamiseks kulub viis kuni kaheksa sekundit, tundub see pisut ebaloomulik. Seega on kõnega rohkem tehnilisi väljakutseid. Kuna need tehnilised väljakutsed on lahendatud ja huvi kõne kasutuselevõtu vastu turul suureneb, muutub kõne kui uus moodus peavooluks.
Ärimudel, mis hüppab üle usalduse
Kimberly Tan: Enne kui jätkame, tahaksin veidi rohkem rääkida AI Agenti ärimudelist. Kui sa esiteks ehitatud AI agent või arutasite klientidega nende kasutatavat süsteemi, töödeldavaid andmeid ja muresid, kas oli midagi, mis teid üllatas? Millised on mõned ebaintuitiivsed või üllatavad asjad, mida Decagon pidi tegema, et ettevõtte kliente paremini teenindada?
Jesse Zhang: Ma arvan, et kõige üllatavam oli see, mil määral inimesed olid valmis meiega rääkima, kui alustasime. Lõppude lõpuks olime ainult kaks. Olime mõlemad varem ettevõtteid asutanud, nii et teadsime paljusid inimesi, kuid isegi nii on iga ettevõtja jaoks, kui soovite suunamisvestlust käima lükata, kui see, mida te räägite, ei ole eriti mõjuv, on vestlus tavaliselt üsna leige.
Aga kui me sellest kasutusjuhtumist rääkima hakkasime, oli mul tegelikult üsna üllatav, kui põnevil inimesed sellest rääkisid. Sest idee tundub nii ilmne. Võib arvata, et kuna see on nii ilmselge idee, siis peab keegi teine seda juba teinud või peab juba lahendus olema või peab keegi teine juba mingi lahenduse välja mõelnud. Kuid ma arvan, et tabasime hea hetke, see kasutusjuhtum on tõesti suur ja inimesed hoolivad sellest väga. Nagu ma varem mainisin, sobib see kasutusjuhtum tõesti hästi AI agendi võtmiseks ja selle tootmisse viimiseks, kuna saate seda järk-järgult rakendada ja ROI-d jälgida.
See oli minu jaoks meeldiv üllatus, aga ilmselgelt on pärast seda palju tööd teha, tuleb teha koostööd klientidega, tuleb toode üles ehitada, tuleb välja mõelda, mis teed minna. Algfaasis oli see tõesti üllatav avastus.
Derrick Harris: Kimberly, ma tunnen, et peaksin mainima teie kirjutatud blogipostitust RIP to RPA, mis puudutab paljusid . automatiseerimisülesanded ja käivitamised.Kas arvate, et on olemas nähtus, mille puhul need automatiseeritud ülesanded või lahendused pole nii ideaalsed, nii et inimesed otsivad alati paremat viisi?
Kimberly Tan: Jah, ma arvan küll. Tahaksin öelda paar asja. Esiteks, kui idee on kõigile arusaadav, aga pole selget ettevõtet, kes seda lahendaks või keegi ei osuta näpuga ettevõttele ja ütle: "Kasuta seda", siis tähendab see, et probleem pole tegelikult lahendatud.
Teatud mõttes on see ettevõttele täiesti avatud võimalus lahendust välja töötada. Sest nagu te ütlesite, oleme Decagonit investorina jälginud algusest peale. Oleme jälginud neid loomingulises rägastikus liikumas ning kui nad otsustasid selles suunas liikuda ja klientidega rääkima hakkasid, sai selgeks, et kõik kliendid ihkasid meeleheitlikult mingit natiivset AI-toega lahendust. See on üks varem mainitud probleemidest, mille puhul paljud arvavad, et see on lihtsalt GPT ümbris. Kuid klientide huvi, mida Decagon on algusest peale saanud, on pannud meid varakult mõistma, et paljud neist probleemidest on palju keerulisemad, kui inimesed ootavad.
Ma arvan, et see nähtus toimub erinevates tööstusharudes, olgu see siis klienditeenindus või professionaalne automatiseerimine teatud vertikaalides. Ma arvan, et üks alahinnatud punkt, nagu Jesse varem mainis, on võime selgelt mõõta ülesannete automatiseerimise investeeringutasuvust (ROI). Sest kui te kavatsete panna kedagi AI-agendi vastu võtma, teeb ta tegelikult teatud "usuhüppe", sest see on paljude inimeste jaoks väga võõras territoorium.
Kui suudate automatiseerida väga spetsiifilise protsessi, mis on kas ilmselge tulu teeniv protsess või protsess, mis varem oli ettevõtte kitsaskoht, või suur kulukoht, mis kasvab lineaarselt klientide kasvu või tulude kasvuga, siis on tehisintellekti agendi heakskiit lihtsam saada. Võimalus muuta sellised probleemid produktiivsemaks protsessiks, mida saab skaleerida nagu traditsioonilist tarkvara, on väga atraktiivne.
Kimberly Tan: Mul on üks viimane küsimus, enne kui me edasi liigume. Mäletan, et Jesse ütles meie eelmistes aruteludes alati, et tarkvara või tehisintellekti agente kasutavate ettevõtete suurim väljakutse on hallutsinatsioonid. Aga sa ütlesid mulle kunagi, et see pole tegelikult peamine probleem. Kas saate täpsustada, miks hallutsinatsioonide tajumine on mõnevõrra eksitav ja mille pärast inimesed tegelikult rohkem mures on?
Jesse Zhang: Ma arvan, et inimesed hoolivad hallutsinatsioonidest, kuid nad on rohkem mures nende pakutava väärtuse pärast. Peaaegu kõik ettevõtted, kellega me koostööd teeme, keskenduvad samadele probleemidele, peaaegu täpselt samadele küsimustele: mitu protsenti vestlustest saate lahendada? Kui rahul on mu kliendid? Siis võib hallutsinatsioonide probleemi liigitada kolmandasse kategooriasse, nimelt selle täpsuse alla. Üldiselt on hindamisel olulisemad kaks esimest tegurit.
Oletame, et räägite uue ettevõttega ja olete kahe esimese teguri osas teinud väga head tööd ning juhtkond ja kõik meeskonnaliikmed on teid palju toetanud. Nad ütlevad: „Issand jumal, meie kliendikogemus on erinev. Igal kliendil on nüüd oma isiklik assistent, kes saab meiega igal ajal ühendust võtta. Oleme andnud neile suurepäraseid vastuseid, nad on väga rahul ning see on mitmekeelne ja saadaval ööpäevaringselt. See on vaid osa sellest ja olete ka palju raha säästnud.
Nii et kui olete need eesmärgid saavutanud, saate töö juhtimiseks palju tuge ja palju taganttuult. Muidugi tuleb illusiooniprobleem lõpuks lahendada, kuid see pole asi, mille pärast nad kõige rohkem muret teevad. Illusiooni lahendamise viis on sama, mida ma varem mainisin – inimesed panevad sind proovile. Võib esineda kontseptsiooni tõestamise faas, kus te tegelikult korraldate tõelisi vestlusi ja meeskonnaliikmed jälgivad ja kontrollivad täpsust. Kui see läheb hästi, siis tavaliselt läheb.
Lisaks, nagu ma varem mainisin, saate tundliku teabe jaoks kehtestada ranged kaitsemeetmed, näiteks ei pea te tingimata muutma tundlikku sisu üldiseks. Nii et illusiooniteema on enamiku tehingute puhul arutluskoht. See pole tähtsusetu teema. Te läbite selle protsessi, kuid see pole kunagi vestluse keskmes.
Kimberly Tan: Liigume nüüd edasi AI agendi ärimudeli juurde. Täna on suur teema nende tehisintellekti agentide hinna määramise kohta.
Ajalooliselt on paljude SaaS-tarkvarade hind määratud kohtade arvu järgi, kuna need on töövootarkvarad, mis on suunatud üksikutele töötajatele ja mida kasutatakse töötajate tootlikkuse parandamiseks. AI Agent ei ole aga seotud üksikute töötajate tootlikkusega nagu traditsiooniline tarkvara.
Nii mõnigi arvab, et kohtade arvul põhinev hinnastamismeetod ei pruugi enam kehtida. ma olen uudishimulik kuidas mõtlesite sellele dilemmale esimestel päevadel ja sellele, kuidas otsustasite lõpuks Decagoni hinna määrata. Samuti, milline on teie arvates tarkvara hinnakujunduse tulevikutrend, kuna AI Agent muutub üha tavalisemaks?
Jesse Zhang: Meie seisukoht selles küsimuses on, et varem oli tarkvara hind istekoha kohta, kuna selle skaala põhines ligikaudu inimeste arvul, kes said tarkvara kasutada. Kuid enamiku tehisintellekti agentide jaoks ei sõltu teie pakutav väärtus seda hooldavate inimeste arvust, vaid pigem tehtud töö hulgast. See on kooskõlas punktiga, mida ma varem mainisin: kui investeeringutasuvus (ROI) on väga mõõdetav, siis on ka töö väljundi tase väga selge.
Meie seisukoht on, et hinnakujundus kohtade arvu järgi kindlasti ei kehti. Hinna saab vastavalt töö väljundile. Seega peaks teie pakutav hinnamudel olema selline, et mida rohkem tööd tehakse, seda rohkem maksate.
Meie jaoks on hinna määramiseks kaks ilmset viisi. Saate hinnata vestlusi või vestlusi, mida AI tegelikult lahendab. Ma arvan, et üks huvitavaid õppetunde, mille saime, on see, et enamik inimesi valis vestluse hinnakujunduse mudeli. Põhjus on selles, et lahenduspõhise hinnakujunduse peamine eelis on see, et maksate mille eest . AI teeb seda.
Kuid järgnev küsimus on, mida peetakse "lahenduseks"? Esiteks ei taha keegi sellesse süvitsi minna, sest see kõlab: "Kui keegi tuleb vihasena ja saadate ta minema, miks me peaksime selle eest maksma?"
See loob ebamugava olukorra ja muudab ka stiimulid tehisintellekti pakkujatele pisut kummaliseks, sest lahenduspõhine arveldamine tähendab: "Peame lihtsalt võimalikult palju vestlusi lahendama ja mõned inimesed eemale tõrjuma." Kuid on palju juhtumeid, kus on parem probleemi eskaleerida, mitte lihtsalt eemale lükata, ja klientidele selline käitumine ei meeldi. Seetõttu toob vestluse alusel arveldamine kaasa lihtsuse ja prognoositavuse.
Kimberly Tan: kui kaua teie arvates tulevane hinnamudel kestab?Sest praegu, kui mainite ROI-d, põhineb see tavaliselt varasematel kulutustel, mida võidi kasutada tööjõukulude katmiseks. Kas te arvate, et tehisintellekti agendid muutuvad üha tavalisemaks, et pikemas perspektiivis võrreldakse tehisintellekti tööjõukuludega ja kas see on sobiv etalon? Kui ei, siis kuidas näete pikaajalist hinnakujundust peale tööjõukulude?
Jesse Zhang: Arvan, et pikemas perspektiivis võib tehisintellekti agentide hinnakujundus siiski olla peamiselt seotud tööjõukuludega, sest see on agendi ilu – teie varasemad kulutused teenustele saab nüüd tarkvarale ümber paigutada.
See osa kuludest võib olla 10–100 korda suurem kui tarkvarakulud, nii et suur osa kuludest kandub tarkvarale. Seetõttu saavad tööjõukulud loomulikult võrdlusaluseks. Meie klientide jaoks on ROI väga selge. Kui saate tööjõukuludelt kokku hoida X miljonit, siis on mõistlik see lahendus kasutusele võtta. Kuid pikas perspektiivis võib see olla kesktee.
Sest isegi mõned tooted, mis pole nii head kui meie agent, nõustuvad madalama hinnaga. See on nagu klassikaline SaaS-i olukord, kus kõik võistlevad turuosa pärast.
Kimberly Tan: Mis teie arvates toob tulevik praeguste SaaS-i ettevõtete jaoks, eriti nende jaoks, kelle tooted ei pruugi olla algselt tehisintellekti jaoks loodud või mille hind on istekoha kohta ega saa seetõttu kohaneda tulemusele orienteeritud hinnamudeliga?
Jesse Zhang: Mõne traditsioonilise ettevõtte jaoks on AI Agenti toote turuletoomine tõepoolest pisut keeruline, kuna nad ei saa selle istmemudeli abil hinda määrata. Kui te ei vaja enam nii palju agente, on olemasoleva tootega tulude säilitamine keeruline. See on traditsiooniliste ettevõtete probleem, kuid seda on raske öelda. Traditsioonilistel ettevõtetel on alati turustuskanalite eelis. Isegi kui toode pole nii hea kui uus ettevõte, ei taha inimesed kulutada jõupingutusi, et aktsepteerida uut tarnijat, kelle kvaliteet on vaid 80%.
Seega, esiteks, kui olete idufirma nagu meie, peate tagama, et teie toode on kolm korda parem kui traditsiooniline toode. Teiseks on see tüüpiline konkurents traditsiooniliste ettevõtete ja idufirmade vahel. Traditsioonilistel ettevõtetel on loomulikult madalam riskitaluvus, kuna neil on palju kliente. Kui nad teevad kiirel iteratsioonil vea, põhjustab see suuri kahjusid. Kuid idufirmad saavad itereerida kiiremini, seega võib iteratsiooniprotsess ise viia parema tooteni. See on tavaline tsükkel. Meie jaoks oleme alati olnud uhked oma tarnekiiruse, tootekvaliteedi ja meeskonna tööteostuse üle. Seetõttu oleme praeguse tehingu võitnud.
Kimberly Tan: Kas saate teha mõningaid ennustusi AI tuleviku kohta töökohal? Näiteks kuidas see muudab töötajate vajadusi või võimeid või kuidas töötajad ja tehisintellekti agendid omavahel suhtlevad?Millised uued parimad tavad või normid muutuvad teie arvates töökohal normiks, kui tehisintellekti agendid hakkavad laiemalt levima?
Jesse Zhang: Esimene ja kõige olulisem muudatus on see, et oleme veendunud, et tulevikus veedavad töötajad palju rohkem aega töökohal tehisintellekti agentide ehitamisel ja haldamisel, sarnaselt AI juhendajate rolliga. Isegi kui teie ametikoht ei ole ametlikult "AI järelevaataja", nihkub suur osa ajast, mille veetsite oma töö tegemiseks, nende agentide haldamisele, sest agendid võivad anda teile palju mõjuvõimu.
Oleme seda näinud paljudes juurutustes, kus inimesed, kes olid kunagi meeskonnajuhid, kulutavad nüüd palju aega tehisintellekti jälgimisele, näiteks veendumaks, et sellel pole probleeme, või teha kohandusi. Nad jälgivad üldist jõudlust, et näha, kas on konkreetseid valdkondi, mis vajavad tähelepanu, kas teadmistebaasis on lünki, mis võiksid aidata tehisintellektil paremaks muutuda, ja kas tehisintellekt suudab need lüngad täita.
Agendiga töötamisega kaasnev töö jätab mulje, et tulevikus veedavad töötajad tehisintellekti agentidega suheldes märkimisväärselt palju aega. See on meie ettevõtte põhikontseptsioon, nagu ma varem mainisin. Seetõttu on kogu meie toode üles ehitatud inimestele tööriistade, visualiseerimise, tõlgendatavuse ja kontrolli pakkumisele. Ma arvan, et aasta jooksul muutub see tohutuks trendiks.
Kimberly Tan: Sellel on palju mõtet. Milliseid võimeid AI järelevaatajad teie arvates tulevikus vajavad? Millised on selle rolli jaoks vajalikud oskused?
Jesse Zhang: On kaks aspekti. Üks on jälgitavus ja tõlgendatavus, võime kiiresti aru saada, mida tehisintellekt teeb ja kuidas otsuseid teeb. Teine on otsustusvõime ehk ülesehitamise osa, kuidas tagasisidet anda ja uut loogikat üles ehitada. Ma arvan, et need kaks on ühe mündi kaks külge.
Kimberly Tan: Millised ülesanded jäävad teie arvates keskpikas või pikas perspektiivis tehisintellekti agendi suutlikkusest kaugemale ning mida inimesed peavad ikkagi õigesti juhtima ja täitma?
Jesse Zhang: Ma arvan, et see sõltub peamiselt "täiuslikkuse" nõudest, mida ma varem mainisin. On palju ülesandeid, mille veataluvus on väga madal. Sellistel juhtudel on mis tahes tehisintellekti tööriist pigem abivahend kui täieõiguslik agent.
Näiteks mõnes tundlikumas tööstusharus, nagu tervishoid või turvalisus, kus peate olema peaaegu täiuslik, võivad tehisintellekti agendid nendes valdkondades muutuda vähem autonoomseks, kuid see ei tähenda, et need oleksid kasutud. Ma arvan, et stiil on erinev, sellisel platvormil nagu meie oma, kasutate tegelikult neid agente, et lasta neil kogu töö automatiseerida.
Derrick Harris: Ja see on selle episoodi jaoks kõik. Kui see teema oli teile huvitav või inspireeriv, hinnake meie taskuhäälingusaadet ja jagage seda rohkemate inimestega.Eeldame, et avaldame viimase episoodi enne aasta lõppu ja muudame sisu uueks aastaks. Täname kuulamast ja head pühadeaega (kui kuulate pühade ajal).
Originaalvideo: Kas Al Agents saavad lõpuks klienditoe parandada?