Vivutio
- Uchawi wa LLM ni kwamba wao ni rahisi kubadilika, wanaweza kukabiliana na hali nyingi tofauti, na kuwa na akili ya msingi.
- Tunaamini kwamba baada ya muda, UI na UX zitakuwa zenye msingi wa lugha asilia zaidi na zaidi, kwa sababu hivi ndivyo mfumo wa Wakala unavyofikiri, au kimsingi huu ndio msingi wa mafunzo kwa miundo mikubwa ya lugha (LLMs).
- Ikiwa unataka mtu kukubali AI Agent, kwa kweli anachukua kiwango cha "kuruka kwa imani" kwa sababu kwa watu wengi, hii ni uwanja usiojulikana sana.
Wakala wa AI hurekebisha hali ya mteja
Jesse Zhang: Je, Wakala hujengwaje kweli? Maoni yetu ni kwamba baada ya muda, itakuwa zaidi na zaidi kama Wakala wa lugha asilia kwa sababu ndivyo miundo mikubwa ya lugha (LLMs) inavyofunzwa.
Baadaye, ikiwa una wakala mwerevu sana ambaye kwa kweli ni kama mwanadamu, unaweza kumwonyesha mambo, kumwelezea, kumpa maoni, na atasasisha habari akilini mwake.
Unaweza kufikiria kuwa na mshiriki mwenye uwezo mkubwa wa timu. Wanapojiunga mara ya kwanza, unawafundisha kitu, wanaanza kufanya kazi, halafu unawapa maoni na kuwaonyesha habari mpya.
Hatimaye, itakua katika mwelekeo huu - itakuwa ya mazungumzo zaidi na zaidi kulingana na lugha ya asili, na njia ya watu kuwasiliana na kila mmoja itakuwa ya asili zaidi. Na watu hawatatumia tena miti hiyo ngumu ya kufanya maamuzi ili kunasa mahitaji, ambayo yanaweza kufanya kazi lakini yanaweza kuporomoka.
Hapo awali, tulilazimika kufanya hivi kwa sababu hatukuwa na modeli kubwa ya lugha. Lakini sasa, kwa kuendelea kwa Wakala, uzoefu wa mtumiaji (UX) na kiolesura cha mtumiaji (UI) utakuwa wa mazungumzo zaidi.
Derrick Harris: Hamjambo nyote, karibu kwenye A16z AI Podcast. Mimi ni Derrick Harris, na leo nitaungana na Jesse Zhang, mwanzilishi mwenza na Mkurugenzi Mtendaji wa Decagon, na Kimberly Tan, mshirika katika a16z. Kimberly atasimamia mjadala, na Jesse atashiriki uzoefu wake wa kujenga Decagon na bidhaa zake.
Ikiwa hujui mengi kuihusu, Decagon ni kampuni inayoanzisha ambayo hutoa mawakala wa AI kwa biashara ili kusaidia kwa usaidizi kwa wateja. Mawakala hawa si wapiga gumzo wala si vifungashio vya LLM kwa simu moja ya API, lakini mawakala wa hali ya juu walioboreshwa sana ambao wanaweza kushughulikia mtiririko changamano wa kazi kulingana na mahitaji mahususi ya kampuni.
Mbali na kueleza kwa nini waliunda Decagon na jinsi imeundwa kushughulikia LLM tofauti na mazingira ya wateja, Jesse pia anazungumzia kuhusu faida za mtindo wa biashara unaotoza kwa mazungumzo, na jinsi AI Agents itabadilisha ujuzi unaohitajika wa viongozi wa usaidizi wa wateja.
Inafaa pia kutaja kwamba hivi majuzi Kimberly aliandika chapisho la blogi linaloitwa "RIP to RPA, The Rise of Intelligent Automation," ambalo tunajadili kwa ufupi katika kipindi hiki.
Ni sehemu nzuri ya kuanzia kuelewa jinsi uendeshaji otomatiki unavyoanza katika michakato ya biashara, na tutatoa kiungo katika maelezo ya kipindi. Na hatimaye, kama ukumbusho, yaliyomo katika kifungu hiki ni kwa madhumuni ya habari tu na hayapaswi kuzingatiwa ushauri wa kisheria, biashara, ushuru au uwekezaji, na pia haipaswi kutumiwa kutathmini uwekezaji au usalama wowote, na hayaelekezwi kwa mwekezaji yeyote wa mfuko wa a16z au mwekezaji anayetarajiwa.
Jesse Zhang: Utangulizi mfupi kwangu. Nilizaliwa na kukulia huko Boulder, na nilishiriki katika mashindano mengi ya hesabu na mengine kama hayo nikiwa mtoto. Nilisoma sayansi ya kompyuta huko Harvard, kisha nikaanzisha kampuni ambayo pia iliungwa mkono na a16z. Hatimaye tulinunuliwa na Niantic.
Kisha tukaanza kujenga Dekagoni. Biashara yetu inaunda Wakala wa AI kwa huduma kwa wateja. Mwanzoni, tulifanya hivyo kwa sababu tulitaka kufanya jambo ambalo lilikuwa karibu sana na mioyo yetu.
Bila shaka, hakuna mtu anayehitaji kufundishwa kuhusu jukumu la Wakala wa AI katika huduma ya wateja, sivyo? Sote tumekuwa kwenye simu na mashirika ya ndege, hoteli, n.k., na tulisubiri. Kwa hivyo wazo lilitoka hapo.
Tulizungumza na wateja wengi ili kujua ni aina gani ya bidhaa tunapaswa kuunda. Jambo moja ambalo lilijitokeza kwetu ni kwamba tulipojifunza zaidi kuhusu Mawakala wa AI, tulianza kufikiria jinsi siku zijazo zingekuwa wakati kuna mengi yao. Nadhani kila mtu anaamini kuwa kutakuwa na Mawakala wengi wa AI katika siku zijazo.
Tunachofikiria ni nini wafanyikazi wanaofanya kazi karibu na mawakala wa AI watafanya? Watakuwa na zana za aina gani? Je, watadhibiti au kuwaona vipi mawakala wanaofanya nao kazi au kuwasimamia?
Kwa hivyo huu ndio msingi wa jinsi tulivyounda kampuni karibu na swali hili. Nadhani hili pia ndilo linalotutofautisha hivi sasa, kwa sababu tunawapa mawakala hawa wa AI zana mbalimbali ili kuwasaidia watu tunaofanya nao kazi kujenga na kusanidi mawakala hawa ili wasiwe tena "sanduku nyeusi". Hivi ndivyo tunavyounda chapa yetu.
Derrick Harris: Ni nini kilikuhimiza, kwa kuwa kampuni yako ya mwisho ilikuwa kampuni ya video inayowalenga wateja, kuhamia kwenye programu za biashara?
Jesse Zhang: Swali kubwa. Nadhani waanzilishi mara nyingi ni "mada zisizoaminika" linapokuja suala la kuchagua mada, kwa sababu kwa ukweli, unapokaribia uwanja mpya, kwa kawaida wewe ni mjinga sana. Kwa hivyo kuna faida ya kuangalia mambo kutoka kwa mtazamo mpya. Kwa hivyo tulipokuwa tukifikiria juu yake, karibu hakukuwa na vizuizi vya mada.
Nadhani huo ni muundo wa kawaida sana kwa watu walio na asili ya kiasi, mimi nikiwemo. Baada ya kujaribu bidhaa za watumiaji, huwa unavutiwa zaidi na programu ya biashara kwa sababu programu ya biashara ina shida zaidi.
Una wateja halisi walio na mahitaji na bajeti halisi na vitu kama hivyo, na unaweza kuboresha na kutatua matatizo kwa hao. Soko la watumiaji pia linavutia sana, lakini linategemea zaidi angavu kuliko kuendeshwa na majaribio. Kwangu mimi binafsi, programu ya biashara inafaa zaidi.
Kimberly Tan: Kwanza, tunaweza kuanza na swali hili: Je, ni kategoria zipi za usaidizi ambazo Decagon inashughulika nazo leo? Je, unaweza kufafanua jinsi unavyotumia miundo mikubwa ya lugha (LLMs) kutatua matatizo haya na kile unachoweza kufanya sasa ambacho hukuweza kufanya hapo awali?
Jesse Zhang: Ukiangalia nyuma kwenye otomatiki iliyopita, unaweza kuwa umetumia miti ya maamuzi kufanya jambo rahisi, kuamua ni njia gani ya kuchukua. Lakini sote tumetumia chatbots, na ni uzoefu wa kufadhaisha.
Mara nyingi swali lako haliwezi kujibiwa kikamilifu na mti wa uamuzi. Kwa hivyo unaishia kuelekezwa kwenye njia ya swali ambayo inahusiana na swali lakini hailingani kabisa nayo. Sasa, tuna miundo mikubwa ya lugha (LLMs). Uchawi wa LLM ni kwamba wao ni rahisi kubadilika, wanaweza kukabiliana na hali nyingi tofauti, na kuwa na akili ya msingi.
Unapotumia hili kwa usaidizi kwa wateja, au mteja anapouliza swali, unaweza kutoa huduma iliyobinafsishwa zaidi. Hili ndilo jambo la kwanza, kiwango cha ubinafsishaji kimeongezeka sana. Hii itafungua vipimo vya juu zaidi. Unaweza kutatua matatizo zaidi, wateja wameridhika zaidi, na kuridhika kwa wateja huongezeka.
Hatua inayofuata ya asili ni: ikiwa una akili hii, unapaswa kuwa na uwezo wa kufanya zaidi ya mambo ambayo wanadamu wanaweza kufanya. Mambo ambayo wanadamu wanaweza kufanya ni kwamba wanaweza kuvuta data kwa wakati halisi, wanaweza kuchukua hatua, na wanaweza kufikiria kupitia hatua nyingi. Ikiwa mteja atauliza swali tata, labda "Nataka kufanya hivi na vile," na AI iko tayari kushughulikia swali la kwanza. LLM ni smart kutosha kutambua kwamba kuna maswali mawili hapa. Kwanza, itasuluhisha shida ya kwanza, na kisha kukusaidia kutatua shida ya pili.
Kabla ya LLM kuja, hii kimsingi haikuwezekana. Kwa hivyo sasa tunaona mabadiliko ya hatua katika teknolojia ambayo inaweza kufanya, na hiyo ni shukrani kwa LLM.
Kimberly Tan: Katika muktadha huu, unaweza kufafanuaje Wakala wa AI? Kama neno "Wakala" linatumiwa sana, nina hamu ya kujua maana yake katika muktadha wa Dekagoni.
Jesse Zhang: Ningesema kwamba Wakala hurejelea zaidi mfumo ambapo mifumo mingi ya LLM (mfano wa lugha kubwa) hufanya kazi pamoja. Una ombi la LLM, ambalo kimsingi linahusisha kutuma kidokezo na kupata jibu. Kwa Wakala, ungependa kuweza kuunganisha maombi mengi kama haya, labda hata kwa kujirudia.
Kwa mfano, una simu ya LLM ambayo huamua jinsi ya kushughulikia ujumbe, na kisha inaweza kusababisha simu zingine zinazovuta data zaidi, kutekeleza vitendo, na kurudia kile mtumiaji alisema, labda hata kuuliza maswali ya ufuatiliaji. Kwa hivyo kwetu sisi, Wakala anaweza kueleweka kama mtandao wa karibu simu za LLM, simu za API, au mantiki nyingine ambayo hufanya kazi pamoja ili kutoa matumizi bora.
Kimberly Tan: Juu ya mada hii, labda tunaweza kuzungumza zaidi kuhusu miundombinu ya Wakala ambayo umejenga. Nadhani jambo moja la kufurahisha sana ni kwamba kuna maonyesho mengi ya Wakala wa AI kwenye soko, lakini nadhani kuna mifano michache sana yao ambayo inaweza kukimbia kwa utulivu katika mazingira ya uzalishaji. Na ni vigumu kujua kutoka nje nini ni kweli na nini si.
Kwa hivyo kwa maoni yako, ni vipengele gani vya Mawakala wa AI wa leo wanaofanya vizuri, na ni vipengele gani bado vinahitaji mafanikio ya kiteknolojia ili kuwafanya kuwa imara na ya kuaminika zaidi?
Jesse Zhang: Mtazamo wangu kwa kweli ni tofauti kidogo. Tofauti kati ya kubaini iwapo AI Agent ni onyesho tu au "inafanya kazi kweli" haipo kabisa kwenye rundo la teknolojia, kwa sababu nadhani watu wengi wanaweza kuwa wanatumia takriban teknolojia sawa. Nadhani mara tu unapoendelea zaidi katika maendeleo ya kampuni yako, kwa mfano, kampuni yetu imeanzishwa kwa zaidi ya mwaka mmoja, utaunda kitu maalum sana ambacho kinafaa kesi yako ya matumizi.
Lakini katika uchambuzi wa mwisho, kila mtu anaweza kufikia mfano sawa na kutumia teknolojia sawa. Nadhani kitofautishi kikubwa zaidi cha ikiwa wakala wa AI anaweza kufanya kazi kwa ufanisi ni katika mfumo wa kesi ya utumiaji. Ni vigumu kujua hili mwanzoni, lakini ukiangalia nyuma, utapata kwamba kuna sifa mbili ambazo ni muhimu sana kwa wakala wa AI kwenda zaidi ya maandamano na kuingiza matumizi ya vitendo.
Ya kwanza ni kwamba kesi ya utumiaji unayosuluhisha lazima iwe na ROI inayoweza kukadiriwa (kurudisha kwenye uwekezaji). Hii ni muhimu sana, kwa sababu ikiwa ROI haiwezi kuhesabiwa, itakuwa vigumu kuwashawishi watu kutumia bidhaa yako na kulipia. Kwa upande wetu, kiashirio cha kiasi ni: ni asilimia ngapi ya maombi ya usaidizi unasuluhisha? Kwa sababu nambari hii iko wazi, watu wanaweza kuielewa – loo, sawa, ukisuluhisha zaidi, ninaweza kulinganisha matokeo haya na gharama zangu za sasa na muda niliotumia. Kwa hiyo, ikiwa kuna kiashiria hiki, kiashiria kingine ambacho ni muhimu sana kwetu ni kuridhika kwa wateja. Kwa sababu ROI inaweza kuhesabiwa kwa urahisi, watu wataipitisha kweli.
Jambo la pili ni kwamba kesi za utumiaji lazima ziwe ngumu zaidi. Pia itakuwa ngumu sana ikiwa ungehitaji Wakala kuwa mtu wa juu zaidi tangu mwanzo, kutatua karibu 100% ya kesi za utumiaji. Kwa sababu kama tunavyojua, LLMs sio za kuamua, lazima uwe na aina fulani ya mpango wa dharura. Kwa bahati nzuri, kuna sifa nzuri ya kesi za utumiaji wa usaidizi, na hiyo ni kwamba unaweza kuongezeka kila wakati hadi kwa mwanadamu. Hata kama unaweza kutatua nusu tu ya shida, bado ni muhimu sana kwa watu.
Kwa hivyo nadhani usaidizi huo una sifa hii ambayo inafanya kufaa sana kwa Wakala wa AI. Nadhani kuna maeneo mengine mengi ambapo watu wanaweza kuunda maonyesho ya kuvutia ambapo sio lazima hata uangalie kwa karibu ili kuelewa kwa nini AI Agent inaweza kuwa muhimu. Lakini ikiwa inapaswa kuwa kamili tangu mwanzo, basi ni vigumu sana. Ikiwa hivyo ndivyo, karibu hakuna mtu atakayetaka kujaribu au kuitumia kwa sababu matokeo ya kutokamilika kwake yanaweza kuwa mbaya sana - kwa mfano, katika suala la usalama.
Kwa mfano, wakati watu wanaigiza, huwa na wazo hili la kawaida kila wakati: "Loo, itakuwa vyema ikiwa LLM inaweza kusoma hii." Lakini ni vigumu kufikiria mtu akisema, “Sawa, Wakala wa AI, fanya hivyo. Naamini unaweza kufanya hivyo.” Kwa sababu ikiwa itafanya makosa, matokeo yanaweza kuwa makubwa sana.
Jesse Zhang: Hii kawaida huamuliwa na wateja wetu, na kwa kweli tunaona tofauti nyingi sana. Kwa hali iliyokithiri, watu wengine humfanya Wakala wao aonekane kama mwanadamu, kwa hivyo kuna avatar ya mwanadamu, jina la mwanadamu, na majibu ni ya asili sana. Kwa upande mwingine, Wakala husema tu kwamba ni AI na huweka hili wazi kwa mtumiaji. Nadhani kampuni tofauti tunazofanya kazi nazo zina misimamo tofauti juu ya hili.
Kawaida, ikiwa uko katika tasnia inayodhibitiwa, lazima uweke hili wazi. Ninachofurahia sasa ni kwamba tabia ya wateja inabadilika. Kwa sababu wateja wetu wengi wanapata maoni mengi kwenye mitandao ya kijamii, kama vile, “Oh Mungu wangu, hii ni tukio la kwanza la gumzo ambalo nimewahi kujaribu ambalo ni la kweli,” au “Huu ni uchawi tu.” Na hiyo ni nzuri kwao, kwa sababu sasa wateja wao wanajifunza, hey, ikiwa ni uzoefu wa AI, inaweza kuwa bora zaidi kuliko mwanadamu. Haikuwa hivyo hapo awali, kwa sababu wengi wetu tumekuwa na aina hiyo ya uzoefu wa huduma kwa wateja kwa simu hapo awali: “Sawa, AI, AI, AI…”
Kimberly Tan: Ulitaja dhana ya ubinafsishaji mara chache. Kila mtu anatumia usanifu wa teknolojia sawa, lakini wana mahitaji tofauti ya ubinafsishaji kulingana na huduma za usaidizi. Je, unaweza kuzungumza kuhusu hili? Hasa, unawezaje kufikia ubinafsishaji ili watu waweze kusema mtandaoni, "Mungu wangu, hii ndiyo uzoefu bora zaidi wa usaidizi ambao nimewahi kupata"?
Jesse Zhang: Kwa ajili yetu, ubinafsishaji huja kutokana na kubinafsisha mtumiaji. Unahitaji kuelewa maelezo ya usuli ya mtumiaji, ambayo ni muktadha wa ziada unaohitajika. Pili, unahitaji pia kuelewa mantiki ya biashara ya wateja wetu.Ukichanganya hizi mbili, unaweza kutoa uzoefu mzuri sana.
Kwa wazi, hii inasikika rahisi, lakini kwa kweli ni ngumu sana kupata muktadha wote unaohitajika. Kwa hivyo, kazi yetu nyingi ni jinsi ya kuunda vipengee vya awali vinavyofaa ili mteja anapotuma mfumo wetu, aweze kuamua kwa urahisi, "Sawa, hii ndiyo mantiki ya biashara tunayotaka." Kwa mfano, kwanza unahitaji kufanya hatua hizi nne, na ikiwa hatua ya tatu inashindwa, unahitaji kwenda hatua ya tano.
Unataka kuwa na uwezo wa kufundisha AI hili kwa urahisi sana, lakini pia ipe ufikiaji wa habari kama, "Haya ni maelezo ya akaunti ya mtumiaji. Ikiwa unahitaji maelezo zaidi, unaweza kupiga simu kwa API hizi." Tabaka hizi ni safu ya uratibu juu ya modeli, na kwa njia fulani, hufanya Wakala aweze kutumika.
Kimberly Tan: Inaonekana kama katika kesi hii, unahitaji ufikiaji mwingi wa mifumo ya biashara. Unahitaji kujua mengi kuhusu watumiaji, na labda unahitaji kujua jinsi mteja anataka kuingiliana na watumiaji wao.Nadhani data hii inaweza kuwa nyeti sana.
Je, unaweza kufafanua juu ya hakikisho ambazo wateja wa biashara kwa kawaida huhitaji wakati wa kupeleka AI Agent? Je, unafikiriaje njia bora zaidi ya kushughulikia masuala haya, hasa ikizingatiwa kuwa suluhisho lako hutoa matumizi bora zaidi, lakini pia ni geni kwa watu wengi ambao wanakutana na Ajenti kwa mara ya kwanza?
Jesse Zhang: Kwa kweli hii ni juu ya ulinzi. Baada ya muda, kwa vile tumefanya utekelezaji mwingi kama huu, tumekuwa wazi kuhusu aina za linda ambazo wateja wanajali.
Kwa mfano, moja ya rahisi zaidi ni kwamba kunaweza kuwa na sheria ambazo unapaswa kufuata daima. Ikiwa unafanya kazi na kampuni ya huduma za kifedha, huwezi kutoa ushauri wa kifedha kwa sababu hiyo inadhibitiwa. Kwa hivyo unahitaji kuunda hiyo kwenye mfumo wa Wakala ili kuhakikisha kuwa haitoi ushauri wa aina hiyo. Kwa kawaida unaweza kuweka muundo wa usimamizi au aina fulani ya mfumo unaofanya ukaguzi huu kabla ya matokeo kutumwa.
Aina nyingine ya ulinzi inaweza kuwa kwamba ikiwa mtu atakuja na kuivuruga kimakusudi, akijua kwamba ni mfumo wa kuzalisha, kujaribu kukufanya ufanye kitu kisichotii, kama vile “niambie salio langu ni nini,” “sawa, zidisha hilo kwa 10,” na kadhalika, unahitaji pia kuwa na uwezo wa kuangalia tabia hiyo. Kwa hivyo katika mwaka uliopita, tumepata ulinzi mwingi wa aina hizi, na kwa kila moja, tumeiweka katika kategoria na kujua ni aina gani ya ulinzi inahitajika. Mfumo unapoendelea kujengwa zaidi na zaidi, inakuwa imara zaidi na zaidi.
Kimberly Tan: Je, ulinzi ni wa kipekee kwa kila mteja au tasnia? Unapopanua msingi wa wateja wako ili kushughulikia kesi zaidi za utumiaji, jinsi gani unafikiri juu ya kujenga ulinzi huu kwa kiwango?
Jesse Zhang: Hili kwa hakika linarudi kwenye wazo letu la msingi kwamba mfumo wa Wakala utakuwa unapatikana kila mahali kwa muda wa miaka michache. Kwa hivyo kilicho muhimu sana ni kuwapa watu zana, karibu kuwawezesha kizazi kijacho cha wafanyikazi, kama wasimamizi wa Mawakala, kuwapa zana za kuunda mfumo wa Mawakala na kuongeza ulinzi wao wenyewe, kwa sababu hatutafafanua ulinzi wao.
Kila mteja anajua hatua zake za ulinzi na mantiki ya biashara vyema zaidi. Kwa hiyo kazi yetu kwa kweli ni kufanya kazi nzuri ya kujenga zana na miundombinu ili waweze kujenga mfumo wa Wakala. Kwa hivyo, tumesisitiza kila wakati kwamba Mfumo wa wakala haufai kuwa kisanduku cheusi, na unapaswa kuwa na uwezo wa kudhibiti jinsi ya kuunda ulinzi, sheria na mantiki hizi.
Nadhani labda hiyo ndiyo kipengele chetu cha kutofautisha zaidi hadi sasa. Tumeweka juhudi nyingi katika zana hizi na kuja na njia bunifu za kuruhusu watu ambao huenda hawana usuli wa hali ya juu wa kiufundi, au hata ufahamu wa kina wa jinsi miundo ya AI inavyofanya kazi, bado waingize vitendo wanavyotaka AI itekeleze kwenye mfumo wa Ajenti.
Nadhani hiyo itakua uwezo muhimu zaidi katika miaka michache ijayo. Hiyo inapaswa kuwa mojawapo ya vigezo muhimu zaidi wakati watu wanatathmini zana zinazofanana, kwa sababu unataka kuwa na uwezo wa kuboresha na kuboresha mifumo hii kila wakati.
Mantiki ya biashara inayoendeshwa na lugha asilia
Derrick Harris: Ni maandalizi gani ambayo wateja au biashara wanaweza kufanya ili kujiandaa kwa aina yoyote ya utendakazi, na hasa matumizi ya mfumo huu wa Ajenti? Kwa mfano, wanawezaje kubuni mifumo yao ya data, usanifu wa programu au mantiki ya biashara ili kusaidia mifumo kama hii?
Kwa sababu ninahisi kwamba teknolojia nyingi za AI ni riwaya mwanzoni, lakini linapokuja suala la mifumo iliyopo ya urithi, mara nyingi hukutana na machafuko mengi.
Jesse Zhang: Ikiwa mtu anajenga kutoka mwanzo sasa, kuna mbinu nyingi bora zinazoweza kurahisisha kazi yako. Kwa mfano, jinsi ya kuunda msingi wako wa maarifa. Tumeandika kuhusu baadhi ya hizi, na kuanzisha baadhi ya mbinu ambazo zinaweza kurahisisha AI kumeza taarifa na kuboresha usahihi wake. Pendekezo moja mahususi ni kugawanya msingi wa maarifa katika sehemu za kawaida, badala ya kuwa na nakala moja kubwa yenye majibu mengi.
Wakati wa kusanidi API, unaweza kuzifanya zifae zaidi kwa mfumo wa Wakala, na kuweka ruhusa na matokeo kwa njia ambayo hurahisisha mfumo wa Wakala kumeza taarifa bila kufanya mahesabu mengi ili kupata jibu. Hizi ni baadhi ya hatua za kimbinu zinazoweza kuchukuliwa, lakini siwezi kusema kuna jambo lolote ambalo ni lazima lifanyike ili kutumia mfumo wa Wakala.
Derrick Harris: Nyaraka nzuri daima ni muhimu, kimsingi ni kuhusu kupanga habari kwa ufanisi.
Kimberly Tan: Inaonekana kama ukijaribu kuwafundisha watu jinsi ya kuelekeza mfumo wa Wakala kufanya kazi kwa njia inayofaa zaidi wateja wao au hali mahususi za utumiaji, basi majaribio mengi ya muundo wa UI na UX yanaweza kuhitajika, au utalazimika kuwasha njia mpya katika uwanja huu mpya kabisa, kwa sababu ni tofauti sana na programu za kitamaduni.
Nina hamu, unafikiriaje juu ya hili? Je, UI na UX zinapaswa kuonekana kama nini katika ulimwengu wa Wakala wa kwanza? Unafikiri itabadilikaje katika miaka michache ijayo?
Jesse Zhang: Nisingesema tumetatua tatizo hili. Nadhani huenda tumepata kiwango bora cha ndani ambacho kinawafaa wateja wetu wa sasa, lakini bado ni eneo linaloendelea la utafiti, kwetu na kwa wengine wengi.
Suala la msingi linarudi kwa kile tulichotaja hapo awali, ambayo ni kwamba una mfumo wa Wakala. Kwanza, unawezaje kuona wazi kile inachofanya na jinsi inavyofanya maamuzi? Kisha, unawezaje kutumia taarifa hii kuamua ni nini kinahitaji kusasishwa na ni maoni gani yanapaswa kutolewa kwa AI? Hapa ndipo vipengele vya UI vinapokutana, hasa sehemu ya pili.
Tunafikiri kwamba baada ya muda, UI na UX zitakuwa zenye msingi wa lugha asilia zaidi na zaidi, kwa sababu hivyo ndivyo mfumo wa Wakala unavyofikiri, au huo ndio msingi wa kufunza miundo mikubwa ya lugha (LLMs).
Kwa hali ya juu, ikiwa una wakala mwenye akili nyingi ambaye kimsingi anafikiria kama mwanadamu, unaweza kumwonyesha vitu, kuelezea mambo kwake, kutoa maoni, na itasasisha katika "akili" yake mwenyewe. Unaweza kufikiria kuwa na mtu mwenye uwezo mkubwa wa kujiunga na timu yako, unamfundisha kitu, anaanza kufanya kazi, halafu unaendelea kumpa maoni, unaweza kumuonyesha vitu vipya, hati mpya, michoro n.k.
Nadhani katika hali mbaya zaidi, itakua katika mwelekeo huu: mambo yanakuwa ya mazungumzo zaidi, yanayotegemea lugha asilia zaidi, na watu huacha kujenga mifumo yenye miti changamano ya maamuzi kama walivyokuwa wakifanya, kukamata unachotaka, lakini mbinu hii inaweza kuvunjika kwa urahisi. Hapo awali tulilazimika kufanya hivi kwa sababu hakukuwa na LLM wakati huo, lakini kwa kuwa sasa mifumo ya Mawakala inazidi kuwa na nguvu, UI na UX zitakuwa za mazungumzo zaidi.
Kimberly Tan: Takriban mwaka mmoja na nusu uliopita, wakati Dekagoni ilianza, kulikuwa na maoni ya jumla kwamba LLM ilitumika sana kwa kesi nyingi za utumiaji, lakini kwa kweli ilikuwa aina fulani tu ya "GPT wrapper," ambapo kampuni zinaweza tu kuita mfano wa msingi kupitia API na kutatua shida zao za usaidizi mara moja.
Lakini ni wazi, kampuni zinapochagua kutumia suluhisho kama Decagon badala ya kwenda chini kwa njia hiyo moja kwa moja, inabadilika kuwa sivyo. Nilikuwa nikijiuliza ikiwa unaweza kuelezea kwa nini hii ni kesi. Ni nini hasa kilifanya changamoto za ujenzi wa ndani kuwa ngumu zaidi kuliko ilivyotarajiwa? Je, walikuwa na maoni gani potofu kuhusu dhana hiyo?
Jesse Zhang: Hakuna kitu kibaya kwa kuwa "kifuniko cha GPT," unaweza kusema kwamba Purcell ni kanga ya AWS au kitu kama hicho. Kwa kawaida, watu wanapotumia neno hili, humaanisha kitu cha dharau.
Mtazamo wangu wa kibinafsi ni kwamba ikiwa unaunda mfumo wa wakala, kwa ufafanuzi hakika utakuwa ukitumia LLM kama zana. Kwa hivyo unaunda juu ya kitu ambacho tayari kipo, kama vile kawaida ungeunda kwenye AWS au GCP.
Lakini tatizo la kweli unayoweza kuingia ni ikiwa programu unayounda juu ya LLM sio "nzito" au ngumu vya kutosha kuleta mabadiliko.
Kuangalia nyuma, kwetu, kile tunachouza kimsingi ni programu. Kwa kweli sisi ni kama kampuni ya programu ya kawaida, isipokuwa kwamba tunatumia LLM kama sehemu ya programu na kama moja ya zana. Lakini watu wanaponunua aina hii ya bidhaa, wanataka programu yenyewe. Wanataka zana zinazoweza kufuatilia AI, ambazo zinaweza kuchimba kwa undani maelezo ya kila mazungumzo ambayo AI inayo, ambayo inaweza kutoa maoni, ambayo inaweza kuunda na kurekebisha mfumo kila wakati.
Kwa hivyo hiyo ndio msingi wa programu yetu. Hata kwa mfumo wa Mawakala wenyewe, tatizo ambalo watu wanalo ni kwamba ni poa kufanya onyesho, lakini ukitaka kuifanya iwe tayari kwa uzalishaji na inayowakabili wateja, lazima utatue matatizo mengi ya muda mrefu, kama vile kuzuia uzushi wa "udanganyifu" na kushughulika na watendaji wabaya wanaojaribu kusababisha uharibifu. Pia tunapaswa kuhakikisha kwamba latency ni ya chini ya kutosha, tone inafaa, na kadhalika.
Tulizungumza na timu nyingi, na walifanya majaribio, wakaunda toleo la awali, kisha wangegundua, "Loo, kwa kweli, hatutaki kuwa wao ambao tunaendelea kuunda maelezo haya katika hatua za baadaye." Pia hawakutaka kuwa wale wanaoendelea kuongeza mantiki mpya kwa timu ya huduma kwa wateja. Kwa hivyo katika hatua hii, inaonekana inafaa zaidi kuchagua kushirikiana na wengine.
Kimberly Tan: Umetaja baadhi ya masuala ya muda mrefu, kama vile hitaji la kushughulika na waigizaji wabaya, n.k.Ninaamini wasikilizaji wengi wanaozingatia kutumia AI Agent wana wasiwasi kuhusu njia mpya za mashambulizi ya usalama ambazo zinaweza kutokea baada ya LLM kuanzishwa, au hatari mpya za usalama zinazoweza kutokea baada ya kuanzishwa kwa mfumo wa Agent. Una maoni gani kuhusu masuala haya? Na ni mbinu gani bora za kuhakikisha usalama wa hali ya juu wa biashara unaposhughulika nazo Wakala?
Jesse Zhang: Katika suala la usalama, kuna hatua za wazi ambazo zinaweza kuchukuliwa, ambazo nilitaja hapo awali, kama vile hitaji la hatua za ulinzi. Suala la msingi ni kwamba wasiwasi wa watu kuhusu LLMs ni kwamba wao si wa kuamua.
Lakini habari njema ni kwamba kwa kweli unaweza kuweka shughuli nyingi nyeti na ngumu nyuma ya ukuta wa kuamua, na hesabu hufanyika hapo inapoita API. Kwa hivyo hautegemei kabisa LLM kuishughulikia, na hiyo huepuka shida nyingi za msingi.
Lakini bado kuna hali ambapo, kwa mfano, mwigizaji mbaya huingilia kati au mtu anajaribu kufanya mfumo wa hallucinate. Tumeona kuwa katika wateja wengi wakuu tunaofanya kazi nao, timu zao za usalama zitaingia na kimsingi kufanya jaribio la "timu nyekundu" kwenye bidhaa zetu, na kutumia wiki mfululizo kuzindua mashambulizi mbalimbali yanayoweza kutokea kwenye mfumo ili kujaribu kupata udhaifu. Kadiri AI Agent inavyozidi kuwa maarufu, tunaweza kuona hili likitokea mara nyingi zaidi, kwa sababu hii ni mojawapo ya njia bora za kupima kama mfumo unafaa. Ni kuirushia kitu kupitia jaribio la timu nyekundu na kuona ikiwa inaweza kuvunja safu ya ulinzi.
Pia kuna waanzishaji ambao wanatengeneza zana za timu nyekundu au kuwawezesha watu kufanya majaribio ya aina hii wenyewe, ambayo ni mtindo tunaouona hivi sasa. Kampuni nyingi tunazofanya kazi nazo, katika hatua ya baadaye katika mzunguko wa mauzo, zitakuwa na timu yao ya usalama, au kufanya kazi na timu ya nje, kupima mfumo. Kwetu sisi, kuweza kufaulu aina hizo za majaribio ni lazima. Kwa hivyo, mwishowe, ndivyo inavyokuja.
Derrick Harris: Je, hili ni jambo unalohimiza wateja wako kufanya? Kwa sababu tunapozungumza kuhusu sera za AI, tunataja kipengele muhimu, ambacho ni safu ya maombi, na tunasisitiza kuweka ya wajibu kwa watumiaji wa LLM na watu wanaoendesha programu, badala ya kulaumu tu muundo wenyewe. Hiyo ni kusema, wateja wanapaswa kufanya majaribio ya timu nyekundu, kutambua kesi maalum za utumiaji na njia za uvamizi, na kubaini ni udhaifu gani unahitaji kulindwa, badala ya kutegemea tu ulinzi wa usalama ambao tayari umeanzishwa na OpenAI au kampuni zingine.
Jesse Zhang: Nakubali kabisa. Pia ninafikiri kuwa kunaweza kuwa na wimbi jipya la mahitaji ya arifa kujitokeza, sawa na uthibitishaji wa SOC 2 na uthibitishaji wa HIPAA ambao kila mtu anafanya sasa, ambao unahitajika katika sekta tofauti. Kwa kawaida, unapouza bidhaa ya kawaida ya SaaS, wateja watahitaji majaribio ya kupenya, na lazima pia tutoe ripoti yetu ya majaribio ya kupenya. Kwa Wakala wa AI, kunaweza kuwa na mahitaji sawa katika siku zijazo, na mtu anaweza kutaja, lakini hii kimsingi ni njia mpya ya kujaribu kama mfumo wa Wakala una nguvu ya kutosha.
Kimberly Tan: Jambo moja la kufurahisha ni kwamba ni wazi kila mtu anafurahishwa sana na mafanikio ya mtindo mpya na mafanikio ya kiteknolojia ambayo yanaanzishwa na maabara zote kubwa. Kama kampuni ya AI, ni wazi haufanyi utafiti wako mwenyewe, lakini unatumia utafiti huo na kuunda programu nyingi karibu nayo ili kuwasilisha kwa mteja wa mwisho.
Lakini kazi yako inategemea teknolojia inayobadilika haraka. Ninatamani kujua, kama kampuni inayotumika ya AI, unaendeleaje na mabadiliko mapya ya kiteknolojia na kuelewa jinsi yanavyoathiri kampuni huku ukiwa na uwezo wa kutabiri ramani ya bidhaa yako mwenyewe na kuunda mahitaji ya watumiaji? Kwa upana zaidi, ni mikakati gani inapaswa kutumia kampuni za AI kupitisha katika hali sawa?
Jesse Zhang: Kwa kweli unaweza kugawanya safu nzima katika sehemu tofauti. Kwa mfano, LLM iko chini ikiwa unatazama safu ya programu. Unaweza kuwa na zana katikati zinazokusaidia kudhibiti LLM au kufanya tathmini na mambo kama hayo. Halafu, sehemu ya juu kimsingi ndio tuliyounda, ambayo kwa kweli ni kama SaaS ya kawaida.
Kwa hivyo, kazi zetu nyingi kwa kweli sio tofauti na programu za kawaida, isipokuwa kwamba tuna sehemu ya ziada ya utafiti - LLM hubadilika haraka sana. Tunahitaji kutafiti kile wanachoweza kufanya, wanachoweza kufanya, na ni kielelezo gani kinapaswa kutumiwa kutekeleza kazi fulani. Hili ni suala kubwa kwa sababu OpenAI na Anthropic zote zinazindua teknolojia mpya, na Gemini pia inaboresha hatua kwa hatua.
Kwa hiyo, inabidi uwe na utaratibu wako wa tathmini ili kuelewa ni modeli gani inayofaa kutumika katika hali gani. Wakati mwingine unahitaji pia kurekebisha vizuri, lakini swali ni: wakati wa kurekebisha vizuri? Ni wakati gani kurekebisha vizuri kunafaa? Labda haya ndio maswala kuu ya utafiti yanayohusiana na LLMs ambayo tunaangazia. Lakini angalau hadi sasa, hatuhisi kuwa SaaS inabadilika haraka, kwa sababu hatutegemei safu ya kati. Kwa hivyo kimsingi, ni LLM ambazo zinabadilika. Hazibadiliki mara kwa mara, na zinapobadilika, huwa ni uboreshaji. Kwa mfano, Claude 3.5 sonnet ilisasishwa miezi michache iliyopita, na wakati huo tulifikiri, "Sawa, je, tunapaswa kubadili mtindo mpya badala ya kuendelea kutumia wa zamani?"
Tunahitaji tu kutekeleza mfululizo wa tathmini, na mara tu tunapobadilisha mtindo mpya, hatufikirii juu yake tena kwa sababu tayari unatumia mtindo mpya. Kisha, toleo la o1 lilitoka, na hali ilikuwa sawa. Fikiria juu ya wapi inaweza kutumika. Kwa upande wetu, o1 ni ya polepole kwa matukio mengi ya utumiaji yanayowakabili wateja, kwa hivyo tunaweza kuitumia kwa kazi fulani ya usuli. Hatimaye, tunahitaji tu kuwa na mfumo mzuri wa utafiti wa mfano.
Kimberly Tan: Ni mara ngapi unatathmini mtindo mpya na kuamua kuubadilisha?
Jesse Zhang: Tunatathmini kila wakati mtindo mpya unapotoka. Lazima uhakikishe kuwa ingawa mtindo mpya ni mzuri zaidi, hauvunji baadhi ya kesi za utumiaji ambazo tayari umeunda. Hili linaweza kutokea. Kwa mfano, muundo mpya unaweza kuwa nadhifu kwa jumla, lakini katika hali mbaya zaidi, haufanyi kazi vibaya kwenye chaguo la A/B katika mojawapo ya utendakazi wako. Hiyo ndiyo tunayotathmini.
Nadhani kwa ujumla, aina ya akili tunayojali zaidi ni ile ambayo ningeiita "uwezo wa kufuata maagizo." Tunataka mtindo kuwa bora na bora kwa kufuata maagizo. Ikiwa ndivyo, basi hakika ni faida kwetu, na hiyo ni nzuri sana.
Inaonekana kwamba utafiti wa hivi majuzi umezingatia zaidi aina ya akili inayohusisha hoja, kama vile upangaji programu na uendeshaji bora wa hisabati. Hii pia inatusaidia, lakini sio muhimu kama uboreshaji wa uwezo wa kufuata maagizo.
Kimberly Tan: Hoja moja ya kufurahisha sana uliyotaja, na nadhani pia ni ya kipekee sana kwa Decagon, ni kwamba umeunda miundombinu mingi ya tathmini ndani ya nyumba ili kuhakikisha unajua jinsi kila modeli inavyofanya kazi chini ya seti ya majaribio unayotoa.
Unaweza kufafanua juu ya hili? Je, miundombinu hii ya tathmini ya ndani ina umuhimu gani, na inakupaje wewe na wateja wako imani katika utendakazi wa Wakala? Kwa sababu baadhi ya tathmini hizi pia zinawakabili wateja.
Jesse Zhang: Nadhani ni muhimu sana, kwa sababu bila miundombinu hii ya tathmini, itakuwa ngumu sana kwetu kurudia haraka.
Ikiwa unahisi kuwa kila mabadiliko yana uwezekano mkubwa wa kuvunja kitu, basi hutafanya mabadiliko haraka. Lakini ikiwa una utaratibu wa tathmini, basi wakati kuna mabadiliko makubwa, sasisho la mfano, au kitu kipya kinakuja, unaweza kulinganisha moja kwa moja na vipimo vyote vya tathmini. Ikiwa matokeo ya tathmini ni mazuri, unaweza kuhisi: sawa, tumefanya uboreshaji, au unaweza kuitoa kwa ujasiri bila kuwa na wasiwasi sana.
Kwa hivyo, katika uwanja wetu, tathmini inahitaji maoni kutoka kwa mteja, kwa sababu mteja ndiye anayeamua kama kitu ni sahihi au la. Bila shaka, tunaweza kuangalia baadhi ya masuala ya kiwango cha juu, lakini kwa kawaida mteja hutoa kesi maalum za utumiaji na hutuambia jibu sahihi ni lipi, au linapaswa kuwa nini, ni sauti gani anapaswa kudumisha, kile anachopaswa kusema.
Tathmini inategemea hii. Kwa hivyo tunapaswa kuhakikisha kuwa mfumo wetu wa tathmini ni thabiti vya kutosha. Hapo awali, tuliijenga sisi wenyewe, na sio ngumu sana kuitunza. Pia tunajua kwamba kuna baadhi ya makampuni ya tathmini, na tumechunguza baadhi yao. Labda wakati fulani, tutazingatia ikiwa tutazipitisha, lakini kwa sasa, mfumo wa tathmini sio maumivu tena kwetu.
Kimberly Tan: Mada maarufu sana leo ni multimodality, kumaanisha kwamba mawakala wa AI wanapaswa kuwa na uwezo wa kuingiliana katika aina zote ambazo wanadamu hutumia leo, iwe maandishi, video, sauti, nk. Ninajua kuwa Decagon ilianza kama maandishi. Kwa mtazamo wako, jinsi muhimu ni multimodality kwa mawakala wa AI? Je, unafikiri ni muda gani wa kuwa wa kawaida au hata kiwango?
Jesse Zhang: Ni muhimu, na kwa mtazamo wa kampuni, sio ngumu sana kuongeza muundo mpya. Sio rahisi, lakini msingi ni: ikiwa utatatua shida zingine, kama hizo nilizotaja - kwa mfano, kujenga AI, kuifuatilia na kuwa na mantiki sahihi - basi kuongeza njia mpya sio jambo gumu zaidi kufanya. Kwa hivyo kwetu, kuwa na njia zote kunaleta maana sana, na inapanua soko letu. Kimsingi sisi ni waamini wa hali ya juu, na tunaunda Wakala wetu kwa kila aina.
Kwa ujumla, kuna sababu mbili za kuzuia: kwanza, mteja yuko tayari kupitisha njia mpya? Nadhani inaleta maana sana kuanza na maandishi, kwa sababu hiyo ndiyo njia ambayo watu huitumia kikamilifu, na haina hatari kwao, ni rahisi kufuatilia, na rahisi kuelewa. Njia nyingine kubwa ni sauti. Ni wazi, nadhani bado kuna nafasi kwenye soko, na kukubalika kwa sauti kwa mtumiaji bado kunahitaji kuboreshwa. Kwa sasa, tunaona baadhi ya watumiaji wa mapema ambao wameanza kutumia Mawakala wa sauti, jambo ambalo linasisimua sana. Kipengele kingine ni changamoto za kiufundi. Watu wengi watakubali kwamba upau umewekwa juu zaidi kwa sauti. Ikiwa unazungumza na mtu kwenye simu, unahitaji utulivu wa sauti mfupi sana. Ukimkatiza mtu, anahitaji kujibu kawaida.
Kwa sababu ucheleweshaji wa usemi uko chini, lazima uwe na busara zaidi katika kuhesabu. Iwapo uko kwenye gumzo na muda wa kujibu ni sekunde tano hadi nane, hutambui na inahisi kawaida sana. Lakini ikiwa inachukua sekunde tano hadi nane kujibu kwenye simu, inahisi kuwa si ya kawaida. Kwa hivyo kuna changamoto zaidi za kiufundi na hotuba. Changamoto hizi za kiufundi zinapotatuliwa na nia ya kukubali matamshi kuongezeka sokoni, hotuba kama njia mpya itakuwa ya kawaida.
Mtindo wa biashara unaoruka juu ya uaminifu
Kimberly Tan: Kabla hatujaendelea, ningependa kuzungumza zaidi kuhusu mtindo wa biashara wa AI Agent. Wakati wewe kwanza kujengwa Wakala wa AI au ulijadiliana na wateja mfumo wanaotumia, data wanayochakata, na wasiwasi wao, je, kuna jambo lolote lililokushangaza? Je, ni baadhi ya mambo gani yasiyo ya angavu au ya kustaajabisha ambayo Dekagoni ilipaswa kufanya ili kuwahudumia vyema wateja wa biashara?
Jesse Zhang: Nadhani jambo la kushangaza zaidi lilikuwa ni kwa kiwango gani watu walikuwa tayari kuzungumza nasi tulipoanza. Baada ya yote, tulikuwa wawili tu. Sote wawili tulikuwa tumeanzisha kampuni hapo awali, kwa hivyo tulijua watu wengi, lakini hata hivyo, kwa kila mfanyabiashara, unapotaka mazungumzo ya rufaa yaende, ikiwa unachosema sio cha kulazimisha, mazungumzo kawaida huwa ya uvuguvugu.
Lakini tulipoanza kuzungumza juu ya kesi hii ya utumiaji, kwa kweli niliona inashangaza jinsi watu walivyofurahi kuizungumza. Kwa sababu wazo linaonekana wazi sana. Unaweza kufikiri kwamba kwa kuwa ni wazo la wazi, lazima mtu mwingine awe tayari amefanya, au lazima tayari kuna suluhu, au lazima mtu mwingine awe tayari amekuja na aina fulani ya ufumbuzi. Lakini nadhani tulishika wakati mzuri, kesi hiyo ya utumiaji ni kubwa sana na watu wanaijali sana. Kama nilivyotaja hapo awali, kesi hiyo ya utumiaji inafaa kabisa kwa kuchukua Wakala wa AI na kuisukuma katika uzalishaji, kwa sababu unaweza kuitekeleza kwa kuongezeka na kuweza kufuatilia ROI.
Huo ulikuwa mshangao mzuri kwangu, lakini ni wazi kuna kazi nyingi ya kufanywa baada ya hapo, lazima ufanye kazi na wateja, lazima utengeneze bidhaa, lazima ujue ni njia gani ya kwenda. Katika hatua ya awali, ilikuwa ugunduzi wa kushangaza.
Derrick Harris: Kimberly, nahisi ningetaja chapisho la blogu uliloandika, RIP kwa RPA, ambalo linagusa mambo mengi. ya kazi za otomatiki na kuanza.Je, unafikiri kuna jambo ambalo kazi hizi za kiotomatiki, au suluhu, si bora sana, kwa hivyo watu daima wanatafuta njia bora zaidi?
Kimberly Tan: Ndiyo, nadhani hivyo. Ningependa kusema mambo machache. Kwanza, ikiwa wazo ni dhahiri kwa kila mtu, lakini hakuna kampuni wazi ya kulitatua, au hakuna mtu anayeonyesha kampuni na kusema, "Unapaswa kutumia hii," basi inamaanisha kwamba tatizo halijatatuliwa.
Kwa maana, ni fursa wazi kabisa kwa kampuni kutengeneza suluhisho. Kwa sababu, kama ulivyosema, tumekuwa tukimfuata Decagon kama mwekezaji tangu mwanzo. Tumewatazama wakipitia njia ya ubunifu, na walipoamua kwenda upande huu na kuanza kuzungumza na wateja, ikawa wazi kuwa wateja wote walikuwa na hamu ya aina fulani ya suluhisho asilia linalowezeshwa na AI. Hili ni moja wapo ya shida niliyotaja hapo awali, ambapo watu wengi hufikiria kuwa ni kanga ya GPT. Lakini maslahi ya mteja ambayo Decagon imepokea tangu mwanzo yametufanya tutambue mapema kwamba masuala mengi haya ni magumu zaidi kuliko watu wanavyotarajia.
Nadhani jambo hili linatokea katika sekta zote, iwe ni huduma kwa wateja au otomatiki kitaaluma katika wima fulani. Nadhani mojawapo ya pointi zilizopunguzwa ni, kama Jesse alivyotaja hapo awali, kuwa na uwezo wa kupima kwa uwazi mapato ya uwekezaji (ROI) ya kazi za otomatiki. Kwa sababu, ikiwa utamfanya mtu akubali wakala wa AI, kwa hakika anachukua kiwango cha "mrukaji wa imani" kwa sababu ni eneo lisilojulikana sana kwa watu wengi.
Iwapo unaweza kubadilisha mchakato mahususi kiotomatiki ambao ni mchakato dhahiri wa kuzalisha mapato, au mchakato ambao hapo awali ulikuwa kizuizi katika biashara, au kituo kikuu cha gharama ambacho huongezeka kulingana na ukuaji wa mteja au ukuaji wa mapato, basi itakuwa rahisi kupata kibali kwa Wakala wa AI. Uwezo wa kugeuza shida kama hizi kuwa mchakato wa uzalishaji zaidi ambao unaweza kupunguzwa kama programu ya kitamaduni unavutia sana.
Kimberly Tan: Nina swali la mwisho kabla hatujaendelea. Ninamkumbuka Jesse, katika mijadala yetu ya awali, akisema kila mara kuwa changamoto kubwa kwa kampuni zinazotumia programu au Mawakala wa AI itakuwa maono. Lakini uliwahi kuniambia kuwa hii sio shida kuu. Je, unaweza kufafanua kwa nini mtazamo wa maonyesho ya ndoto ni potofu kwa kiasi fulani na kile ambacho watu wanajali zaidi?
Jesse Zhang: Nadhani watu wanajali kuhusu maonyesho, lakini wanajali zaidi juu ya thamani wanayoweza kutoa. Takriban makampuni yote tunayofanya kazi nayo yanazingatia masuala machache sawa, karibu sawa: ni asilimia ngapi ya mazungumzo unaweza kutatua? Je, wateja wangu wameridhika kwa kiasi gani? Kisha suala la kuona ndoto linaweza kuainishwa kama kategoria ya tatu, yaani jinsi lilivyo sahihi. Kwa ujumla, mambo mawili ya kwanza ni muhimu zaidi wakati wa kutathmini.
Wacha tuseme unazungumza na biashara mpya na umefanya kazi nzuri sana kwa mambo mawili ya kwanza, na umepata usaidizi mkubwa kutoka kwa uongozi na kila mtu kwenye timu. Wao ni kama, “Ee Mungu wangu, uzoefu wetu kwa wateja ni tofauti. Kila mteja sasa ana msaidizi wake binafsi ambaye anaweza kuwasiliana nasi wakati wowote. Tumewapa majibu mazuri, wameridhika sana, na ni ya lugha nyingi na inapatikana 24/7.” Hiyo ni sehemu yake tu, na pia umeokoa pesa nyingi.
Kwa hivyo mara tu unapofikia malengo hayo, unapata usaidizi mkubwa na mikia mingi ya kuendesha kazi. Kwa kweli, suala la udanganyifu hatimaye linahitaji kutatuliwa, lakini sio jambo ambalo wanajali sana. Njia ya kutatua udanganyifu ni njia ile ile niliyotaja kabla - watu watakujaribu. Kunaweza kuwa na awamu ya uthibitisho wa dhana ambapo unaendesha mazungumzo halisi na wana timu wanaofuatilia na kuangalia usahihi. Ikiwa hiyo inakwenda vizuri, basi kawaida hupitia.
Pia, kama nilivyotaja hapo awali, unaweza kuweka baadhi ya hatua kali za ulinzi kwa taarifa nyeti, kama vile huhitaji kufanya maudhui nyeti kuwa ya jumla. Kwa hivyo suala la udanganyifu ni hoja ya majadiliano katika shughuli nyingi. Sio mada isiyo muhimu. Utapitia mchakato huu, lakini kamwe sio lengo la mazungumzo.
Kimberly Tan: Sasa hebu tuendelee kwenye mtindo wa biashara wa AI Agent. Leo, kuna mada kubwa kuhusu jinsi ya kupanga bei ya Wakala hawa wa AI.
Kihistoria, programu nyingi za SaaS huwekwa bei kulingana na idadi ya viti kwa sababu ni programu ya mtiririko wa kazi ambayo inalenga wafanyikazi binafsi na hutumiwa kuboresha tija ya wafanyikazi. Walakini, Wakala wa AI hajaunganishwa na tija ya wafanyikazi binafsi kama programu ya kitamaduni.
Kwa hivyo watu wengi wanafikiri kuwa mbinu ya kuweka bei kulingana na idadi ya viti inaweza kuwa haitumiki tena. Nina hamu ya kujua jinsi gani ulifikiria juu ya shida hii katika siku za kwanza na jinsi ulivyoamua kuweka bei ya Dekagoni. Pia, unadhani nini kitakuwa mwelekeo wa siku zijazo wa bei ya programu kwani Wakala wa AI unakuwa wa kawaida zaidi na zaidi?
Jesse Zhang: Mtazamo wetu juu ya suala hili ni kwamba hapo awali, programu iliwekwa bei kwa kila kiti kwa sababu kiwango chake kilitegemea idadi ya watu ambao wangeweza kutumia programu. Lakini kwa Mawakala wengi wa AI, thamani unayotoa haitegemei idadi ya watu wanaoitunza, lakini badala ya kiasi cha kazi inayozalishwa. Hii ni sawa na hatua niliyotaja hapo awali: ikiwa kurudi kwa uwekezaji (ROI) ni kipimo sana, basi kiwango cha pato la kazi pia ni wazi sana.
Maoni yetu ni kwamba bei kwa idadi ya viti hakika haitumiki. Unaweza bei kulingana na matokeo ya kazi. Kwa hivyo, mtindo wa bei unaotoa unapaswa kuwa kwamba kazi zaidi inafanywa, ndivyo unavyolipa zaidi.
Kwa sisi, kuna njia mbili za wazi za bei. Unaweza ama mazungumzo ya bei, au unaweza bei ya mazungumzo ambayo AI kweli hutatua. Nadhani moja ya somo la kupendeza tulilojifunza ni kwamba watu wengi walichagua mtindo wa bei ya mazungumzo. Sababu ni kwamba faida kuu ya bei kwa suluhisho ni kwamba unalipa kwa nini ya AI hufanya.
Lakini swali linalofuata ni, ni nini kinachukuliwa kuwa "suluhisho"? Kwanza kabisa, hakuna mtu anataka kuingia katika hili kwa kina, kwa sababu inakuwa, "Ikiwa mtu atakuja kwa hasira na ukamfukuza, kwa nini tulipe?"
Hili huzua hali ya kutatanisha na pia hufanya motisha kwa watoa huduma wa AI kuwa ya kushangaza kidogo, kwa sababu malipo kwa njia ya suluhisho inamaanisha, "Tunahitaji tu kutatua mazungumzo mengi iwezekanavyo na kuwasukuma watu wengine." Lakini kuna hali nyingi ambapo ni bora kuongeza suala badala ya kulisukuma tu, na wateja hawapendi aina hii ya kushughulikia. Kwa hivyo, malipo kwa mazungumzo yataleta urahisi zaidi na kutabirika.
Kimberly Tan: Unafikiri mtindo wa bei wa siku zijazo utadumu kwa muda gani?Kwa sababu sasa hivi unapotaja ROI, kwa kawaida inategemea matumizi ya zamani ambayo huenda yalitumika kulipia gharama za kazi. Kadiri Mawakala wa AI wanavyozidi kuwa wa kawaida, unafikiri kwamba katika muda mrefu, AI italinganishwa na gharama za kazi na kwamba hiki ni kigezo kinachofaa? Ikiwa sivyo, unaonaje bei ya muda mrefu zaidi ya gharama za wafanyikazi?
Jesse Zhang: Nadhani baada ya muda mrefu, bei ya AI Agent bado inaweza kuhusishwa na gharama za wafanyikazi, kwa sababu huo ndio uzuri wa Wakala - matumizi yako ya awali kwenye huduma sasa yanaweza kuhamishiwa kwenye programu.
Sehemu hii ya matumizi inaweza kuwa mara 10 hadi 100 ya matumizi ya programu, kwa hivyo gharama nyingi zitahamia programu. Kwa hivyo, gharama za wafanyikazi zitakuwa kawaida kuwa kipimo. Kwa wateja wetu, ROI ni wazi sana. Ikiwa unaweza kuokoa milioni X katika gharama za kazi, basi ni mantiki kupitisha suluhisho hili. Lakini kwa muda mrefu, hii inaweza kuwa katikati.
Kwa sababu hata bidhaa zingine ambazo sio nzuri kama Wakala wetu atakubali bei ya chini. Hii ni kama hali ya kawaida ya SaaS, ambapo kila mtu anashindania sehemu ya soko.
Kimberly Tan: Unafikiria nini mustakabali wa kampuni za sasa za SaaS, haswa zile ambazo bidhaa zao zinaweza kuwa hazijatengenezwa kwa AI asili au ambazo zinauzwa kwa kila kiti na kwa hivyo haziwezi kuendana na muundo wa bei unaozingatia matokeo?
Jesse Zhang: Kwa kampuni zingine za kitamaduni, kwa kweli ni gumu kidogo ikiwa watajaribu kuzindua bidhaa ya AI Agent kwa sababu hawawezi kuiweka bei kwa kutumia mfano wa kiti. Iwapo huhitaji tena Mawakala wengi, ni vigumu kudumisha mapato na bidhaa iliyopo. Hili ni tatizo kwa makampuni ya jadi, lakini ni vigumu kusema. Makampuni ya jadi daima yana faida ya njia za usambazaji. Hata kama bidhaa si nzuri kama kampuni mpya, watu wanasitasita kutumia juhudi kukubali mtoa huduma mpya aliye na ubora wa 80% pekee.
Kwa hivyo, kwanza, ikiwa wewe ni mwanzilishi kama sisi, lazima uhakikishe kuwa bidhaa yako ni bora mara tatu kuliko ile ya jadi. Pili, hii ni ushindani wa kawaida kati ya makampuni ya jadi na startups. Kampuni za kitamaduni kawaida huwa na uvumilivu mdogo wa hatari kwa sababu zina idadi kubwa ya wateja. Ikiwa watafanya makosa kwa kurudia haraka, itasababisha hasara kubwa. Walakini, wanaoanza wanaweza kurudia haraka, kwa hivyo mchakato wa kurudia yenyewe unaweza kusababisha bidhaa bora. Huu ni mzunguko wa kawaida. Kwetu, tumekuwa tukijivunia kasi yetu ya utoaji, ubora wa bidhaa na utekelezaji wa timu yetu. Ndiyo maana tumeshinda mkataba wa sasa.
Kimberly Tan: Je, unaweza kufanya utabiri kuhusu mustakabali wa AI mahali pa kazi? Kwa mfano, itabadilishaje mahitaji au uwezo wa mfanyakazi, au jinsi wafanyakazi wa kibinadamu na Wakala wa AI wanavyoingiliana?Je, ni mazoea au kanuni zipi mpya bora unafikiri zitakuwa kawaida mahali pa kazi huku Mawakala wa AI wanavyozidi kuenea?
Jesse Zhang: Mabadiliko ya kwanza na muhimu zaidi ni kwamba tuna hakika kwamba katika siku zijazo, wafanyakazi watatumia muda mwingi zaidi katika ujenzi wa mahali pa kazi na kusimamia Mawakala wa AI, sawa na jukumu la wasimamizi wa AI. Hata kama nafasi yako si rasmi "msimamizi wa AI," muda mwingi uliotumia kufanya kazi yako utahamishiwa kwa kuwasimamia Mawakala hawa, kwa sababu Mawakala wanaweza kukupa nguvu nyingi.
Tumeona hili katika kupelekwa nyingi ambapo watu waliokuwa viongozi wa timu sasa wanatumia muda mwingi kufuatilia AI, kwa mfano, ili kuhakikisha kuwa haina matatizo au kufanya marekebisho. Wanafuatilia utendaji wa jumla ili kuona kama kuna maeneo mahususi ambayo yanahitaji kuzingatiwa, ikiwa kuna mapungufu katika msingi wa maarifa ambayo yanaweza kusaidia AI kuwa bora, na kama AI inaweza kujaza mapengo hayo.
Kazi inayokuja na kufanya kazi na Wakala inatoa hisia kwamba katika siku zijazo, wafanyakazi watatumia kiasi kikubwa cha muda kuingiliana na Mawakala wa AI. Hii ni dhana ya msingi ya kampuni yetu, kama nilivyosema hapo awali. Kwa hivyo, bidhaa zetu zote zimejengwa kwa kuwapa watu zana, taswira, ufasiri na udhibiti. Nadhani ndani ya mwaka mmoja, hii itakuwa mwenendo mkubwa.
Kimberly Tan: Hiyo inaeleweka sana. Je, unadhani wasimamizi wa AI watahitaji uwezo gani katika siku zijazo? Ni ujuzi gani uliowekwa kwa jukumu hili?
Jesse Zhang: Kuna vipengele viwili. Moja ni uchunguzi na tafsiri, uwezo wa kuelewa haraka kile AI inafanya na jinsi inavyofanya maamuzi. Nyingine ni uwezo wa kufanya maamuzi, au sehemu ya jengo, jinsi ya kutoa maoni na jinsi ya kujenga mantiki mpya. Nadhani hizi mbili ni pande mbili za sarafu moja.
Kimberly Tan: Ni kazi gani unafikiri zitasalia nje ya uwezo wa wakala wa AI katika muda wa kati au mrefu na bado zitahitaji kusimamiwa na kutekelezwa kwa usahihi na wanadamu?
Jesse Zhang: Nadhani itategemea hasa hitaji la "ukamilifu" ambalo nilitaja hapo awali. Kuna kazi nyingi ambazo zina uvumilivu mdogo sana wa makosa. Katika hali hizi, zana yoyote ya AI ni msaada zaidi kuliko wakala kamili.
Kwa mfano, katika tasnia nyeti zaidi, kama vile huduma ya afya au usalama, ambapo lazima uwe mkamilifu, basi katika maeneo haya, Mawakala wa AI wanaweza kuwa na uhuru mdogo, lakini hiyo haimaanishi kuwa hawana maana. Nadhani mtindo utakuwa tofauti, katika jukwaa kama letu, unawatumia Mawakala hawa ili kuwaruhusu wafanye kazi nzima kiotomatiki.
Derrick Harris: Na hiyo ni yote kwa kipindi hiki. Iwapo umepata mada hii ya kufurahisha au ya kutia moyo, tafadhali kadiria podikasti yetu na uishiriki na watu zaidi.Tunatarajia kutoa kipindi cha mwisho kabla ya mwisho wa mwaka na tutatayarisha upya maudhui ya mwaka mpya. Asante kwa kusikiliza na kuwa na msimu mzuri wa likizo (ikiwa unasikiliza wakati wa likizo).
Video asilia: Je, Mawakala wa Al hatimaye wanaweza Kurekebisha Usaidizi wa Wateja?