GPTs大受歡迎但問題多,企服軟件廠商的AI Agent更被B端客戶器重
比爾蓋茨預(yù)言智能體是下個(gè)平臺(tái),超自動(dòng)化平臺(tái)的AI Agent更靠譜?
以GPTs為代表的AI Agent只是玩具?揭秘真實(shí)可用AI智能體長什么樣
講概念談愿景AI Agent名不副實(shí)?看實(shí)在智能RPA 智能體如何商用落地
AI Agent應(yīng)用落地前半場(chǎng),屬于企服軟件廠商推出的平臺(tái)級(jí)AI智能體
文/王吉偉
OpenAI在首屆開發(fā)者大會(huì)上推出了GPTs和Assitant API,不僅改寫了AI Agent的構(gòu)建范式,也把AI智能體的應(yīng)用推向一個(gè)新高潮。
GPTs和GPT商店,使得用戶無需編碼通過自然語言就能創(chuàng)建并擁有多個(gè)專屬私人助理,且可以如在蘋果應(yīng)用商店一樣在GPT商店出售和購買這些專屬助理。
這意味著,人人都能構(gòu)建Agent的時(shí)代已然到來,Agent無處不在的序幕也已拉開。
OpenAI開發(fā)者大會(huì)之后,幾個(gè)月前曾把生成式AI比作“圖形用戶界面(GUI)一般爆炸性技術(shù)革命”的比爾蓋茨,再次發(fā)表長文表達(dá)其對(duì)AI Agent的看法。
他認(rèn)為,智能體不僅會(huì)改變?nèi)伺c計(jì)算機(jī)交互的方式,還將顛覆軟件行業(yè),帶來自人類從鍵入命令到點(diǎn)擊圖標(biāo)以來最大的計(jì)算革命,智能體會(huì)成為繼Android、iOS和Windows等之后的下一個(gè)平臺(tái)。
有了行業(yè)大佬的背書,AI Agent的火爆程度再度躍升一個(gè)量級(jí)。即便目前99%的GPTs都在裸奔,兩句話就能套走GPTs數(shù)據(jù)庫,也阻擋不住人們開發(fā)與分享GPTs的熱情。比如某第三方GPT Store顯示的GPTs數(shù)量,已經(jīng)多達(dá)1.3W+。
AI Agent大勢(shì)所趨,已經(jīng)成為LLM落地應(yīng)用的主要途徑。借著GPTs的火和比爾蓋茨的風(fēng),很多LLM研發(fā)與應(yīng)用廠商都打出了Agent的牌。反正早晚都要實(shí)現(xiàn)通用人工智能AGI,不管是概念階段還是應(yīng)用起步,先一步主打Agent必然沒錯(cuò)。
概念化陳述的AI Agent與實(shí)體化應(yīng)用的AI Agent,自然存在很大差距。隨著類似信息越來越多,大眾也就無感,以致于目前大部分人認(rèn)為AI Agent十之八九名不副實(shí),僅是玩具一般的存在。
AI Agent只是玩具?
AI Agent是不是玩具,取決于從哪個(gè)角度看。
個(gè)人使用它自動(dòng)購買機(jī)票、訂披薩、寫總結(jié)、收發(fā)郵件,看起來已經(jīng)是不錯(cuò)的生產(chǎn)力工具。比如使用GPTs通過Zapier的海量API連接更多商業(yè)應(yīng)用,可以在很多業(yè)務(wù)場(chǎng)景中使用。
但現(xiàn)在市面上大多Agent,包括OpenAI推出的GPTs,不過就是構(gòu)建了一個(gè)基于某知識(shí)庫或者專業(yè)數(shù)據(jù)的Chatbot。使用這些智能體進(jìn)行問答交互,比如獲取行業(yè)資訊、報(bào)告等,都可以做到對(duì)答如流。
但在程序聯(lián)動(dòng)與操作方面還有很大差距,至少現(xiàn)在還無法用GPTs直接操作SAP或者金蝶等ERP系統(tǒng),因?yàn)槠渲猩婕暗搅薃PI的應(yīng)用、授權(quán)、維護(hù)以及無API管理軟件的連接問題。
對(duì)于廣大企業(yè)而言,如果GPTs等AI智能體只能用于知識(shí)問答,確實(shí)像一個(gè)玩具,因?yàn)樗€無法深入到企業(yè)運(yùn)營的業(yè)務(wù)流程中去。
所以,無論現(xiàn)在對(duì)AI Agent的討論多么熱烈,不管2W+的GPTs和大量第三方Agents展現(xiàn)的應(yīng)用場(chǎng)景有多豐富,它們?nèi)运闶茿gent的初級(jí)應(yīng)用,尚無法深度參與及影響廣大組織的業(yè)務(wù)經(jīng)營。
當(dāng)然其中的因素是多樣且復(fù)雜的,比如LLM能力、Agent架構(gòu)、Prompt精確性、數(shù)據(jù)集大小、知識(shí)庫豐富程度等,都能影響Agent能力的體現(xiàn)。
這種情況下,當(dāng)前大家所提到的AI Agent大部分都停留在idea階段,成熟產(chǎn)品很少。
還有重要的一點(diǎn),隨著Agent的構(gòu)建越發(fā)簡單,Agent生態(tài)的成熟會(huì)讓C端Agent出現(xiàn)百花齊放的局面,應(yīng)用價(jià)值方面也隨邊際效應(yīng)而無限趨向于更小量級(jí)。
由此AI Agent更大的價(jià)值,最終還是要落到B端的商業(yè)落地與量級(jí)應(yīng)用。
這,也就是比爾蓋茨所言的智能體的平臺(tái)價(jià)值。
Agent平臺(tái)的價(jià)值
比爾蓋茨認(rèn)為,智能體作為下一個(gè)平臺(tái),將會(huì)影響人們使用軟件的方式以及軟件的編寫方式。它更擅長查找信息并為用戶總結(jié)信息,能夠會(huì)為用戶找到最優(yōu)惠的價(jià)格,將取代搜索網(wǎng)站及電商網(wǎng)站,也將取代文字處理器、電子表格和其它生產(chǎn)力應(yīng)用程序。
并且,現(xiàn)在各自獨(dú)立的搜索廣告、廣告社交網(wǎng)絡(luò)、購物、生產(chǎn)力軟件等,都將變成智能體這一項(xiàng)業(yè)務(wù)。
Agent會(huì)徹底改變應(yīng)用軟件的打開方式,這一點(diǎn)毋庸置疑。
而相對(duì)于Agent帶來的影響,如何構(gòu)建Agent以及由什么樣的Agent平臺(tái)去構(gòu)建能力足夠強(qiáng)勁的Agent,是大家更為關(guān)注的,也是更需要探討的問題。
在這方面,OpenAI已經(jīng)率先用GPTs以及GPT Builder為業(yè)界打了一個(gè)樣。
即AI Agent平臺(tái)本身就是AI智能體,也是智能體構(gòu)建平臺(tái),還是Agent分發(fā)平臺(tái)。為了讓人們更方便的構(gòu)建與應(yīng)用各種Agent,它會(huì)基于構(gòu)建-應(yīng)用-分享-反饋的應(yīng)用路徑發(fā)展,并且Agent的架構(gòu)邏輯與思維也會(huì)用于支持平臺(tái)的整體運(yùn)營。
平臺(tái)屬性意味著它不只用于構(gòu)建和分發(fā)Agent,更重要的是能夠?yàn)橛脩籼峁┌ò踩?、運(yùn)營、維護(hù)等在內(nèi)的交付能力。不僅需要內(nèi)置為用戶構(gòu)建智能體所需要的各種插件和組件,還需要能夠在智能體構(gòu)建過程中隨時(shí)給予用戶反饋以保證項(xiàng)目成功。
這幾點(diǎn),對(duì)于B端用戶尤其重要。
像最近GPTs推出后OpenAI出現(xiàn)的各種安全問題,首先在數(shù)據(jù)安全上就過不了企業(yè)用戶的關(guān),不是私有化部署的用戶可能都不敢構(gòu)建GPTs,更不用說對(duì)外分享。
從業(yè)務(wù)流程角度來看,Agent的應(yīng)用是在LLM的基礎(chǔ)上進(jìn)一步實(shí)現(xiàn)的業(yè)務(wù)流程自動(dòng)化。而目前包括GPTs在內(nèi)的各種AI智能體表現(xiàn)來看,普遍存在兩種情況:
一是安全系數(shù)不過關(guān),頻頻出現(xiàn)的數(shù)據(jù)泄露問題讓廣大組織望而生畏,而中小企業(yè)又沒有能力私有化部署LLM;
二是Agent所帶來的流程自動(dòng)化仍停留于粗淺層面,尚無法為企業(yè)內(nèi)部動(dòng)輒幾十上百種的業(yè)務(wù)系統(tǒng)提供業(yè)務(wù)流支持。
所以,AI Agent想要真正在B端實(shí)現(xiàn)大量業(yè)務(wù)場(chǎng)景的落地商用,需要綜合考量其本身的安全性、技術(shù)發(fā)展周期是否成熟以及To B端的場(chǎng)景是否密切貼合等。
說到這里有人可能會(huì)問,連GPTs都存在那么多問題,現(xiàn)階段企業(yè)想要應(yīng)用AI智能體,就沒有合適的解決方案嗎?
當(dāng)然有,下面我就會(huì)講到。
企業(yè)級(jí)AI智能體平臺(tái)
在講述企業(yè)級(jí)AI智能體平臺(tái)之前,我們先來看一個(gè)真實(shí)應(yīng)用案例。
這是一個(gè)使用RPA智能體自動(dòng)構(gòu)建「從招行網(wǎng)銀客戶端下載交易數(shù)據(jù)(敏感信息打碼)」自動(dòng)化流程的應(yīng)用案例,可以看到要構(gòu)建這樣一個(gè)自動(dòng)化流程,只需在TARS大模型對(duì)話框輸入“打開客戶端,查詢默認(rèn)賬號(hào)幾年的交易數(shù)據(jù),并下載導(dǎo)出”,TARS就能自動(dòng)創(chuàng)建執(zhí)行計(jì)劃,點(diǎn)擊執(zhí)行它就能按照?qǐng)?zhí)行計(jì)劃一步步去執(zhí)行,等它執(zhí)行完以后,一個(gè)可以復(fù)用的自動(dòng)化流程也構(gòu)建完成了。
使用這種方式構(gòu)建自動(dòng)化流程,人機(jī)協(xié)作的部分只有必要時(shí)人工才參與的點(diǎn)擊功能按鈕和必要元素,構(gòu)建的全程不再需要“拖拉拽”各種組件和代碼塊,任何人隨時(shí)都能構(gòu)建需要的自動(dòng)化流程。
案例所使用的AI智能體產(chǎn)品,是實(shí)在智能推出的RPA Agent智能體。這是一個(gè)能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA Agent,進(jìn)一步降低了數(shù)字員工的應(yīng)用門檻。
實(shí)在智能憑借其自創(chuàng)業(yè)初就深深扎根在AI領(lǐng)域強(qiáng)大的自研能力和幫助大中型企業(yè)客戶獲取豐富的自動(dòng)化落地解決方案的經(jīng)驗(yàn),在經(jīng)歷第一代專家模式RPA、第二代簡易模式IPA之后,迭代成為現(xiàn)在的第三代對(duì)話模式RPA:融合TARS大語言模型的RPA Agent智能體。
實(shí)在智能垂直領(lǐng)域大模型TARS的推出,為RPA數(shù)字員工注入“TARS+ISSUT(智能屏幕語義理解技術(shù))”雙模引擎。雙模互動(dòng)構(gòu)成了TARS-RPA-Agent,實(shí)現(xiàn)對(duì)屏幕上一切元素的自動(dòng)化操作,并為行業(yè)帶來“你說,PC做”全新工作布置方式,實(shí)現(xiàn)流程自動(dòng)化創(chuàng)建的“所說即所得”。
這里“你說,PC做”的意思是,通過RPA智能體構(gòu)建包括所有企業(yè)管理軟件在內(nèi)的自動(dòng)化操作流程,而并非通過GPT builder等Agent構(gòu)建平臺(tái)構(gòu)建類GPTs的輕量級(jí)Agent。如果說其他平臺(tái)構(gòu)建的Agent還是Agent工具,RPA Agent構(gòu)建的Agent則是智能體數(shù)字員工。
RPA Agent智能體不只發(fā)揮了LLM理解與分析的優(yōu)勢(shì),也保留了RPA特色,只要能夠識(shí)別的元素全部都能實(shí)現(xiàn)自動(dòng)化操作,可以面向包含API接口及UI自動(dòng)化的所有管理程序構(gòu)建自動(dòng)化程序,因此完全可以用于企業(yè)運(yùn)營的業(yè)務(wù)流程自動(dòng)化構(gòu)建。
超自動(dòng)化平臺(tái)推出的Agent更靠譜
企業(yè)要引入AI智能體進(jìn)行流程優(yōu)化,必須經(jīng)過成本控制、投入預(yù)算、實(shí)現(xiàn)效率、安全管控等多方面嚴(yán)格及縝密的評(píng)估。這就要求技術(shù)供應(yīng)商提供的必須是平臺(tái)級(jí)解決方案,而不是只針對(duì)單一、個(gè)別場(chǎng)景需求來提供的智能體自動(dòng)化解決方案。
越復(fù)雜的業(yè)務(wù)流程自動(dòng)化,對(duì)智能體廠商平臺(tái)的底層技術(shù)融合能力、數(shù)據(jù)安全性掌控能力、產(chǎn)品部署后的運(yùn)營和維護(hù)能力、交付能力及產(chǎn)品和解決方案的可擴(kuò)展能力等的要求也就越嚴(yán)格。這也對(duì)AI Agent技術(shù)供應(yīng)商提出了更高的要求,必須具備豐富的幫助大廠實(shí)現(xiàn)超大和復(fù)雜業(yè)務(wù)場(chǎng)景自動(dòng)化落地的經(jīng)驗(yàn)。
同時(shí),大型企業(yè)引入新的AI技術(shù)不允許任何試錯(cuò)成本,因此技術(shù)供應(yīng)商給出的解決方案必須是開箱即用、具備行業(yè)KNOW-HOW術(shù)語和業(yè)務(wù)規(guī)則的真實(shí)智能體數(shù)字員工。也只有這樣的標(biāo)準(zhǔn)化智能體,才能被納入企業(yè)的內(nèi)部編制中去統(tǒng)一管理和調(diào)度。
除此之外,要實(shí)現(xiàn)AI Agent更好地商用,需要考慮接口成本、隱私、管理、授權(quán)等諸多因素,這既是很多供應(yīng)商的技術(shù)與產(chǎn)品門檻,也是廣大企業(yè)選型的重要依據(jù)。
所以,企業(yè)在選擇用于業(yè)務(wù)流程自動(dòng)化的AI智能體時(shí),也是優(yōu)先考慮超自動(dòng)化廠商推出的AI智能體產(chǎn)品,而不是選擇LLM廠商推出的尚未成熟的通過API連接各種插件的單一智能體解決方案。
這種情況下,在B端市場(chǎng),由ERP、BPM、超自動(dòng)化等企業(yè)管理軟件廠商推出的AI智能體反而更受關(guān)注。大部分企業(yè)會(huì)根據(jù)自身需求,選擇能夠結(jié)合業(yè)務(wù)特點(diǎn)、具備豐富流程自動(dòng)化落地經(jīng)驗(yàn)且能夠解決更復(fù)雜更龐大業(yè)務(wù)流程自動(dòng)化的需求的技術(shù)供應(yīng)商,以快速實(shí)現(xiàn)新AI智能體解決方案落地。
這也是老牌RPA融合LLM后,更容易將智能體做成平臺(tái)級(jí)別產(chǎn)品的原因。
就如推出RPA Agent智能體的實(shí)在智能,具備上面所列的多個(gè)先發(fā)優(yōu)勢(shì):之前RPA、IDP、流程挖掘、ISSUT等所有產(chǎn)品組合都是按照平臺(tái)級(jí)別打造的,現(xiàn)在的RPA智能體也是在之前超自動(dòng)化平臺(tái)的基礎(chǔ)上融合LLM及Agent架構(gòu)打造的。
它自誕生開始,就是比爾蓋茨所說的平臺(tái)級(jí)智能體產(chǎn)品。
如果你的企業(yè)想在Agent被視作玩具的眼下引入企業(yè)級(jí)AI智能體數(shù)字員工,實(shí)在智能RPA Agent智能體會(huì)是一個(gè)不錯(cuò)的選擇。
后記:AI Agent前半場(chǎng)屬于平臺(tái)級(jí)AI智能體
在超自動(dòng)化領(lǐng)域,很多人認(rèn)為LLM廠商推出的AI Agent,可能會(huì)優(yōu)先顛覆之前的RPA、低代碼、工作流、流程挖掘等企業(yè)管理平臺(tái)。
但現(xiàn)在的事實(shí)是,這些超自動(dòng)化平臺(tái)通過融合自有大語言模型或者集成第三方大語言模型API,在此基礎(chǔ)上推出的AI Agent反而更勝一籌,無論在安全性方面,還是易用性、擴(kuò)展能力等方面,都明顯優(yōu)于現(xiàn)在市面上其他Agent。
如果套上“LLM+規(guī)劃+記憶+工具”這個(gè)Agent架構(gòu),RPA、低代碼等都屬于工具,但這個(gè)工具是融合AI等多種技術(shù)的平臺(tái)級(jí)別工具,它與GPT等通過API調(diào)用的輕量級(jí)工具有著顯著區(qū)別。
有的推出Agent智能體的廠商如實(shí)在智能,也推出了自己的垂直領(lǐng)域大模型,躋身成為大語言模型廠商,因此在Agent構(gòu)建及技術(shù)架構(gòu)方面可以有更多的選擇以及靈活的策略。
更重要的是作為超自動(dòng)化廠商,他們擁有更多的技術(shù)、工具、數(shù)據(jù)以及經(jīng)驗(yàn),可以基于自身優(yōu)勢(shì)打造更符合產(chǎn)品特性及用戶屬性的AI智能體,并能夠?yàn)橛脩舳ㄖ茖俚膫€(gè)性化企業(yè)級(jí)AI智能體。。
這樣的AI智能體能夠更好地理解用戶指令意圖并為RPA等工具規(guī)劃各種任務(wù),更能夠無縫融合及適配所有工具、數(shù)據(jù)、知識(shí)及經(jīng)驗(yàn)。
目前而言,不管怎么對(duì)比,由企業(yè)管理軟件廠商推出的平臺(tái)級(jí)AI Agent明顯要靠譜得多,且已真正實(shí)現(xiàn)落地商用。
AI Agent應(yīng)用落地前半場(chǎng),企服軟件廠商的平臺(tái)級(jí)AI智能體先跑出來了。
【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA,歡迎關(guān)注與交流?!?/span>
聯(lián)系客服