融合LLM的RPA進(jìn)化到什么程度?來看看實(shí)在智能的TARS-RPA-Agent
AIGC如何借AI Agent落地?實(shí)在智能TARS-RPA-Agent告訴你答案
具備里程碑的意義的TARS-RPA-Agent,為超自動化的未來提供了方向
實(shí)在智能TARS-RPA-Agent,業(yè)界首發(fā)的產(chǎn)品級Agent有何非凡之處?
像生成文本一樣生成流程,實(shí)在智能TARS-RPA-Agent開啟RPA新體驗(yàn)
邊探索邊創(chuàng)建,實(shí)在智能TARS-RPA-Agent破解RPA與LLM融合難題
文/王吉偉
大語言模型(LLM,Large Language Model)的持續(xù)爆發(fā),讓AIGC一直處于這股AI風(fēng)暴最中央,不停席卷各個領(lǐng)域。
在國內(nèi),仍在雨后春筍般上新的大語言模型,在持續(xù)累加“千模大戰(zhàn)”大模型數(shù)量的同時,也在不斷填補(bǔ)垂直大語言模型在各個領(lǐng)域的空白。
每個領(lǐng)域都會有自己的大模型,每個領(lǐng)域都會有廠商推出自有模型。更多的LLM,讓AIGC以更迅猛的速度進(jìn)入并影響更多業(yè)務(wù)場景。
AIGC并不只有C端用戶所看到的用AI工具生成文字、圖畫、視頻等各種內(nèi)容,還有B端的用AI直接生成以及驅(qū)動管理系統(tǒng)生成各種可執(zhí)行的業(yè)務(wù)流程。
相對于C端產(chǎn)品直接引入生成式AI或者部署開源模型就能搞定,B端產(chǎn)品要在引入、部署及自研LLM的基礎(chǔ)上做更多的訓(xùn)練、微調(diào)與優(yōu)化等,才能保證LLM能夠與已有產(chǎn)品更好的融合,以更好地發(fā)揮各自所長。
一旦LLM與企業(yè)管理軟件融合好,便意味著大模型的順利落地。而大語言模型的私有化部署能力,往往意味著廠商們更大的商機(jī)。
這樣,LLM與企業(yè)管理軟件的融合成了重中之重。發(fā)布領(lǐng)域大模型與提供私有化部署,也成了廣大B端廠商主流做法,更使得能夠代替用戶和大模型進(jìn)行交互的AI Agent ,在Prompt系統(tǒng)工程之后成了香餑餑。
當(dāng)前,AI Agent已是公認(rèn)大語言模型落地的有效方式之一,它讓更多人看清了大語言模型創(chuàng)業(yè)的方向,也讓投資者們更加看好LLM、Agent與已有企業(yè)管理軟件的融合應(yīng)用。
在這其中,因?yàn)镽PA、低代碼等技術(shù)在自動化方面的天然屬性,并且自然語言交互能夠?yàn)槠鋷硐喈?dāng)?shù)馁|(zhì)變,能夠?yàn)榭蛻舳说蕉俗詣踊某詣踊绾闻cAI Agent融合,也成了很多投資機(jī)構(gòu)重點(diǎn)關(guān)注的領(lǐng)域。
說到這里,有人可能會問:超自動化與LLM的融合進(jìn)展到了什么程度?有沒有廠商在做AI Agent方面的嘗試?產(chǎn)品體驗(yàn)如何?
恰好最近實(shí)在智能正式發(fā)布了TARS大模型,并在業(yè)界首發(fā)了基于大模型的Agent產(chǎn)品TARS-RPA-Agent。同時為了搞明白這款產(chǎn)品,發(fā)布會后王吉偉頻道還做了專訪。
本文就以這款產(chǎn)品為例,跟大家聊聊上面的幾個問題。
基于大模型的產(chǎn)品級Agent:TARS-RPA-Agent
看到Agent,很多人會想到AI Agent及其代表作AutoGPT。
AutoGPT是一個基于ChatGPT的工具,能幫你自動完成各種任務(wù),比如寫代碼、寫報告、做調(diào)研等等。只需要告訴它要扮演的角色和要實(shí)現(xiàn)的目標(biāo),它就能利用ChatGPT和谷歌搜索等工具,不斷“思考”如何接近目標(biāo)并執(zhí)行,還可以看到它的思考過程。
AutoGPT會根據(jù)用戶提出的目標(biāo)制定并自動化執(zhí)行完整計劃,解決了被大多數(shù)人所詬病的“與LLM交互過程中的無效提問及反饋”等諸多問題。
AutoGPT的火爆,也讓AI Agent快速出圈。
AI Agent是指人工智能代理(Artificial Intelligence Agent),是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動作的智能實(shí)體。它通?;跈C(jī)器學(xué)習(xí)和人工智能技術(shù),具備自主性和自適應(yīng)性,在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn)。
LLM擅長處理和生成文本,但只有給它輸入才會產(chǎn)生輸出,仍然是一種被動使用模式。AI Agent則提供了更廣泛的功能,尤其是在與環(huán)境的交互、主動決策和執(zhí)行各種任務(wù)方面。
AI Agent以LLM為大腦,再賦予任務(wù)規(guī)劃能力、長短期記憶力、工具使用能力,即可實(shí)現(xiàn)自動化處理更復(fù)雜的任務(wù)。簡單來說,AI Agent基于LLM驅(qū)動Agent實(shí)現(xiàn)對通用問題的自動化處理。
AI Agent具備獨(dú)立的思考和認(rèn)知功能、擁有記憶,能進(jìn)行思考、邏輯推斷和自我反思,可以閱讀和在線學(xué)習(xí),擅長利用適當(dāng)?shù)墓ぞ咛幚韱栴},還能策劃并根據(jù)實(shí)際情況調(diào)整任務(wù)的優(yōu)先級。
可以說,AI Agent為LLM提供了行動能力,真正釋放了LLM的潛能。
那RPA與AI Agent結(jié)合,會有什么樣的化合反應(yīng)呢?
這次實(shí)在智能業(yè)界首發(fā)的TARS-RPA-Agent,正是一款A(yù)I Agent類RPA產(chǎn)品。
但需要說明的是,與AutoGPT只提供智能體框架不同。實(shí)在智能創(chuàng)始人兼CEO孫林君(阿寶)告訴王吉偉頻道,TARS-RPA-Agent是一個真正的產(chǎn)品級Agent,是普通用戶不需要部署就能方便使用的大語言模型智能體。經(jīng)過技術(shù)優(yōu)化以后的Agent產(chǎn)品,不會在使用時陷入邏輯上的死循環(huán),也不會過度消耗tokens。
前文講過AI Agent的核心是LLM,TARS-RPA-Agent所依賴的LLM是實(shí)在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型。
TARS大模型具備優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力。
其中,實(shí)在智能與湘財證券共建的“自研、有效、安全、可信任、可落地”的財經(jīng)行業(yè)大模型TARS-Finance-7B,保留了生成式大模型的通用技能,并在金融財經(jīng)領(lǐng)域得到了顯著的加強(qiáng)和提升,在多個中英文的通用基準(zhǔn)測評集和財經(jīng)領(lǐng)域基準(zhǔn)測評集上均取得良好成績。
簡單來講,TARS-RPA-Agent是一個基于“TARS+ISSUT(智能屏幕語義理解)”雙模引擎、有“大腦”,更有“眼睛和手腳”的超自動化智能體,是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式產(chǎn)品。
TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu):底層是包括通用基礎(chǔ)模型和各個垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語義理解技術(shù);上層是依托這兩項(xiàng)關(guān)鍵技術(shù)完成全面升級和改造的超自動化產(chǎn)品。
能夠在AI Agent盛行不久便能打造出AI智能體產(chǎn)品,得益于長期的技術(shù)沉淀與經(jīng)驗(yàn)積累。自推出RPA產(chǎn)品至今天發(fā)布TARS-RPA-Agent,實(shí)在智能的產(chǎn)品體系已經(jīng)歷三次重要迭代:
2018-2021年,實(shí)在第一代專家模式RPA,實(shí)現(xiàn)可視化拖拉拽構(gòu)建數(shù)字員工。
2021-2022,實(shí)在第二代簡易模式IPA,基于首創(chuàng)ISSUT智能屏幕語義理解技術(shù),跳出IDE技術(shù)模式,開啟全球首個點(diǎn)選用模式RPA。
2022-2023,實(shí)在第三代對話模式RPA(ChatRPA),結(jié)合大語言模型基礎(chǔ),實(shí)現(xiàn)超自動化Agent,打造業(yè)界首款計算機(jī)視覺與大語言模型結(jié)合的智能體產(chǎn)品,以全新體驗(yàn)人機(jī)交互開啟對話式流程創(chuàng)建時代。
正是因?yàn)槎嗄甑某掷m(xù)創(chuàng)新與不懈努力,使得實(shí)在智能TARS-RPA-Agent模式ChatRPA,成為國內(nèi)首個基于大語言模型和智能屏幕語義理解的產(chǎn)品級Agent,真正實(shí)現(xiàn)流暢的對話式生成業(yè)務(wù)流程,因此一經(jīng)發(fā)布就得到了業(yè)內(nèi)外的廣泛關(guān)注。
說了這么多,產(chǎn)品體驗(yàn)如何呢?不要急,下一節(jié)就會講到。
像生成文本一樣生成流程
在采訪中,實(shí)在智能演示了幾個案例。
其中一個是web端案例,演示如何通過與TARS對話,ChatRPA自動創(chuàng)建在京東查詢商品數(shù)據(jù)的流程。
在新建流程的對話窗口輸入“查詢京東中最暢銷的電視機(jī)”,提交以后塔斯反饋了流程創(chuàng)建的兩個執(zhí)行計劃。在計劃詳情中可以查看每個計劃的執(zhí)行步驟,還可以通過多輪對話修改以創(chuàng)建更復(fù)雜的流程。點(diǎn)擊執(zhí)行后,ChatRPA就會進(jìn)入IPA模式按計劃的詳情步驟開始執(zhí)行。
遇到不能執(zhí)行的步驟,只需要人工通過繼續(xù)對話或者按照提示點(diǎn)擊相應(yīng)頁面元素,流程就能持續(xù)創(chuàng)建,全流程基本都是自動化創(chuàng)建,人工參與的部分已經(jīng)很少。
并且,還可以在流程執(zhí)行完畢的基礎(chǔ)上,通過對話繼續(xù)增加新的執(zhí)行計劃以完善流程。
在演示中,最后增加了一輪對話:將商品名保存到桌面TXT文件中。提交以后,ChatRPA會按照新的計劃繼續(xù)執(zhí)行。
實(shí)在智能產(chǎn)品專家拓海告訴王吉偉頻道,最后這個計劃看起來簡單,實(shí)則體現(xiàn)了ChatRPA的兩個能力:一是邏輯推理能力,它能夠?qū)⒅案鱾€組件變量的邏輯關(guān)系進(jìn)行串聯(lián);二是代碼生成能力,在沒有基礎(chǔ)組件的流程步驟中它可以直接生成一段代碼,并把這個代碼封裝成為自建組件。
重點(diǎn)在于,這個組件是可以復(fù)用的,以后在流程創(chuàng)建中有需要的時候可以隨時調(diào)用這個組件。
在王吉偉頻道看來,對于沒有編程能力的普通用戶而言,之前只能圍繞已有組件去做各種形式的流程實(shí)現(xiàn),確實(shí)比較復(fù)雜?,F(xiàn)在基于大語言模型的ChatRPA具備了“遇河搭橋”的能力,在沒有組件可調(diào)用的情況下直接生成一個組件,進(jìn)而保證流程的創(chuàng)建與執(zhí)行。
這就相當(dāng)于用戶在創(chuàng)建流程的時候身邊有個具備業(yè)務(wù)能力的程序員在做指導(dǎo),總能以最簡單最優(yōu)化的方式幫助用戶去實(shí)現(xiàn)各種流程的創(chuàng)建與執(zhí)行。所以,理論上已經(jīng)沒有任何流程的創(chuàng)建能夠難住ChatRPA。并且隨著不斷的數(shù)據(jù)喂養(yǎng)與加強(qiáng)學(xué)習(xí),以后它還能生成更復(fù)雜的組件以創(chuàng)建復(fù)雜的長流程。
組件是可以復(fù)用的,流程也是一樣的。
阿寶告訴王吉偉頻道,流程并不是一下就生成的,TARS-RPA-Agent會不斷修改用戶意圖,不斷完善流程,流程可以越做越復(fù)雜,最后會變成一個高可用的標(biāo)準(zhǔn)流程。
簡單地講,讓基于大語言模型的RPA自動創(chuàng)建流程主要分為兩步:第一步是分析操作對象界面元素,第二步是在流程步驟中填充需要被操作的元素。
在阿寶看來,大語言模型本質(zhì)上是一個語言模型,它能夠分析邏輯,卻看不到要操作的對象。而通過計算機(jī)視覺告訴LLM操作對象在哪里,它就可以進(jìn)一步去操作各種對象驅(qū)動RPA去創(chuàng)建各種流程。
所以,TARS-RPA-Agent與其他Agent的不同之處在于,目前大多數(shù)AI Agent產(chǎn)品仍是基于語言模型的綜合應(yīng)用,而TARS-RPA-Agent是計算機(jī)視覺和大模型的結(jié)合。這在全球Agent領(lǐng)域也是不多見的,更是RPA領(lǐng)域的首創(chuàng)。
能夠?qū)崿F(xiàn)這一點(diǎn),更得益于實(shí)在智能很久之前就布局的智能屏幕語義理解技術(shù)。
拓海告訴王吉偉頻道,過去的IPA模式,用戶可能還得根據(jù)AI推薦去找一些需要被操作的對象元素。TARS-RPA-Agent則更進(jìn)一步,不需要去指定元素,只需要告訴模型要操作的目標(biāo)是什么,它刷一下當(dāng)前的屏幕,就能根據(jù)屏幕語義理解意思,直接命中目標(biāo)元素。
如果沒有命中的話,則需要一些人機(jī)協(xié)助填充目標(biāo)。并且在協(xié)助過程中,TARS-RPA-Agent能夠記住這些元素及操作,逐步優(yōu)化語義理解,讓流程及組件復(fù)用性更高。
此外,TARS-RPA-Agent還實(shí)現(xiàn)了語音流程創(chuàng)建的體驗(yàn)大提升。
通過對話機(jī)器人+RPA進(jìn)行語音對話式RPA流程創(chuàng)建,已經(jīng)是比較常見的解決方案?,F(xiàn)在市面上不乏接入天貓精靈、小度等語音機(jī)器人調(diào)用RPA的產(chǎn)品。但這種應(yīng)用需要建立在已經(jīng)創(chuàng)建好的流程基礎(chǔ)之上,需要先以人工方式創(chuàng)建好流程,才能實(shí)現(xiàn)以對話機(jī)器人調(diào)用流程。
TARS-RPA-Agent的不同之處在于,用戶只需要對機(jī)器人說出需求,機(jī)器人即可完成即時的流程搭建和執(zhí)行,而不再需要提前創(chuàng)建流程,真正實(shí)現(xiàn)即時場景的“你說機(jī)器人做”。
整體演示下來,給王吉偉頻道的感覺是,結(jié)合AI Agent及屏幕語義理解技術(shù)的ChatRPA,真的實(shí)現(xiàn)了像生成文本一樣生成流程,使用體驗(yàn)得到倍數(shù)級提升。尤其是通過語音即時創(chuàng)建與執(zhí)行流程,已經(jīng)初步有了《鋼鐵俠》中托尼使用AI助理塔維斯即時執(zhí)行任務(wù)的感覺。
“邊探索邊創(chuàng)建”流程生成方式
ChatRPA能夠?qū)崿F(xiàn)流暢的對話生成自動化流程,也體現(xiàn)了實(shí)在智能對于產(chǎn)品的幾點(diǎn)思考:
首先,入口要好找,方便進(jìn)入,可根據(jù)場景需要可隨時喚起;
其次,使用要靈活,不僅能將一個任務(wù)完整的自動化流程規(guī)劃生成出來,還能應(yīng)對復(fù)雜特殊的場景,能夠生成代碼組件,也能保持和發(fā)揮大模型的特色,具有廣闊知識的查詢和建議生成能力。
再者,所生成的流程要能夠工業(yè)化應(yīng)用,就需要容忍模型的不完整,必須支持人機(jī)協(xié)同,也就是可對流程進(jìn)行修改、增加、刪除,當(dāng)然最基本的要求,可直接運(yùn)行。
正是這些思考,使得實(shí)在智能沒有走“全流程一次生成”的路子,而是采取了一種“邊探索邊創(chuàng)建”的遞進(jìn)式流程生成方式。
要知道,流程中的各種元素是時刻在變的,所以流程創(chuàng)建也應(yīng)該以一種更靈活的方式實(shí)現(xiàn)中途修改,需要每一步都結(jié)合用戶的意圖去探索性的操作,不然就會出現(xiàn)一次生成完整流程而不能使用或者經(jīng)過大量修改才能使用的情況。
在這個基礎(chǔ)上,TARS-RPA-Agent不但實(shí)現(xiàn)了單步尋優(yōu),還做到了把每一步的執(zhí)行過程和結(jié)果都展示和反饋出來。
事實(shí)證明,只有“邊探索邊創(chuàng)建”的模式,才能讓RPA真正融合LLM并發(fā)揮真正的作用。
而為了開發(fā)一款真正意義上的RPA/超自動化Agent,實(shí)在智能至少克服了包括打造“邊探索邊創(chuàng)建”模式在內(nèi)的四重挑戰(zhàn)。
“你說,TArs做”背后的四重挑戰(zhàn)
這次發(fā)布會的主題是:RPA新境界—你說TArs做。
這個主題,也映射了實(shí)在智能在TARS-RPA-Agent的終極目標(biāo)是“你說,PC做”,要真正實(shí)現(xiàn)包括流程創(chuàng)建等各種業(yè)務(wù)處理的“所說及所得”。
我們已經(jīng)知道,TARS大模型在語義理解、內(nèi)容生成、多輪問答、信息抽取等方面具有獨(dú)特優(yōu)勢和強(qiáng)大能力。要實(shí)現(xiàn)這個目標(biāo),是不是把TARS的能力接入到RPA中就夠了?是不是大模型就能直接為生成流程、完成工作?
經(jīng)過一系列論證與測試,在實(shí)在智能看來,想要實(shí)現(xiàn)“你說,TArs做”這個目標(biāo),并不是簡單結(jié)合就可以的。
想要讓TARS聽得懂人話并完得成各種任務(wù),至少面臨四重挑戰(zhàn):
挑戰(zhàn)一:不能自主拆解任務(wù)。實(shí)際場景中的復(fù)雜指令往往蘊(yùn)含在簡潔的語句當(dāng)中,想要TARS-RPA-Agent既能接任務(wù)又能做任務(wù),無法依靠大模型生成一段Python代碼或簡單調(diào)用幾個RPA組件就能實(shí)現(xiàn),而是需要它理解指令并拆解成可執(zhí)行的子任務(wù)和步驟。
挑戰(zhàn)二:無法感知當(dāng)前環(huán)境。TARS-RPA-Agent必須對周邊的環(huán)境有充分的認(rèn)知、理解和交互,知道它是誰以及它在哪。
在RPA領(lǐng)域中,TARS-RPA-Agent所處的周邊環(huán)境也就是運(yùn)行流程的那臺電腦,以及所要操作的各種網(wǎng)頁、軟件和電腦屏幕等。單純依靠一個大語言模型做不到這一點(diǎn),它需要超越語言大模型技能之外的、真正人類視角的操作對象理解能力。
挑戰(zhàn)三:不能邊執(zhí)行邊反饋。任務(wù)執(zhí)行應(yīng)該隨地關(guān)注任務(wù)的進(jìn)度如何,有無風(fēng)險,并通過不斷的“執(zhí)行-反饋-修正”來確保任務(wù)正常運(yùn)行。
TARS-RPA-Agent面臨同樣問題,一次性生成但無法成功執(zhí)行的整段流程是沒有意義的,它需要保證每一步操作的正確性,不會因?yàn)轭I(lǐng)會錯了意圖,或者前一步操作失誤,而導(dǎo)致當(dāng)前步驟點(diǎn)錯按鈕、輸錯賬號或者發(fā)錯郵件。
挑戰(zhàn)四:無法記憶歷史經(jīng)驗(yàn)。大語言模型一直存在一個很大的問題是缺乏長時記憶,TARS-RPA-Agent需要學(xué)習(xí)歷史經(jīng)驗(yàn),并通過歷史案例不斷提升決策能力。但如果不能長時記憶,顯然就無法勝任與學(xué)習(xí)各種能力,因此它需要超出一般大模型的自主迭代能力。
針對上述四重挑戰(zhàn),實(shí)在智能采取了不同的技術(shù)、設(shè)計和方法來應(yīng)對,最終將TARS-RPA-Agent打造成為一個有大腦眼睛和手腳的能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋和記憶歷史經(jīng)驗(yàn)的IPA全新模式和超自動化智能體。
有了對AI Agent類RPA產(chǎn)品的深度認(rèn)知、全新理解,基于“ISSUT智能屏幕語義理解+TARS垂類大模型”架構(gòu)的ARS-RPA-Agent模式ChatRPA,也具備了“三智三可”的特色優(yōu)勢。
“三智”即智能理解、智能分析和智能生成:
■ 智能理解:能智能理解對話內(nèi)容,理解所描述的任務(wù)、指令;
■ 智能分析:能分析并拆解任務(wù),規(guī)劃任務(wù)過程和動作;
■ 智能生成:能映射成自動化組件,智能填充好屬性、對象等。
“三可”為可以執(zhí)行、可以解釋及可以修改:
■ 可以執(zhí)行:不只是生成過程規(guī)劃,而是可執(zhí)行的自動化流程;
■ 可以解釋:不僅是任務(wù)拆解過程說明,還可查看每個動作參屬性數(shù);
■ 可以修改:不僅可執(zhí)行,還可隨意插入、修改和刪除的動作。
“三智三可”體現(xiàn)了實(shí)在智能ChatRPA“真實(shí)實(shí)用”的宗旨,也讓其產(chǎn)品真正實(shí)現(xiàn)了“像生成文本一樣生成流程”的超易用性體驗(yàn)。
后記:TARS-RPA-Agent的未來
TARS-RPA-Agent能夠在哪些領(lǐng)域獲得長足的發(fā)展,一定程度上取決于TARS大模型在哪些領(lǐng)域有更強(qiáng)的能力。目前TARS-Finance-7B在金融領(lǐng)域的能力是有目共睹的,在多個大模型評測中的綜合評分都遠(yuǎn)超行業(yè)平均分?jǐn)?shù)。
對于為何要優(yōu)先選擇金融領(lǐng)域,阿寶告訴王吉偉頻道,首先在于金融領(lǐng)域的公開數(shù)據(jù)、權(quán)威數(shù)據(jù)比較多且相對規(guī)范,其次在于金融是RPA市場份額增長比較快的領(lǐng)域。
除了金融領(lǐng)域,實(shí)在智能也正在訓(xùn)練和微調(diào)塔斯大模型在其他領(lǐng)域的能力。并且實(shí)現(xiàn)起來也比較簡單,只要把諸如法律、人力資源等領(lǐng)域的語料加入并進(jìn)行持續(xù)訓(xùn)練和微調(diào),就能打造面向這兩個領(lǐng)域垂直行業(yè)模型。
TARS-RPA-Agent之所以備受矚目,在于它是業(yè)界首個大語言模型與計算機(jī)視覺有機(jī)結(jié)合的Agent,這是國內(nèi)廠商在AI Agent領(lǐng)域初步嘗試的成果,為超自動化廠商以及To B領(lǐng)域產(chǎn)品的未來發(fā)展提供了一個方向,對RPA行業(yè)的發(fā)展具有里程碑的意義,也必將成為大語言模型落地的典型AI智能體案例。
在TARS大模型+ISSUT的后續(xù)發(fā)展上,實(shí)在智能早已制定計劃。
首先,會在充分評估和修正(模型性能、安全性等方面)后,對的TARS-Finance-7B模型進(jìn)行開源,以促進(jìn)生成式大模型方向的學(xué)術(shù)研究和應(yīng)用發(fā)展;
其次,會繼續(xù)擴(kuò)大TARS垂直大模型的參數(shù)規(guī)模,讓更多模型能力在更大的參數(shù)尺度上涌現(xiàn),目前一個70B的行業(yè)大模型已經(jīng)在訓(xùn)練和優(yōu)化當(dāng)中;
第三,面向RPA領(lǐng)域的全新TARS-RPA-Agent功能則將在未來2個月內(nèi)隨著功能、性能等測試的進(jìn)一步完善,隨著新版本的發(fā)布而開放試用。
可以預(yù)見,有了這些發(fā)展計劃,TARS+X的全新模型及全新產(chǎn)品將會有更多可能。
除此之外,TARS-RPA-Agent的組件自動生成,也有更大的想象空間。
對話式RPA的易用性前所未有,任何人都能通過簡單對話就能實(shí)現(xiàn)業(yè)務(wù)流程創(chuàng)建。
用戶只需通過簡單的自然語言指令,便能在自動化或者人機(jī)協(xié)作構(gòu)建業(yè)務(wù)流程的過程中生成可復(fù)用的業(yè)務(wù)流程組件。
這意味著,普通用戶在使用ChatRPA的同時也將成為組件開發(fā)者,大量組件都將伴隨著他們的流程創(chuàng)建而生成,而不再依靠各領(lǐng)域的專業(yè)開發(fā)者去做組件開發(fā),由此組件的開發(fā)速度和量級將會產(chǎn)生翻天覆地的變化。
未來這些業(yè)務(wù)流程和組件還可以上傳到應(yīng)用市場,所適配的應(yīng)用場景也會越來越豐富。隨著更多組件被置入公共組件庫,對話式生成流程的精準(zhǔn)度、適配度以及用戶體驗(yàn)也會越來越好。
這種流程及組件生成的UGC模式,將會真正改變流程構(gòu)建自動化以及超自動化行業(yè)的未來。
從TARS-RPA-Agent來看,TARS+ISSUT這樣的技術(shù)組合,大語言模型加上智能屏幕語義理解,大概率能夠讓RPA行業(yè)喊了多年的“RPA人人可用”愿景成為現(xiàn)實(shí),也使得“人人擁有一個智能助理”進(jìn)一步成為可能。
阿寶透露,TARS大模型的名字來源于科幻電影《星際穿越》中的TARS 。
影片中的TARS是男主身邊的智能助理機(jī)器人,精通各個領(lǐng)域的知識,能夠自動處理各項(xiàng)事務(wù),并多次在關(guān)鍵時刻幫男主化險為夷。
在未來計劃中,實(shí)在智能將會持續(xù)推出更多的TARS+X的模型及產(chǎn)品。
相信假以時日,在更多的廠商的努力之下,電影中的“你說TARS做”應(yīng)用場景也將在現(xiàn)實(shí)中無處不在。
全文完
【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動化與RPA,歡迎關(guān)注與交流?!?/span>
聯(lián)系客服