代理(Agent)乃一種智能實體,具備自主環(huán)境感知與決策行動能力,旨在達成既定目標(biāo)。作為個人或組織之?dāng)?shù)字化替身,AI代理執(zhí)行特定任務(wù)與交易,其核心價值在于簡化工作流程,削減繁復(fù)性,并有效降低人力投入與溝通障礙,促進效率與協(xié)作的雙重提升。簡而言之,代理技術(shù)讓AI成為高效助手,助力個人與組織在復(fù)雜多變的環(huán)境中更加游刃有余。
01 Agent基礎(chǔ)
Agent的核心決策機制圍繞著動態(tài)適應(yīng)與持續(xù)優(yōu)化展開。它使LLM(大型語言模型)能夠依據(jù)實時變動的環(huán)境信息,靈活選擇并執(zhí)行恰當(dāng)?shù)男袆硬呗?,或?qū)π袆咏Y(jié)果進行精準(zhǔn)評估與判斷。這一過程通過多輪迭代不斷重復(fù),每一次迭代都基于對環(huán)境的深入理解與上一次執(zhí)行效果的反饋,旨在逐步逼近并最終達成既定目標(biāo)。Agent的此種運作模式,確保了其在復(fù)雜多變的環(huán)境中能夠保持高效、靈活與適應(yīng)性,持續(xù)推動任務(wù)向成功邁進。
精簡的決策流程:P(感知)→ P(規(guī)劃)→ A(行動)
感知(Perception)是指Agent從環(huán)境中收集信息并從中提取相關(guān)知識的能力。
規(guī)劃(Planning)是指Agent為了某一目標(biāo)而作出的決策過程。
行動(Action)是指基于環(huán)境和規(guī)劃做出的動作。
工程實現(xiàn)上可以拆分出四大塊核心模塊:推理、記憶、工具、行動
02 各平臺功能總結(jié)與比較
官方GPTs商店:各大平臺均設(shè)有官方GPTs應(yīng)用商店,匯聚了琳瑯滿目的插件與模型,滿足多元化需求。
知識庫:在知識庫構(gòu)建上,各平臺展現(xiàn)獨特風(fēng)采,內(nèi)容既廣泛又深入,助力用戶輕松獲取所需信息。
流程圖編排: 流程圖編排功能作為標(biāo)配,讓無編程基礎(chǔ)的用戶也能通過直觀拖拽,迅速構(gòu)建高效工作流,實現(xiàn)流程自動化。
多模型支持:對于模型支持,部分平臺展現(xiàn)開放姿態(tài),兼容多模型選擇;而有的則專注于自家大模型深度優(yōu)化,但無論哪種,均能有效支撐日常工作的順利進行。
插件調(diào)用:插件調(diào)用機制的引入,極大增強了平臺的靈活性與擴展性,用戶可根據(jù)實際需求靈活調(diào)用各類插件,提升工作效率。
Prompt配置:至于Prompt配置,各平臺均展現(xiàn)出創(chuàng)新精神,提供個性化、精細(xì)化的配置選項,確保用戶能夠精確控制模型行為,滿足特定場景下的需求。
03 國內(nèi)主流一站式Agent平臺深度測評
1.Betteryeah
網(wǎng)址:
https://www.betteryeah.com/agentstore
斑頭雁智能科技,其核心團隊源自阿里巴巴釘釘?shù)某鮿?chuàng)精英,專注于打造零門檻Agent構(gòu)建平臺,旨在迅速激活并釋放大模型的強大潛力。該平臺內(nèi)置了包括ChatGLM、阿里通義千問、百度千帆在內(nèi)的國內(nèi)外頂尖AI模型,為用戶提供了豐富的選擇。
產(chǎn)品形態(tài):在產(chǎn)品形態(tài)上,斑頭雁智能科技與Coze等前沿平臺并駕齊驅(qū),均屬于高度集成的平臺型產(chǎn)品,為用戶提供了一站式解決方案。
開發(fā)模式:其開發(fā)模式靈活多變,既支持單一Agent的精細(xì)化打造,也適應(yīng)于Multi-Agent系統(tǒng)的復(fù)雜部署,滿足不同業(yè)務(wù)場景下的多樣化需求。
應(yīng)用場景:面向企業(yè)級市場,斑頭雁智能科技聚焦AI客服、營銷、銷售等多個關(guān)鍵領(lǐng)域,提供智能化升級的全面解決方案。
其官方智能體中心更是匯聚了全類別的智能應(yīng)用,從全面的智能客服系統(tǒng),到針對電商、銷售、營銷、HR等多個垂直行業(yè)的定制化方案,再到快速上手的學(xué)習(xí)資源,一應(yīng)俱全,助力企業(yè)輕松實現(xiàn)數(shù)字化轉(zhuǎn)型與智能化升級。
2.Coze
網(wǎng)址:https://www.coze.cn
Coze,作為字節(jié)精心打造的AI Bot開發(fā)旗艦平臺,致力于賦能開發(fā)者,以強大而簡潔的界面,加速智能聊天機器人的設(shè)計與部署流程。在中文大模型智能體生態(tài)中,Coze以其先驅(qū)地位傲視群雄,無論是率先布局的市場先機,還是其在智能體編排工具的成熟度、插件的廣泛性、兼容大模型種類的多樣性,乃至發(fā)布渠道的全面覆蓋,均展現(xiàn)出非凡實力。
Coze平臺慷慨開放,無論是其自研的云雀大模型,還是外部知名的moonshot等尖端技術(shù),均對開發(fā)者免費開放,極大地降低了創(chuàng)新門檻。其卓越的用戶體驗與龐大的日活用戶數(shù),共同構(gòu)筑了行業(yè)內(nèi)的領(lǐng)先地位,無論是從生態(tài)構(gòu)建、用戶體驗,還是底層技術(shù)支撐來看,Coze無疑是眾多智能體平臺中的佼佼者。
不得不提的是字節(jié)的另一款A(yù)I智能對話助手——豆包。豆包以其獨特的prompt驅(qū)動方式,讓用戶能夠輕松定制專屬智能體,其亮點在于無縫集成了先進的TTS(文本到語音)技術(shù),讓自定義的智能體能夠直接與用戶進行語音交互,體驗更加自然流暢。相較于Coze的全方位智能體構(gòu)建方案,豆包更像是一款功能精煉、操作快捷的便攜式Coze版本,尤其適合在移動端快速高效地應(yīng)用。以下是豆包智能體中心的精彩展示,進一步詮釋了其便捷與高效。
3.百度千帆AgentBuilder
網(wǎng)址:https://agents.baidu.com/
百度AgentBuilder是一款智能體開發(fā)工具,旨在降低智能體開發(fā)門檻,讓每個人、每個組織都能夠成為智能體的開發(fā)者。AgentBuilder是百度推出的三大AI開發(fā)工具之一,另外兩個工具分別是AppBuilder和ModelBuilder(小紙條之前的文章給大家介紹過各家產(chǎn)品們的區(qū)別)。
產(chǎn)品形態(tài):基于文心大模型的智能體平臺,也是平臺型。
開發(fā)方式:支持開發(fā)者根據(jù)自身行業(yè)領(lǐng)域和應(yīng)用場景選擇不同類型的開發(fā)方式,提供低成本的prompt編排方式。
功能特點:提供零代碼和低代碼兩種開發(fā)模式,適合不同技術(shù)背景的開發(fā)者
來看下智能體中心大家都在用什么,熱門的主要也還是聚焦提效、娛樂、生活、以及實時熱點的高考。
4.SkyAgents(昆侖萬維)
網(wǎng)址:
https://model-platform-skyagents.tiangong.cn
昆侖萬維公司隆重推出天工SkyAgents,這是一款引領(lǐng)未來的AI Agents構(gòu)建平臺,旨在重塑智能應(yīng)用的創(chuàng)造邊界。
產(chǎn)品形態(tài)創(chuàng)新:天工SkyAgents以其先進的技術(shù)架構(gòu),打造了一個高效、靈活的AI Agents構(gòu)建生態(tài)系統(tǒng)。該平臺不僅集成了前沿的人工智能技術(shù),還通過模塊化設(shè)計,讓AI Agent的創(chuàng)建與部署變得前所未有的簡單快捷。
開發(fā)體驗革新:區(qū)別于傳統(tǒng)繁瑣的開發(fā)流程,天工SkyAgents引入了革命性的開發(fā)方式。用戶僅需通過自然語言輸入,即可輕松描述AI Agent的功能與行為;同時,可視化拖拽界面更是將復(fù)雜的技術(shù)操作簡化為直觀的圖形操作,深度集成Skywork大語言模型,讓AI Agent的智能化水平躍升至新高度。
應(yīng)用場景廣泛:天工SkyAgents的智能體,憑借其強大的感知與決策能力,能夠精準(zhǔn)適配各類具體業(yè)務(wù)場景。無論是電商平臺的個性化推薦、客服系統(tǒng)的智能應(yīng)答,還是金融領(lǐng)域的風(fēng)險評估、智能制造的自動化控制,天工SkyAgents都能以用戶需求為核心,提供定制化的智能解決方案,助力企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型與升級。
社區(qū)生態(tài)活躍:在天工SkyAgents的智能體中心,一個充滿活力的社區(qū)生態(tài)正在形成。這里不僅有官方精心打造的示例Agents,展示著AI Agent的無限可能與最佳實踐;更有來自全球的個人開發(fā)者,他們通過天工平臺貢獻自己的智慧與創(chuàng)意,構(gòu)建了一個豐富多彩、不斷更新的Agent市場。這個市場不僅為開發(fā)者提供了展示自我的舞臺,更為用戶提供了更多元化、更個性化的AI服務(wù)選擇。
綜上所述,天工SkyAgents以其獨特的產(chǎn)品形態(tài)、革新的開發(fā)方式、廣泛的應(yīng)用場景以及活躍的社區(qū)生態(tài),正逐步成為AI Agent構(gòu)建領(lǐng)域的佼佼者。未來,隨著技術(shù)的不斷進步與應(yīng)用的持續(xù)深化,天工SkyAgents有望引領(lǐng)智能體技術(shù)邁向新的高度,為人類社會創(chuàng)造更加美好的智能生活。
5.阿里云魔搭社區(qū)
網(wǎng)址:
https://modelscope.cn/studios/agent
產(chǎn)品形態(tài)革新:我們自豪地推出這款專為開源大語言模型(LLM)量身定制的AI Agent開發(fā)框架。它不僅完美兼容并優(yōu)化各類主流LLM,還提供了一個高度靈活與可擴展的平臺,讓AI Agent的開發(fā)與部署更加便捷高效。
開發(fā)方式多元化:該框架支持創(chuàng)建多樣化的多模態(tài)AI Agent,涵蓋客戶服務(wù)、個人助理等多個領(lǐng)域,滿足不同場景下的智能化需求。用戶可以根據(jù)具體業(yè)務(wù)場景,輕松構(gòu)建出既能處理文本對話,又能理解圖像、語音等多類型信息的智能體,實現(xiàn)全方位的用戶交互體驗。
一鍵協(xié)作,簡化流程:我們深知在AI項目開發(fā)中,模型間的協(xié)作至關(guān)重要。因此,該框架創(chuàng)新性地引入了一鍵發(fā)送指令調(diào)用其他AI模型的功能,大幅簡化了模型集成與協(xié)作的流程。用戶無需深入技術(shù)細(xì)節(jié),即可輕松實現(xiàn)多模型間的無縫對接,提升整體項目的智能化水平和響應(yīng)速度。
低/零代碼平臺,降低門檻:為了進一步降低AI Agent的開發(fā)門檻,我們結(jié)合了低/零代碼平臺的設(shè)計理念,讓非技術(shù)背景的用戶也能參與到AI應(yīng)用的開發(fā)中來。通過直觀的圖形化界面和豐富的預(yù)設(shè)模板,用戶可以快速上手,實現(xiàn)個性化定制的智能體,無需編寫復(fù)雜的代碼。
廣泛適用,未來可期:該框架設(shè)計之初就充分考慮了未來技術(shù)的發(fā)展趨勢,因此它不僅適用于當(dāng)前多種業(yè)務(wù)場景,還具備高度的可擴展性和兼容性。隨著開源大模型的不斷涌現(xiàn)與更新,我們將持續(xù)優(yōu)化該框架,確保它能夠快速適配更多新增的開源大模型,為用戶提供更加豐富和強大的AI解決方案。
創(chuàng)建智能體新體驗:在開源社區(qū)中,該產(chǎn)品的智能體創(chuàng)建過程同樣令人印象深刻。用戶可以通過對話配置和參數(shù)配置兩種方式,靈活定義智能體的行為邏輯和外觀樣式。雖然當(dāng)前版本暫未直接展示workflow流程設(shè)計界面,但憑借其強大的功能集成和易用性設(shè)計,我們相信未來版本中將會引入更多高級功能,包括workflow流程編輯器等,以進一步提升用戶的開發(fā)體驗和智能體的智能化水平。
6.訊飛的星火友伴
網(wǎng)址:
https://xinghuo.xfyun.cn/botcenter/createbot
訊飛科技,以其深厚的AI技術(shù)底蘊,攜手星火V3.0這一強大引擎,精心打造了一個專注于虛擬人格GPTs應(yīng)用的創(chuàng)新平臺。該平臺不僅代表了訊飛在人工智能領(lǐng)域的又一里程碑式成果,更是為探索個性化智能交互體驗開辟了全新的道路。
智能體中心,是由訊飛官方精心設(shè)計的虛擬人格模板。這些模板各具特色,涵蓋了從親切友善的客服助手到風(fēng)趣幽默的聊天伙伴,再到專業(yè)嚴(yán)謹(jǐn)?shù)念檰枌?dǎo)師等多種角色設(shè)定。
用戶可根據(jù)自身需求與偏好,輕松選擇一款合適的模板作為起點,也可以通過平臺的強大功能進行二次改造與個性化定制。
7.智譜
網(wǎng)址:
https://chatglm.cn/main/toolsCenter
智譜清言推出的Agent生成器,在提供基礎(chǔ)智能體生成能力的同時,獨具特色地支持開發(fā)者通過API調(diào)用方式靈活使用智能體。
該API廣泛覆蓋清言C端頁面的核心功能,包括文本對話、文生圖、圖片解讀、聯(lián)網(wǎng)搜索、文檔解析、Python代碼執(zhí)行及外部API調(diào)用等。
在智能體中心,熱門智能體琳瑯滿目,既有官方精心打造的,也有個人開發(fā)者熱情貢獻的。這些智能體緊貼時事熱點,如高考志愿填報助手便是一例,彰顯了其高度的實時性和實用性。此外,分類上與其他平臺相似,涵蓋了工具類(搜索、修圖、數(shù)據(jù)分析等)、娛樂類(搞笑、角色對話)及生活類(搭配選擇)等多個領(lǐng)域,滿足不同用戶的多樣化需求。
04 Agent框架總結(jié)
單智能體= 大語言模型(LLM) 觀察(obs) 思考(thought) 行動(act) 記憶(mem)
多智能體=智能體 環(huán)境 SOP 評審 通信 成本
多智能體優(yōu)點:
多視角分析問題:雖然LLM可以扮演很多視角,但會隨著system prompt或者前幾輪的對話快速坍縮到某個具體的視角上;
復(fù)雜問題拆解:每個子agent負(fù)責(zé)解決特定領(lǐng)域的問題,降低對記憶和prompt長度的要求;
可操控性強:可以自主的選擇需要的視角和人設(shè);
開閉原則:通過增加子agent來擴展功能,新增功能無需修改之前的agent;
(可能)更快的解決問題:解決單agent并發(fā)的問題;
缺點:
成本和耗時的增加;
交互更復(fù)雜、定制開發(fā)成本高;
簡單的問題single Agent也能解決;
多智能體能解決的問題:
解決復(fù)雜問題;
生成多角色交互的劇情;
Multi-Agent并不是Agent框架的終態(tài),Multi-Agent框架是當(dāng)前有限的LLM能力背景下的產(chǎn)物,更多還是為了解決當(dāng)前LLM的能力缺陷,通過LLM多次迭代、彌補一些顯而易見的錯誤,不同框架間仍然存在著極高的學(xué)習(xí)和開發(fā)成本。隨著LLM能力的提升,未來的Agent框架肯定會朝著更加的簡單、易用的方向發(fā)展。
05 能做什么
游戲場景(npc對話、游戲素材生產(chǎn))、內(nèi)容生產(chǎn)、私域助理、OS級別智能體、部分工作的提效
多agent應(yīng)該像人類的大腦一樣,分工明確、又能一起協(xié)作,比如,大腦有負(fù)責(zé)視覺、味覺、觸覺、行走、平衡,甚至控制四肢行走的區(qū)域都不一樣。
參考MetaGPT和AutoGen生態(tài)最完善的兩個Multi-Agent框架,可以從以下幾個角度出發(fā):
環(huán)境&通訊:Agent間的交互,消息傳遞、共同記憶、執(zhí)行順序,分布式agent,OS-agent
SOP:定義SOP,編排自定義Agent
評審:Agent健壯性保證,輸入輸出結(jié)果解析
成本:Agent間的資源分配
Proxy:自定義proxy,可編程、執(zhí)行大小模型
執(zhí)行架構(gòu)優(yōu)化:論文數(shù)據(jù)支撐
CoT to XoT,從一個thought一步act到一個thought多個act,從鏈?zhǔn)降乃伎挤绞降蕉嗑S度思考;
長期記憶的優(yōu)化:
具備個性化能力的agent,模擬人的回想過程,將長期記憶加入agent中;
多模態(tài)能力建設(shè):
agent能觀察到的不僅限于用戶輸入的問題,可以加入包括觸覺、視覺、對周圍環(huán)境的感知等;
自我思考能力:主動提出問題,自我優(yōu)化;
其他
部署:Agent以及workflow的配置化及服務(wù)化,更長遠的還需要考慮分布式部署
監(jiān)控:Multi-Agent可視化、能耗與成本監(jiān)控
RAG:解決語義孤立問題
評測:agent評測、workflow評測、AgentBench
訓(xùn)練語料:數(shù)據(jù)標(biāo)記、數(shù)據(jù)回流
業(yè)務(wù)選擇:Copilot 還是 Agent ?Single Agent 還是Multi-Agent?
聯(lián)系客服