Chatgpt發(fā)布了GPTs,釘釘發(fā)布了AI助理,在AI時代 AI agent(智能體)是大模型落地業(yè)務(wù)場景的主流形式,那什么是AI Agent?
01
—
什么是AI Agent?
AI Agent是指人工智能代理(Artificial Intelligence Agent)是一種能夠感知環(huán)境進行自主理解,進行決策和執(zhí)行動作的智能體。AI Agent具備通過獨立思考、調(diào)用工具逐步完成給定目標的能力。不同于大模型的區(qū)別在于,大模型與人類的交互通過提示詞(Prompt)實現(xiàn),用戶的提示詞是否清晰明確會影響大模型的效果。而AI Agent僅需要給定一個,就能夠?qū)崿F(xiàn)針對目標進行獨立思考并完成目標任務(wù)。
大模型在進行訓(xùn)練的龐大數(shù)據(jù)中包含了各種數(shù)據(jù)以及大量的人類行為數(shù)據(jù),讓大模型具備了模擬人類的交互以及隨著模型的不斷增大,大模型涌現(xiàn)出了上下文學(xué)習(xí)能力、思維鏈、推理能力等類似人類思考方式的能力。而大模型同時也存在很多的問題,如幻覺、上下文限制等問題。因此將大模型作為AI Agent的核心大腦,實現(xiàn)將復(fù)雜任務(wù)拆解成可以實現(xiàn)的子任務(wù)等能力,構(gòu)成具備自主思考決策和執(zhí)行任務(wù)的智能體。
02
—
AI Agent系統(tǒng)架構(gòu)
一個基于大模型的AI Agent系統(tǒng)可以拆分 LLM(大模型)、記憶(Memory)、任務(wù)規(guī)劃(Planning)以及工具使用(Tool) 的集合。在LLM為基礎(chǔ)的AI Agent系統(tǒng)中,大模型為AI Agent系統(tǒng)的大腦負責計算,并需要其他組件進行輔助。
1. 規(guī)劃(Planning)
①、對需要更多步驟的復(fù)雜任務(wù),AI Agent 能夠調(diào)用LLM通過思維鏈能力進行任務(wù)分解,在AI Agent架構(gòu)中,任務(wù)的分解和規(guī)劃是基于大模型的能力來實現(xiàn)的,大模型的思維鏈(Chain Of Thought,COT)能力通過提示模型逐步思考,將大型任務(wù)分解為較小的、可管理的子目標,以便高效的處理復(fù)雜任務(wù)。
②、通過反思和自省框架,AI Agents可以不斷提升任務(wù)規(guī)劃能力,AI Agent 可以對過去的行為進行自我批評和反省,從錯誤中吸取經(jīng)驗教訓(xùn),并對未來的行動進行分析、總結(jié)、提煉和完善,從而提高最終結(jié)果的質(zhì)量。自省框架使AI Agent能夠修正之前的決策,從而不斷優(yōu)化。這種反思和細化可以幫助 Agents 提高自身的智能和適應(yīng)性。
2. 記憶 (Memory)
①、短期記憶:對AI Agent智能體系統(tǒng)的所有輸入會成為系統(tǒng)的短期記憶,所有上下文學(xué)習(xí)都是依賴模型的短期記憶能力進行的。短期記憶受到有限上下文窗口長度的限制,不同的模型的上下文窗口限制不同。
②、長期記憶:AI Agent在完成目標時,需要查詢的外部向量數(shù)據(jù)庫成為系統(tǒng)的長期記憶。長期記憶使得 AI Agents 能夠長期保存和調(diào)用無限信息的能力。外部的向量數(shù)據(jù)庫可以通過快速檢索進行訪問。AI Agent主要通過長期以及完成很多復(fù)雜任務(wù),如閱讀PDF、知識庫等。
③、向量數(shù)據(jù)庫通過將數(shù)據(jù)轉(zhuǎn)化為向量存儲。
3. 工具(Tools)
①、AI Agent能夠使用外部工具API拓展模型能力,以獲取大模型以外的能力和信息。如預(yù)定日程、設(shè)置待辦、查詢數(shù)據(jù)等、
②、類GPT等大模型也更新了插件的功能,能夠調(diào)用插件訪問最新信息或者特定數(shù)據(jù)源,但是需要用戶針對提問問題提前選擇需要使用的插件,無法做到自然地回答問題。AI Agent可以自動調(diào)用工具使用,根據(jù)規(guī)劃獲取的每一步任務(wù)判斷是否需要調(diào)用外部工具來完成該任務(wù),并獲取工具API接口返回的信息給到大模型進行下一步任務(wù)。
聯(lián)系客服