中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
新趨勢!吳恩達(dá)開始強(qiáng)推Agent工作流;智能體平臺(tái)深度體驗(yàn)報(bào)告;GPTs可能要爛尾??;萬字技術(shù)解析 | ShowMeAI日?qǐng)?bào)


最近一兩周還算平靜。國內(nèi) Kimi 站在了輿論風(fēng)口 ? 專題日?qǐng)?bào),美國最吸睛的是 Inflection AI、Stability AI 兩家初創(chuàng)公司的人事變動(dòng)。

其他就是各家大模型和產(chǎn)品的上新迭代。頗有點(diǎn)春光漸暖、萬物勃發(fā)的意象啦 ??

國內(nèi)

?? 知乎  |  發(fā)布「發(fā)現(xiàn)·AI搜索」功能:在「2024知乎發(fā)現(xiàn)大會(huì)」上,知乎創(chuàng)始人、董事長兼 CEO 周源發(fā)布了全新AI功能「發(fā)現(xiàn)·AI搜索」,以社區(qū)可信賴內(nèi)容為來源,給用戶帶來集搜索、實(shí)時(shí)問答和追問功能于一體的全新體驗(yàn)  ? 詳情

?? 淘天 |  即將發(fā)布自研大模型「淘寶星辰」:淘寶天貓集團(tuán)自研大模型「淘寶星辰」官網(wǎng)已經(jīng)準(zhǔn)備好了,或?qū)⒃诓痪谜綄?duì)外開放。淘寶星辰是淘天集團(tuán)公開的首個(gè)自研大模型,可以為商家提供文案編寫、商家運(yùn)營、數(shù)據(jù)分析、市場營銷策略等智能服務(wù),也可以為消費(fèi)者提供生活服務(wù)推薦、商品智能搜索、商品喜好推薦等智能服務(wù)   ? 詳情

?? 360  |  發(fā)布「360安全大模型3.0」:該模型在構(gòu)建框架時(shí)充分參考人類大腦的運(yùn)行邏輯,不僅實(shí)現(xiàn)安全基礎(chǔ)知識(shí)問答、初級(jí)腳本分析等基礎(chǔ)能力,而且錨定安全行業(yè)痛點(diǎn)、革新安全能力體系、引領(lǐng)未來安全實(shí)戰(zhàn)   ? 詳情

?? 騰訊  |  混元大模型參數(shù)規(guī)模擴(kuò)展至萬億騰訊在財(cái)報(bào)中首度披露騰訊混元采用混合專家模型結(jié)構(gòu),已擴(kuò)展為萬億參數(shù)規(guī)模。目前,騰訊混元大模型已具備文生圖、視頻生成等能力。騰訊內(nèi)部超過400個(gè)業(yè)務(wù)及場景已接入騰訊混元測試  ? 詳情

美國

?? Apple  |  尋求操作系統(tǒng)的外部大模型合作方:最近陸續(xù)有消息爆出,蘋果公司正在與多家大模型公司洽談,尋求外部大模型為其 iPhone 設(shè)備提供生成式AI能力。從目前透露的消息來看,海外合作方選了 Google Gemini,中國選了百度   ? 詳情

?? OpenAI  |  開始向好萊塢推銷 Sora:OpenAI  在美國洛杉磯與好萊塢制片廠、媒體高管、人才經(jīng)紀(jì)公司舉行會(huì)議,希望同娛樂行業(yè)建立合作伙伴關(guān)系,并鼓勵(lì)電影制作人將 OpenAI Sora 整合到其創(chuàng)作過程中,還發(fā)布了與藝術(shù)家們合作生成的視頻  ? 詳情

?? Mistral AI  | 突然宣布開源新模型:前幾天在一場黑客松活動(dòng)現(xiàn)場,Mistral AI 突然宣布開源  Mistral 7B v0.2 Base Model,它是 Mistral-7B-Instruct-v0.2 背后的原始預(yù)訓(xùn)練模型。此次更新主要包括三個(gè)方面:將 8K 上下文提到了 32K;Rope Theta = 1e6;取消滑動(dòng)窗口  ? 詳情

?? Stability AI  |  核心技術(shù)團(tuán)隊(duì)和 CEO 紛紛離職:公司發(fā)布官方公告,稱 Emad Mostaque 辭去 CEO 及公司董事會(huì)職務(wù),以追求去中心化的AI。加上此前參與 Stable Diffusion 模型研發(fā)的關(guān)鍵AI研究員都已離開,公司已經(jīng)相繼失去了十幾位技術(shù)人才,風(fēng)雨飄搖   ? 詳情

?? Inflection AI  |  賣身微軟談了個(gè)好價(jià)錢微軟官方發(fā)文宣布創(chuàng)業(yè)公司 Inflection AI 的 CEO 、首席科學(xué)家、核心科研團(tuán)隊(duì)一并入職微軟,幾乎掏空了這家公司。隨后,知情人士透露,微軟已同意向 Inflection AI 支付約6.5億美元,以許可協(xié)議的形式使 Inflection AI的模型可以在微軟 Azure 云服務(wù)上銷售,幫助其投資者獲得適度的資本回報(bào)。此外,微軟還同意向 Inflection AI 支付1.4億美元的信貸額度和約 3000 萬美元的大模型相關(guān)權(quán)利費(fèi)用  ? 詳情



?? OpenAI GPTs 項(xiàng)目要爛尾?「小甜甜」短短兩個(gè)月已成「牛夫人」

https://community.openai.com/t/techcrunch-article-openais-chatbot-store-is-filling-up-with-spam/692772

2023年11月,OpenAI 上線 GPTs 功能,全球AI開發(fā)者聞風(fēng)而動(dòng);2024年1月,OpenAI 正式上線 GPT Store,開啟了構(gòu)建AI 智能體的風(fēng)潮。

然而,被開發(fā)者們寄予厚望的 GPT Store 情況不太樂觀,似乎要跟 ChatGPT Plugins 一樣以「爛尾」收?qǐng)觥?/strong>

The Information 和 TechCrunch 近期都發(fā)文指出了 OpenAI GPT Store 存在的一些亂項(xiàng),主要是平臺(tái)的垃圾 GPTs 太多了!

  1. 侵犯知識(shí)產(chǎn)權(quán):很多 GPTs 是關(guān)于熱門電影、電視劇、電子游戲的,這些沒有經(jīng)過授權(quán)的開發(fā)行為已經(jīng)游走在法律邊緣了。

  2. 挑戰(zhàn)學(xué)術(shù)倫理:有些 GPTs 標(biāo)明可以完成論文的不正當(dāng)抄襲和改寫,甚至宣稱可以繞過AI內(nèi)容檢測器,這嚴(yán)重違背了學(xué)術(shù)道德。

  3. 冒充名人/官方:大量 GPTs 冒充公眾人物和知名企業(yè),讓用戶誤以為是官方運(yùn)營或認(rèn)可的。

  4. 越獄模型泛濫:一些模型聲稱能夠繞過 OpenAI的內(nèi)容審查規(guī)則,生成諸如暴力、色情、仇恨等「越獄」內(nèi)容 (實(shí)測做不到)。


當(dāng)然,更棘手的是 OpenAI 與開發(fā)者們的關(guān)系正在惡化。官方糟糕的運(yùn)營政策和表現(xiàn),讓開發(fā)者們的期待重重摔在了地上。概括起來有兩點(diǎn):

  1. 有人敗興而歸:開發(fā)者制作的 GPTs 沒什么人使用,官方不分配流量也沒有渠道進(jìn)行營銷,一段時(shí)間后就放棄了。而使用者進(jìn)入到 GPT Store 嘗試了幾個(gè)垃圾 GPTs 后也就興致缺缺地離開了。

  2. 有人胡作非為:部分開發(fā)者「歪腦筋」太多了,聊幾句之后讓 GPTs 引導(dǎo)用戶去第三方付費(fèi),有些甚至是公然剽竊站內(nèi)已有的 GPTs。

  3. 官方?jīng)]有回應(yīng):一方面,開發(fā)者對(duì) OpenAI 「暴殄天物」的行為感到失望,擁有全世界最強(qiáng)的大模型,卻在產(chǎn)品設(shè)計(jì)方面如此拉跨;另一方面,這樣一款聲勢浩大的產(chǎn)品,竟然沒有設(shè)置 GPTs 開發(fā)門檻,也沒有優(yōu)質(zhì)內(nèi)容激勵(lì)措施,而且無力應(yīng)對(duì)審查挑戰(zhàn),OpenAI 似乎揭開了自己的短板,又一次



?? (目前) 最完整的 AI Agent 開發(fā)體驗(yàn)報(bào)告:除了 GPTs,這10個(gè)智能體平臺(tái)也很好用

補(bǔ)充一份背景:在比較寬泛的語境里,AI Agent = 智能體 = GPTs = Bot,都是基于大模型能力構(gòu)建完成特定任務(wù)的聊天機(jī)器人,比如小說寫作、新聞搜集、人物對(duì)話等等。

如果我想創(chuàng)建一個(gè)比較專業(yè)的智能體,應(yīng)該選擇哪個(gè)平臺(tái)呢?Coze,扣子,Dify,天工 SkyAgents… 它們有什么區(qū)別 & 有哪些操作注意事項(xiàng)?

這篇文章可以解答你這些疑問?。?/p>

作者是一名資深的 AI Agent 開發(fā)者和用戶,在深度使用十多款 Agent 創(chuàng)作平臺(tái)后,詳細(xì)記錄了它們的特點(diǎn)、優(yōu)勢和局限性。滿滿都是實(shí)戰(zhàn)經(jīng)驗(yàn)哇~  ? 這篇可以收藏

分類

  1. 第一類 | AI+插件coze / 扣子、Dify、百度 · 千帆 AppBuilder、昆侖萬維 · 天工 SkyAgents、釘釘 · AI 助理  |  產(chǎn)品邏輯都是通過 Prompt、插件等給大語言模型帶上附加功能,操作有相似之處,使用門檻不高 。
  • 插件功能:coze/扣子的插件最豐富,千帆 AppBuilder 的圖像識(shí)別類插件最豐富

  • 工作流功能:天工 SkyAgents 工作流提供了一些預(yù)設(shè)的大模型功能,釘釘 AI 助理工作流嵌入了一些釘釘內(nèi)部功能,Dify 應(yīng)該是準(zhǔn)備中

  • Multi-Agent 模式:目前只有 coze/扣子提供

  • 發(fā)布方式:Dify、千帆 AppBuilder、天工 SkyAgents  都可以生成網(wǎng)頁,扣子可以發(fā)布到飛書,釘釘 AI 助理必須在釘釘內(nèi)部使用

  1. 第二類 | 以工作流為核心Botpress、Voiceflow、Zapier  |  自動(dòng)化流程的工具,只不過也可以提供 AI 作為工作流的一部分,適用于創(chuàng)建復(fù)雜工作流的需求 。

  2. 第三類 | 關(guān)注任務(wù)分解Ai Agent、Reworkd AI  |  能夠自己完成任務(wù)的步驟分解,主動(dòng)跟用戶互動(dòng)來明確執(zhí)行流程。


第一類 | AI + 插件

coze / 扣子

優(yōu)點(diǎn):① 綜合能力和易用性排到前列;② 設(shè)計(jì)流程靈活,無需預(yù)先選擇bot分類;③ 頁面即使空空如也也能夠進(jìn)行對(duì)話;

缺點(diǎn):① 工作流調(diào)用不穩(wěn)定,存在不按指令調(diào)動(dòng)或調(diào)用超時(shí)等問題;② 多Agent模式下意圖識(shí)別可能存在問題 ;③ 當(dāng)前知識(shí)庫作為一個(gè)單獨(dú)節(jié)點(diǎn)輸入輸出太受限。


Dify

優(yōu)點(diǎn):① 多模型輸出結(jié)果對(duì)比,幫助用戶選擇最佳答案;② 自動(dòng)生成變量,簡化工作流設(shè)計(jì);③ 開啟「標(biāo)注回復(fù)」功能,可以在用戶重讀輸入時(shí)提高響應(yīng)速度,也可以手動(dòng)編輯特定標(biāo)準(zhǔn)回復(fù)。


千帆 AppBuilder

優(yōu)點(diǎn):① 提供了多種圖像識(shí)別插件;② 發(fā)布渠道友好,支持個(gè)人認(rèn)證的微信公眾號(hào)。


天工 SkyAgents

優(yōu)點(diǎn):① 提供了額外的信息處理節(jié)點(diǎn),幫助構(gòu)建更智能的工作流;② 部分操作預(yù)設(shè)了 Prompt,簡化操作流程;③ 界面設(shè)計(jì)對(duì)用戶操作比價(jià)友好。

缺點(diǎn):① 創(chuàng)建好的規(guī)劃無法在當(dāng)前頁面測試,測試環(huán)節(jié)不夠直觀,可能影響調(diào)試效率。


釘釘AI助理

優(yōu)點(diǎn):① 提供了詳細(xì)的使用教程和操作示例;② 功能模塊與釘釘生態(tài)緊密結(jié)合,適合企業(yè)內(nèi)部使用;③ 業(yè)務(wù)工作流實(shí)現(xiàn)自動(dòng)化,特別適合小型創(chuàng)業(yè)團(tuán)隊(duì) 。

缺點(diǎn):① 功能受限于釘釘平臺(tái)。


第二類 | 以工作流為核心

Botpress

優(yōu)點(diǎn):① 能夠?qū)崿F(xiàn)復(fù)雜的工作流和邏輯跳轉(zhuǎn),適合高度定制化的需求;② 支持持續(xù)接收用戶輸入并提供多樣功能,增強(qiáng)了bot的交互性。

缺點(diǎn):① 學(xué)習(xí)門檻較高,產(chǎn)品設(shè)計(jì)可能顯得混亂;② 參數(shù)配置分散,用戶可能需要花費(fèi)更多時(shí)間來熟悉和設(shè)置。


Voiceflow (優(yōu)點(diǎn)同上)


Zapier

優(yōu)點(diǎn):① 同上;② Prompt 格式全面,Actions 板塊進(jìn)入工作流設(shè)置;③ 工作流和能接入的 App 非常豐富。


第三類 | 關(guān)注任務(wù)分解

Reworkd AI

優(yōu)點(diǎn):① 能夠自動(dòng)進(jìn)行任務(wù)分解,提供分階段的結(jié)果輸出;② 界面直觀,允許用戶看到AI的工作流程 。

缺點(diǎn):① 不能根據(jù)輸入依次執(zhí)行任務(wù),只能執(zhí)行當(dāng)前一次輸入的任務(wù)拆分。


Ai Agent

優(yōu)點(diǎn):① 同上;② 允許用戶在任務(wù)后添加補(bǔ)充任務(wù),增強(qiáng)了靈活性。

缺點(diǎn):① 同上。



?? 吳恩達(dá)強(qiáng)推!今年 AI Agent Workflow (智能體工作流) 將成為重要趨勢

https://www.deeplearning.ai/the-batch/issue-241

補(bǔ)充一份背景:吳恩達(dá)(Andrew Ng)是AI領(lǐng)域最權(quán)威的學(xué)者之一,曾擔(dān)任斯坦福大學(xué)副教授,是 Google Brain 的創(chuàng)建者和領(lǐng)導(dǎo)者之一,也曾回國擔(dān)任百度首席科學(xué)家并領(lǐng)導(dǎo) Baidu Brain 項(xiàng)目,離職后創(chuàng)辦 DeepLearning.AI 致力教育和研究。此外,他也是知名在線教育平臺(tái) Coursera 聯(lián)合創(chuàng)始人。

要多留心上條提到的 WorkFlow (工作流) 功能了!

最近,吳恩達(dá)分享了團(tuán)隊(duì)關(guān)于 Agent Workflow (智能體工作流) 的研究成果,預(yù)測這將成為今年的流行趨勢!

?? 如上圖所示,零樣本 (Zero-shot) 模式下的 GPT-4 在 HumanEval (代碼生成測評(píng)數(shù)據(jù)集) 上的準(zhǔn)確率也只有 67.0%,經(jīng)過 Agent Workflow 加持的 GPT-3.5 準(zhǔn)確率能飆升到驚人的 95.1%

也就是說,Agent Workflow 能帶來顯著的效果提升。


文章寫作為例。零樣本(Zero-Shot)指的是大語言模型在沒有進(jìn)行迭代修正的情況下直接生成最終輸出,類似于人類在不回退刪除的情況下一次性寫完一篇文章。

但是,更符合人類寫作經(jīng)驗(yàn)的模式,是拆分成多個(gè)步驟,例如規(guī)劃大綱、檢索資料、撰寫初稿、審閱初稿、修訂草稿等,也就是上文提到的 Agent Workflow (智能體工作流)。


此外,吳恩達(dá)簡單列舉了幾種團(tuán)隊(duì)驗(yàn)證有效的 Agent 設(shè)計(jì)模式,并預(yù)告會(huì)進(jìn)行詳細(xì)介紹,感興趣關(guān)注一下他的 X 賬號(hào)叭 ??

  • 反思(Reflection):讓大語言模型對(duì)自己的結(jié)果檢查改進(jìn)

  • 使用工具(Tool use):讓大語言模型調(diào)用外部工具,如網(wǎng)絡(luò)搜索、代碼執(zhí)行等

  • 規(guī)劃(Planning):讓大語言模型自己設(shè)計(jì)一個(gè)多步驟的計(jì)劃來達(dá)成目標(biāo)

  • 多智能體協(xié)作(Multi-agent collaboration):多個(gè) AI 智能體協(xié)同工作,分配任務(wù),討論和辯論想法,寫作得到更好的結(jié)果



?? 如何把握 AI Agent 的創(chuàng)業(yè)時(shí)機(jī),以及當(dāng)下必知的行業(yè)共識(shí)

但過去一年時(shí)間,Agent 的飛速發(fā)展超出了我們預(yù)期,并且快速取得了行業(yè)共識(shí),成為承載大模型應(yīng)用的基本范式。圍繞 Agent 正在逐步形成一套系統(tǒng)的方法論,和吸引了無數(shù)開發(fā)者、創(chuàng)業(yè)公司、資本及巨頭的關(guān)注。

如果你想快速了解行業(yè)發(fā)展脈絡(luò)、跟上行業(yè)共識(shí),那最少需要了解以下內(nèi)容:

AI Agent 發(fā)展大事記

  • 2023年3月,微軟發(fā)布 Microsoft 365 Copilot,提示了一種基于 LLM 的應(yīng)用開發(fā)范式,也就是今天形成行業(yè)共識(shí)的 Agent。

  • 2023年4月,以 AutoGPT 為代表的 Autonomous Agent 熱度快速躥升,同期比較受關(guān)注的類似項(xiàng)目還有 TaskMatrix.ai、HuggingGPT、AgentGPT、Toolformer、BabyAGI 等等。

  • 2023年6月,Lilian Weng 發(fā)布知名博文「LLM Powered Autonomous Agents」,進(jìn)一步推升了 Agent 的熱度。

  • 隨后,Multi-Agent 框架相繼發(fā)布并展示了解決復(fù)雜問題的能力,目前比較火的包括 Camel、MetaGPT、AutoGen。

  • 2023年11月,OpenAI 舉辦開發(fā)者大會(huì) DevDay,推出官方 Agent 開發(fā)框架 Assistant API,使開發(fā)者能基于 GPT 模型開發(fā) Agent。

  • 2024年1月,OpenAI 正式發(fā)布定制化 GPTs 和 GPT mentions,并隨后上線 GPTStore。字節(jié)跳動(dòng)海外版 Coze / 國內(nèi)版扣子、Dify、百度千、天工、釘釘?shù)葒a(chǎn) Agent 開發(fā)部署平臺(tái)陸續(xù)被廣大開發(fā)者熟知。


11 個(gè)頂級(jí)開源 Agent 框架

  1. AutoGPT:基于中島洋平的論文開發(fā),是一個(gè)用于構(gòu)建和運(yùn)行定制AI代理的工具包,使用OpenAI的GPT-4和GPT-3.5大型語言模型。
    https://github.com/Significant-Gravitas/AutoGPT

  2. BabyAGI:中山的任務(wù)驅(qū)動(dòng)自主代理的簡化版本,這個(gè)Python腳本只有140行代碼,使用OpenAI和向量數(shù)據(jù)庫來創(chuàng)建、優(yōu)先處理和執(zhí)行任務(wù)。
    https://github.com/yoheinakajima/babyagi

  3. SuperAGI:AutoGPT的更靈活、用戶友好的替代品,包含構(gòu)建、維護(hù)和運(yùn)行自己代理所需的一切,包括插件和一個(gè)云版本。
    https://github.com/TransformerOptimus/SuperAGI

  4. ShortGPT:一個(gè)框架,允許使用大型語言模型來簡化視頻創(chuàng)作、語音合成和編輯等復(fù)雜任務(wù)
    https://github.com/RayVentura/ShortGPT

  5. ChatDev:被打造成「一個(gè)虛擬軟件公司」,使用多個(gè)代理人扮演傳統(tǒng)開發(fā)組織中的不同角色,合作處理各種任務(wù)。
    https://github.com/OpenBMB/ChatDev

  6. AutoGen:微軟開發(fā)的用于開發(fā)和部署多個(gè)代理的開源框架,這些代理可以共同工作以自主實(shí)現(xiàn)目標(biāo)。
    https://github.com/microsoft/autogen

  7. MetaGPT:模仿傳統(tǒng)軟件公司結(jié)構(gòu)的框架,代理被分配為產(chǎn)品經(jīng)理、項(xiàng)目經(jīng)理和工程師的角色,并協(xié)作完成用戶定義的編碼任務(wù)。
    https://github.com/geekan/MetaGPT

  8. camel:早期的多智能體框架之一,采用獨(dú)特的角色扮演設(shè)計(jì),使多個(gè)智能體能夠相互通信和合作
    https://github.com/camel-ai/camel

  9. Loop GPT:Toran Bruce Richards 的 AutoGPT 的一個(gè)迭代版本,改進(jìn)了對(duì) GPT-3.5 的支持,集成和自定義代理能力。
    https://github.com/farizrahman4u/loopgpt/tree/main

  10. JARVIS:以 ChatGPT 作為其「決策引擎」,處理任務(wù)規(guī)劃、模型選擇、任務(wù)執(zhí)行和內(nèi)容生成
    https://github.com/microsoft/JARVIS

  11. OpenAGI:一個(gè)開源的AGI(人工通用智能)研究平臺(tái),結(jié)合了小型專家模型和來自任務(wù)反饋的強(qiáng)化學(xué)習(xí)(RLTF)來改進(jìn)它們的輸出。
    https://github.com/agiresearch/OpenAGI


LLM based Agent 初創(chuàng)公司分類

中間層infra:這類公司專注于提供實(shí)用的 Agent 框架,降低開發(fā) Agent 的復(fù)雜性,并促進(jìn) Agent 間的合作。

  • 拿到知名機(jī)構(gòu)投資的代表項(xiàng)目包括 AutoGPT、Imbue、Voiceflow、Fixie AI、Reworked、Cognosys、Induced ai等。

Vertical Agent:這類公司深入特定的行業(yè)領(lǐng)域,理解專家的工作流程,并運(yùn)用 Agent 的思路來設(shè)計(jì)產(chǎn)品。

  • 拿到知名機(jī)構(gòu)投資的代表項(xiàng)目包括:Dropzone(安全領(lǐng)域)、Middleware(大模型可觀察性領(lǐng)域)、Parcha(Fintech領(lǐng)域)、Luda(游戲領(lǐng)域)、Outbound AI(醫(yī)療領(lǐng)域)、Fine(軟件開發(fā)領(lǐng)域)。


創(chuàng)業(yè)建議

微軟亞研院首席研究經(jīng)理 譚旭

  • AI Agent 領(lǐng)域如何構(gòu)筑護(hù)城河:要深入到 AI Agent 各個(gè)環(huán)節(jié),提升其解決實(shí)際需求的能力,并在實(shí)際場景中得到優(yōu)化方向的反饋。但是,AI Agent領(lǐng)域目前缺乏一個(gè)評(píng)估體系,指導(dǎo)這個(gè)設(shè)計(jì)和優(yōu)化過程。

  • 阻礙相關(guān)研究落地的主因在于效果:目前唯一的瓶頸是現(xiàn)有研究效果無法達(dá)到落地指標(biāo),只有 AI 的效果能夠真正達(dá)到我們的需求標(biāo)準(zhǔn)時(shí),才會(huì)被大規(guī)模廣泛使用。

來也科技聯(lián)合創(chuàng)始人&CTO 胡一川

  • AI Agent 落地?cái)?shù)字員工時(shí)的挑戰(zhàn):① 模型的能力需要更強(qiáng),因?yàn)闃I(yè)務(wù)復(fù)雜度可能超出現(xiàn)有模型的能力;② 應(yīng)用生態(tài)需要更開放;③ 許多工作流程需要被優(yōu)化和重構(gòu),以適應(yīng) AI Agent 的運(yùn)作方式。

  • 開發(fā)者選擇大模型時(shí)的三個(gè)考量指標(biāo):① 效果考量,即需要在特定領(lǐng)域任務(wù)中表現(xiàn)出色;② 成本考量;③ 開源與閉源,服務(wù)B端客戶時(shí)需要結(jié)合開源模型建立數(shù)據(jù)閉環(huán)。

真格基金管理合伙人 戴雨森

  • 回溯移動(dòng)互聯(lián)時(shí)代,對(duì)于中國早期AI創(chuàng)業(yè)者的三條建議:① 要靈活,用動(dòng)態(tài)的眼光看待技術(shù)本身,適應(yīng)技術(shù)的高速發(fā)展變化;② 商業(yè)化應(yīng)先關(guān)注用戶新增,再思考用戶留存;③ 先關(guān)注用戶價(jià)值,再思考商業(yè)模式,如果產(chǎn)品能帶來用戶價(jià)值,就始終有辦法從中提取一部分成為商業(yè)化收入。

  • 創(chuàng)業(yè)公司如何把握入場時(shí)機(jī):① 創(chuàng)業(yè)需要尋找大趨勢和小拐點(diǎn)結(jié)合的時(shí)機(jī),然后迅速做出行動(dòng);② 從經(jīng)驗(yàn)注意的角度出發(fā),如果你相信一件事遲早會(huì)發(fā)生,那么剋有每隔五年嘗試一次。

真格基金EIR 季逸超

  • 不去搶有限的時(shí)間:讓用戶愿意為價(jià)值付費(fèi):① 在新平臺(tái)出現(xiàn)之前, To C 創(chuàng)業(yè)者都是在與 TikTok/抖音爭用戶的注意力和時(shí)間;② (爭不過) 所以,要尋找不需要長時(shí)間交互,但用戶愿意付費(fèi)的服務(wù)機(jī)會(huì);③ 也就是說,不再跟成熟的產(chǎn)品去搶占用戶有限的時(shí)間。

? 引用參考1   |   引用參考2  |  引用參考3  |  ? 引用參考4



?? 萬字長文:從第一性原理看大模型 Agent 技術(shù),掰開揉碎講技術(shù)演變的原理

補(bǔ)充一份背景:第一性原理 (First Principles) 是一種基本的、不可推導(dǎo)的命題或假設(shè),構(gòu)成了一個(gè)理論體系或解釋的基礎(chǔ)??梢岳斫鉃椤柑剿鲉栴}的本質(zhì)」。

想了解 Agent 技術(shù)原理但不想啃論文?那 @鄧范鑫 這次分享一定合你胃口!

視頻時(shí)長1個(gè)小時(shí),文稿字?jǐn)?shù)過萬,將近 40 份參考資料/文獻(xiàn),是 Agent 技術(shù)科普的入門必讀指南。

文章梳理了 Agent 技術(shù)的發(fā)展路徑,以及這條時(shí)間線上的主要研究和關(guān)鍵結(jié)論。脈絡(luò)清晰,環(huán)環(huán)相扣。此外,還介紹了通用智能原理、面向目標(biāo)架構(gòu)這個(gè)兩個(gè)根本性問題,以及基于的架構(gòu)缺陷和未來可能的發(fā)展方向  ? 點(diǎn)擊閱讀長文


開篇亮明觀點(diǎn):未來5到10年可能有一場大變局:99%的開發(fā)/設(shè)計(jì)/文字工作將被AI接管,人類開始進(jìn)入智能時(shí)代。而智能時(shí)代的核心載體,不是網(wǎng)站也不是 App,而是 Agent (智能體)。

LLM Agents 發(fā)展歷程

  • Prompt 工程:大模型剛出來的時(shí)候被當(dāng)作一種編程語言,用戶通過角色扮演、零樣本提示、少樣本提示等工程技巧,引導(dǎo)大模型的輸出。

  • Prompt 外掛:為了克服大模型自身的諸多局限性 (如不能及時(shí)更新知識(shí)、上下文有限等),用戶開始通過加入插件 (向量數(shù)據(jù)庫)、調(diào)用外部工具 (ChatGPT Plugins 開放體系) 來增強(qiáng)功能。

  • 分解與組合:大模型推理能力存在顯著天花板,因此完成復(fù)雜任務(wù)需要考慮執(zhí)行策略,比如分解和組合 (MapReduce 模式、思維鏈 CoT /思維樹 ToT / 思維圖 GoT、累計(jì)推理等)。

  • 反饋:任務(wù)的分解和組合策略缺少與外界互動(dòng)的能力,因此需要借鑒 ReACT 增加反饋機(jī)制,還可以借鑒強(qiáng)化學(xué)習(xí) Reflection 機(jī)制積累經(jīng)驗(yàn) → 對(duì)應(yīng) OpenAI 推出的 Funtion Calling。

  • Agent:2023年4月 AutoGPT 橫空出世,這種更徹底的技術(shù)變革正式宣布了 Agent  時(shí)代的到來。

  • Multi-Agent:多智能體也應(yīng)運(yùn)而生,比如「斯坦福小鎮(zhèn)」、MetaGPT、清華 ChatDev 等項(xiàng)目,都展示了多角色智能體在群體智能涌現(xiàn)方面的潛力

  • 技術(shù)發(fā)展脈絡(luò)與現(xiàn)狀:以上梳理了技術(shù)發(fā)展至今的脈絡(luò),不過現(xiàn)有大模型和 Agent 仍然面臨著諸多挑戰(zhàn)挑戰(zhàn)。


通用智能基本原理

  • 大腦的系統(tǒng)1和系統(tǒng)2:系統(tǒng)1 (直覺系統(tǒng)) 包含快速思考、神經(jīng)網(wǎng)絡(luò)連接主義、長期記憶、深度學(xué)習(xí)、亞符號(hào)、潛意識(shí)和非結(jié)構(gòu)化數(shù)據(jù);系統(tǒng)2 (理性系統(tǒng)) 包含意識(shí)、思考、符號(hào)主義、邏輯推理圖靈、機(jī)制結(jié)構(gòu)化和模型。

  • 在構(gòu)建 Agent 時(shí),可以參考這兩種系統(tǒng)的思維框架:在系統(tǒng)2中反復(fù)出現(xiàn)的行為會(huì)逐漸沉淀到系統(tǒng)1中,也就是同樣的動(dòng)作反復(fù)訓(xùn)練直至變成肌肉記憶和反射 →  稱為Shortcut。


面向目標(biāo)架構(gòu)

  • 隨著人類的生產(chǎn)方式的變化,軟件工程可能正在逐步演化為智能體工程 (Agent Engineering),即以AI為中心+人類做輔助。

  • 例如,傳統(tǒng)的用戶界面,由于其垂直的任務(wù)層級(jí)架構(gòu),每一層都需要人類逐一生成,未來這個(gè)過程可能會(huì)被智能體自主生成并改良。


前瞻性分析

  • Central Executive:提出建立中央執(zhí)行機(jī)構(gòu)的概念,以增強(qiáng)Agent的規(guī)劃和執(zhí)行能力,包括內(nèi)部加工過程的外部化。

  • Memory:強(qiáng)調(diào)記憶機(jī)制的重要性,包括記憶的內(nèi)化、遺忘功能,以及長短時(shí)記憶與工作記憶之間的關(guān)系。

  • Sensory:指出多模態(tài)輸入的必要性,以及時(shí)間感知在運(yùn)動(dòng)控制任務(wù)中的重要性,以及自上而下的機(jī)制問題。

  • Motor:討論運(yùn)動(dòng)控制的未來發(fā)展,包括層次化控制和數(shù)據(jù)化執(zhí)行,以及亞符號(hào)的控制方式。

  • Learning:強(qiáng)調(diào)Agent學(xué)習(xí)過程中對(duì)自身可靠性的判斷和權(quán)威性的重要性,以及模型的多樣性和解空間的擴(kuò)展。

  • World Models:提出構(gòu)建無矛盾、統(tǒng)一的世界模型的必要性,以及模型的推理能力和內(nèi)部思考機(jī)制。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服