中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
什么是RAG?私有化的wiki百科AI助手
相信大家在使用LLM的時(shí)候,經(jīng)常會(huì)把一些背景信息手動(dòng)喂給他,讓他根據(jù)這些信息進(jìn)行推理。這是一個(gè)典型的one shot learning的提示工程做法。

我們先做2個(gè)小實(shí)驗(yàn):
- 只提供一個(gè)項(xiàng)目名稱,讓LLM寫一個(gè)小說的世界觀設(shè)定
- 提供較為詳細(xì)的背景知識(shí),讓LLM寫一個(gè)小說的世界觀設(shè)定


1/ 實(shí)驗(yàn)

2/ 實(shí)驗(yàn)


很明顯,提供了詳細(xì)的背景知識(shí),LLM的回答會(huì)更為精準(zhǔn)。這背后是LLM的學(xué)習(xí)能力在起作用,LLM模型具備了one shot學(xué)習(xí)能力,輸入一個(gè)樣本就可以顯著提升效果。同時(shí),通過提示詞的方式進(jìn)行one-shot learning使得LLM更加易用。

很明顯,如何有效管理背景知識(shí)是用好LLM的一項(xiàng)必備技能。

那么,是不是每次都要自己去人工準(zhǔn)備背景知識(shí),然后手動(dòng)粘貼給LLM呢?當(dāng)然有更好的方案了 ↓


RAG
Retrieval-Augmented Generation
檢索增強(qiáng)生成


那么,什么是RAG?

我們從2份資料中Azure AI的技術(shù)文檔、Langchain的實(shí)現(xiàn)方案總結(jié)出精華要點(diǎn)。Azure AI 搜索中的檢索增強(qiáng)生成 (RAG),是這么描述的:

RAG架構(gòu)是一種通過添加信息檢索系統(tǒng)來增強(qiáng)大型語言模型的功能的方法。

簡單來說,信息檢索+生成式AI = RAG 。

大型語言模型就是本文提到的LLM,具體產(chǎn)品例如ChatGPT等。RAG,它允許你控制LLM在生成響應(yīng)時(shí)使用的基礎(chǔ)數(shù)據(jù)(知識(shí))。對(duì)于企業(yè)來說,RAG架構(gòu)意味著可以將生成式AI限制在企業(yè)私有內(nèi)容(知識(shí))中,這些內(nèi)容可以來自文檔、圖像、音頻和視頻等各種形式。

企業(yè)私有內(nèi)容是現(xiàn)代企業(yè)的核心競爭力的一種,RAG也就成為了完成此競爭壁壘的技術(shù)之一。


* 信息檢索系統(tǒng)關(guān)鍵技術(shù):

  • - 索引策略可以按照需要的頻率大規(guī)模加載和更新所有內(nèi)容。

  • - 查詢功能和相關(guān)性調(diào)整。系統(tǒng)應(yīng)以滿足 LLM 輸入的標(biāo)記長度要求所需的簡短格式返回相關(guān)結(jié)果。

  • - 與LLM的整合接口。

RAG 技術(shù)在 QA 問題中的案例 
github.com/Tongji-KGLLM/RAG-Survey


* RAG 典型的場景是基于知識(shí)的問答:

更進(jìn)一步的抽象就是有目標(biāo)數(shù)據(jù)來源的信息加工或處理。有目標(biāo)非常重要,這個(gè)目標(biāo)決定了LLM的選擇和知識(shí)的來源(準(zhǔn)確性、公開或私有),也決定了此類技術(shù)的產(chǎn)品化應(yīng)該如何設(shè)計(jì)體驗(yàn)。


* 在實(shí)際應(yīng)用中,RAG架構(gòu)面臨的挑戰(zhàn):

RAG-Survey 總結(jié):

  • 上下文長度。當(dāng)檢索內(nèi)容過多超出LLM上下文限制時(shí)怎么辦?

  • 抗噪聲能力。檢索到錯(cuò)誤內(nèi)容如何處理?如何過濾和驗(yàn)證檢索到的內(nèi)容?如何增強(qiáng)LLM的抗噪聲能力?

  • LLM的進(jìn)一步能力增強(qiáng)。用于檢索的LLM(用 LLM 的生成代替搜索),如何搜索 LLM 的記憶、LLM評(píng)估檢索能力等等。



RAG 范式對(duì)比圖
github.com/Tongji-KGLLM/RAG-Survey


*RAG的產(chǎn)品化:

RAG-Survey 也研究了RAG的設(shè)計(jì)模式,抽象出了涉及到的功能模塊,可作為進(jìn)一步設(shè)計(jì)RAG產(chǎn)品的參考。



* 在實(shí)際應(yīng)用中,涉及到的幾個(gè)重點(diǎn)問題:

# 塊大小 The Chunk Size

RAG系統(tǒng)應(yīng)該支持靈活的分塊方式,并支持添加上下文,防止信息丟失。一般分塊過程就是文本切割過程,粗暴地切割容易導(dǎo)致信息表達(dá)不完整或者歧異的情況發(fā)生。理想的分塊應(yīng)該像維基百科一樣,完整表達(dá)某個(gè)概念。

> 在構(gòu)建知識(shí)庫時(shí),分塊后的數(shù)據(jù),應(yīng)該如何評(píng)估質(zhì)量?當(dāng)RAG獲得對(duì)應(yīng)問題的分塊后,如何選擇適合的?

# top_k

RAG系統(tǒng),一般使用top_k來決定將多少個(gè)得分最高的塊輸入到LLM中。

> top_k是一個(gè)固定的數(shù)字,是否可以采用動(dòng)態(tài)的數(shù)字?


# 語義搜索 

向量的相似性可以用來比較文本的相似程度。但這個(gè)方案是有局限性的,因?yàn)槲覀儾恢老蛄刻崛×四男┬畔?,以及這些信息在向量中的內(nèi)在邏輯是什么。因此,語義相似性搜索有時(shí)可能會(huì)錯(cuò)過目標(biāo)。假設(shè)語義搜索總能獲得合理的結(jié)果是不現(xiàn)實(shí)的。

> 得分最高一般是一個(gè)相似性的數(shù)值,好的答案可能在top_k尾部。


# 世界知識(shí) World Knowledge

有一個(gè)例子,作者提到他正在構(gòu)建一個(gè)哈利·波特問答系統(tǒng)。將所有的哈利·波特故事導(dǎo)入了一個(gè)向量數(shù)據(jù)庫。現(xiàn)在,然后問一個(gè)問題:一只狗有幾個(gè)頭?

很可能,系統(tǒng)會(huì)回答三個(gè),因?yàn)橛刑岬揭恢挥腥齻€(gè)頭的巨大狗,而系統(tǒng)不知道一只普通狗可能有幾個(gè)頭。

::
::要清楚RAG系統(tǒng)的運(yùn)行邏輯,不要讓LLM的(幻覺)推理誤導(dǎo)了你。RAG系統(tǒng)應(yīng)該提供靈活地知識(shí)切換和來源提示功能。知識(shí)來源:公共、通用的知識(shí)庫和私有的、獨(dú)家的垂直知識(shí)庫。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
純干貨全面解讀AI框架RAG
幾分鐘開發(fā) AI 應(yīng)用成為可能,為什么說大模型中間件是 AI 必備軟件?
如何為ChatGPT/LLM大語言模型添加額外知識(shí)?
中金 | AI Answer:大模型助力B端落地先行范式
下一代AI系統(tǒng)基石:知識(shí)圖譜將何去何從?
清華大學(xué)劉知遠(yuǎn):在深度學(xué)習(xí)時(shí)代用HowNet搞事情
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服