中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
四、【轉(zhuǎn)】基于知識圖譜的推薦系統(tǒng)(KGRS)綜述
userphoto

2022.08.27 河北

關(guān)注

以下文章來源于AI自然語言處理與知識圖譜 ,作者Elesdspline

導(dǎo)語


   本文是2020年針對知識圖譜作為輔助信息用于推薦系統(tǒng)的一篇綜述。知識圖譜對于推薦系統(tǒng)不僅能夠進(jìn)行更精確的個性化推薦,而且對推薦也是具有可解釋性的,有跡可循。

   本文匯總了近些年來知識圖譜輔助推薦系統(tǒng)的一些研究工作,并按不同的方法進(jìn)行劃分類別(下圖是我根據(jù)論文畫出的大綱方法類別圖);除此之外,匯總了不同場景下的知識圖譜數(shù)據(jù)集,涵蓋7個場景;最后闡述了未來的一些可研究方向及趨勢。

                                                                        基于知識圖譜的推薦方法

一、背景知識


 推薦系統(tǒng)已經(jīng)廣泛應(yīng)用在實際生活中的很多場景,特別是個性化推薦系統(tǒng)已經(jīng)有越來越多的研究工作和落地實踐,但是仍然面臨著一些問題,例如數(shù)據(jù)稀疏、冷啟動等問題。

  說明:

  • 稀疏性問題: 實際場景中,用戶和物品的交互信息往往是非常稀疏的。如電影推薦中,電影往往成千上萬部,但是用戶打過分的電影往往只有幾十部。使用如此少的觀測數(shù)據(jù)來預(yù)測大量的未知信息,會極大增加過擬合的風(fēng)險。
  • 冷啟動問題: 對于新加入的用戶或者物品,其沒有對應(yīng)的歷史信息,因此難以進(jìn)行準(zhǔn)確的建模和推薦。

近年來,利用知識圖譜作為輔助信息生成推薦已經(jīng)引起了人們相當(dāng)大的興趣,這種方法不僅可以緩解上述問題,更準(zhǔn)確的進(jìn)行個性化推薦,而且可以對推薦的結(jié)果也是可解釋的,是有跡可循的。下面我們將分別來看一下這兩方面。

1.1 推薦系統(tǒng)

    推薦系統(tǒng)在實際生活中已經(jīng)有很多的應(yīng)用場景,比如我們所熟知的電影、音樂、POI、新聞、教育、書籍,購物等。

    推薦系統(tǒng)的目的旨在為 user (用戶) 推薦一個(或一系列)未觀測的 item (物品,電影,新聞等)?;静襟E如下:

  • 學(xué)習(xí) user 和 item 的向量表示
  • 根據(jù) 1 中的 user 和 item 向量表示,計算表示 user 對 item 的偏好得分,得分函數(shù)可以采用內(nèi)積、DNN等。
  • 基于 2 中計算的得分,進(jìn)行排序推薦。

   推薦系統(tǒng)主要包含以下三種方法:

  • Collaborative Filtering (CF): 基于協(xié)同過濾的推薦系統(tǒng),協(xié)同過濾算法是從相似度度量出發(fā),考慮 user 或者 item 之間的相似度進(jìn)行相關(guān)推薦,它比較常用的兩種方法是基于內(nèi)存(memory-based)和基于模型(model-based)的兩種方法。
  • Content-based Filtering (CB):基于內(nèi)容的推薦系統(tǒng),與基于協(xié)同過濾從全局 user 和 item 的交互數(shù)據(jù)中學(xué)習(xí)他們的向量表示相比,基于內(nèi)容的推薦方法從 item 的內(nèi)容中學(xué)習(xí) user 和 item 的表示。它認(rèn)為 user 可能對與他們過去交互過的 item 中相似的 item 感興趣。
  • Hybrid Method:混合推薦系統(tǒng),CF方法容易遇到冷啟動或者交互矩陣數(shù)據(jù)稀疏的問題,而混合推薦系統(tǒng)可以利用基于內(nèi)容的推薦系統(tǒng)中的 user 和 item 信息來緩解這一問題?;旌贤扑]系統(tǒng)通過將 user 和 item 的內(nèi)容信息,即用戶輔助信息和物品輔助信息整合到 CF 的框架中,可以獲得更好的推薦性能。

1.2 基于知識圖譜的推薦系統(tǒng)

    近段時間,基于知識圖譜的推薦系統(tǒng)(KG-based recommendation system, KGRS)引起研究者的廣泛興趣,主要是把知識圖譜作為輔助信息整合到推薦系統(tǒng)中,這樣的做法帶來兩個方面的優(yōu)勢,其一是能夠提高推薦系統(tǒng)的準(zhǔn)確性,其二是能夠為推薦系統(tǒng)提供可解釋性。

  • 準(zhǔn)確性:知識圖譜可以用來表示實體之間的關(guān)系,可以將 item 及其屬性信息映射到知識圖譜中,以理解 item 之間的相互關(guān)系,此外,還可以將 user 和 user 的輔助信息整合到知識圖譜中,更準(zhǔn)確地捕捉 user 和 item 之間的關(guān)系以及 user 的偏好。

    下圖所示是一個基于知識圖譜的推薦系統(tǒng),我們來簡單看一下,KG 中包含了電影(圓形代表)、用戶,演員和導(dǎo)演(人頭像代表)以及電影風(fēng)格(攝影機代表)這幾種實體節(jié)點,實體之間又包含了幾種不同的關(guān)系,通過這個知識圖譜,給 Bob 推薦了兩部電影 “Avatar”《阿凡達(dá)》和 “Blood Diamond”《血鉆》??磮D能夠看出,電影和用戶之間有著不同的潛在關(guān)系,有助于提高推薦的準(zhǔn)確性。

  • 可解釋性: 基于 KG 的推薦系統(tǒng)的另一個優(yōu)點是推薦結(jié)果具有可解釋性。在上面的圖中,通過遵循圖譜中的關(guān)系序列,我們可以知道向 Bob 推薦這兩部電影的原因。例如,推薦《阿凡達(dá)》的一個原因是,《阿凡達(dá)》與 Bob 之前看過的“Interstellar”《星際穿越》屬于同一類型風(fēng)格的電影。

    下圖中列出了一些流行的知識圖譜,根據(jù)所涵蓋知識的范圍,這些知識圖譜可分為兩類,一類是 cross-domain 的知識圖譜,另一類是 domain-specific 的知識圖譜,也就是說一類是包含知識廣的通用型知識圖譜,一類是包含特定領(lǐng)域知識的垂直領(lǐng)域知識圖譜。

二、Methods


  通過對最近研究的相關(guān)調(diào)研,發(fā)現(xiàn)基于 KG 的推薦系統(tǒng)對 KG 的應(yīng)用有三種方式:

  • 基于 Embeddig 的方法(The embedding-based method)
  • 基于路徑的方法(The path-based method)
  • 聯(lián)合的方法(The unified method)

我們接下來將在各小節(jié)了解一下對應(yīng)的方法,在這之前,先給出下面的一章圖片,列出相關(guān)的符號和概念。

2.1 基于Embeddig的方法

   基于 Embedding 的方法通常直接使用來自知識圖譜的信息來豐富 item 或 user 的表示。為了充分利用 KG 的信息,需要應(yīng)用KGE/KRL算法將 KG 中的實體和關(guān)系映射到低維向量空間。

   KGE 算法可分為兩類:基于翻譯的模型,如 TransE、TransH、TransR、TransD等;語義匹配模型,如 DistMult等。

   說明:

  • 關(guān)于知識圖譜嵌入的Translate模型匯總(TransE,TransH,TransR,TransD)的知識 點擊這
  • 關(guān)于融合事實信息的知識圖譜嵌入——語義匹配模型 的知識,點擊這

      根據(jù) KG 是否包含 user,又將這類方法分為兩部分,即 item graph 和 user-item graph。

2.1.1 使用 item graph      

  該方法中,KG 由 item 及其相關(guān)屬性組成,這些屬性是從數(shù)據(jù)集或外部知識庫中提取的。我們將這樣的圖命名為 item graph。注意,user 不包括在 item graph 中

  這類方法利用 KGE 等模型對 item graph 編碼獲取更加豐富的 item embedding,然后結(jié)合 item 的多種信息構(gòu)成完整的 item 表示,例如 user-item 交互矩陣信息、KG 信息、item 屬性信息、item 內(nèi)容信息等。然后再單獨計算 user 的表示(可以從交互矩陣中獲取)和得分函數(shù)。

  得分函數(shù)的公式如下,其中 user 和 item 的向量表示分別為 μ? 和 ν? ,目的是計算 user 選擇 item 的可能性大小,然后排序之后返回相應(yīng)的 item。 這里的 f 可以是內(nèi)積、DNN等。

   在這類方法中,有一些典型的模型代表,如 CKE、DKN、KSR。

2.1.2 使用 user-item graph

  該方法直接構(gòu)建 user-item graph,其中 user、item 及其相關(guān)屬性作為節(jié)點(實體)。在 user-item graph 中,屬性級關(guān)系(品牌、類別等)和 user 相關(guān)關(guān)系(co-buy、co-view等)作為邊(關(guān)系)。 在利用 KGE 編碼得到相關(guān)的實體表示后,既可以利用 item graph 中的公式(1)計算 user 的偏好,也可以將關(guān)系向量考慮進(jìn)去,采用新的計算方法,如下:

  在這類方法中,有一些代表性模型如 CFKG、SHINE、DKFM。

2.1.3 其他的方法   

  以往的一些研究工作一般直接利用 KGE 技術(shù)學(xué)習(xí)到的 user 或者 item 表示進(jìn)行推薦。最近,有些研究工作嘗試通過改進(jìn) KGE 方法學(xué)習(xí)到的實體/關(guān)系表示來提高推薦性能,例如結(jié)合 GAN 的 KTGAN 方法,以及結(jié)合 TransE、GNN 和貝葉斯框架的 BEM 方法。

  除此之外,另一種趨勢是采用多任務(wù)學(xué)習(xí)(Multi-task Learning)的方法,在一些基本 KG 相關(guān)任務(wù)的共同學(xué)習(xí)下做推薦任務(wù)。大概來說,有一個推薦系統(tǒng)的任務(wù) f 用于從 user-item 交互矩陣中學(xué)習(xí),推薦 user 感興趣的 item,對應(yīng)的在 KG 的三元組分類任務(wù) g 中,判斷這個三元組是否有效,這兩個任務(wù)在損失函數(shù)部分結(jié)合,共同學(xué)習(xí)。這樣學(xué)習(xí)的一個大概動機在于推薦系統(tǒng)中的 item embedding 共享來自 KG 中的實體 embedding。

  這類方法的一些典型代表如:KTUP、MKR、RCF等。

2.2 基于 Path 的方法

   基于 Path 的方法構(gòu)建 user-item graph,并利用 KG 中實體的連通性模式進(jìn)行推薦,基本思想是考慮到 user 和/或 item 之間連通相似性(實體語義相似性),進(jìn)而提升推薦效果。根據(jù) path 的不同使用方式又做了細(xì)分,主要是基于 path 的連通相似度和把 path 嵌入到低維空間,獲取 path embedding,我們下面分別看一下。

2.2.1 path 的連通相似性

  這種方式是利用計算不同路徑下實體之間的語義相似性,并作為一種正則方法優(yōu)化 user 和 item 的表示,進(jìn)一步就可以采用公式(1)中內(nèi)積的方式計算 user 選擇 item 的偏好可能性。有三種類型的實體相似性方法如下:

  • User-User Similarity: 如果 user 之間具有較高的元路徑相似度,那么將迫使 user 在向量空間中接近。
  • Item-Item Similarity: 與上面的類似,如果 item 基于元路徑的相似度高,則 item 的向量表示應(yīng)該接近。
  • User-Item Similarity: 如果 user 和 item 的元路徑相似度很高,那么 user 和 item 的向量就會非常接近。

 這個方法的典型模型有: FMG、Hete-MF、HeteRec、HeteRec_p、Hete-CF、SemRec、HERec、RuleRec。

2.2.2 Path embedding

  這種方法直接學(xué)習(xí)連接 user 和 item 之間的顯式 path(部分/所有) embedding,以便直接對 user-item 的關(guān)系建模。

  具體來說一下,假設(shè)存在 user 和 item 之間存在 K 個路徑,針對其中的路徑 p ,學(xué)習(xí)到其向量表示為 Ηρ,最終的路徑信息如下,其中 g 可能是 max-pooling 或者是加權(quán)的 sum-pooling。

 接下來可以采用下面的方式計算 user 對 item 的偏好。 

 這一方法的代表模型如:MCRec、RKGE、KPRN、PGPR、EIUM、Ekar

2.3 聯(lián)合的方法

   基于 embedding 的方法利用 KG 中 user/item 的語義表示進(jìn)行推薦,而基于路徑的方法使用語義連通信息,而且這兩種方法只利用 KG 中一個方面的信息。

   為了更好地利用KG中的信息,提出了將實體和關(guān)系的語義表示與路徑連通信息相結(jié)合的統(tǒng)一方法,統(tǒng)一的方法是基于 Embedding 傳播的思想。這些方法以 KG 中的路徑連通性為指導(dǎo)精煉了實體表示(user/item)。

   這里面也是分為了兩類方法,具體的下面簡單看一下。

2.3.1 基于 user 的歷史行為

  這個基本思想是利用 user 在歷史交互行為中交互過的 item 以及 item 的多跳鄰居這些行為豐富 user 的表示信息。

  豐富的 user 表示可以表示如下,其中

  代表 multi-hop ripple sets,g 代表 concatenate embeddings 的操作。

  因為傳播是從 user 參與的 item 開始的,所以這個過程可以看作是在 KG 中傳播 user 的偏好。

  代表的模型如:RippleNet、AKUPM、RCoLM

2.3.2 基于 item 的多跳鄰居

  這種方式是利用 item 的多跳鄰居(multi-hop neighbors) 

來豐富 item 表示。一個通常的表示如下: 

 

是候選 item  的 ripple set,g 代表 concatenate embeddings 的操作,concatenate 要做兩步的操作。 首先要學(xué)習(xí)候選 item 的 k 階鄰居的表示:

   然后更新

  其中 agg 可以是 Sum Aggregator、Concat Aggregator、Neighbor Aggregator、Bi-Interaction Aggregator等。

  典型的代表模型如:KGCN、KGCN-LS、KGAT、KNI、IntentGC、AKGE.

2.4 Methods 小結(jié)

  • 基于 Embedding 的方法使用 KGE 方法對 item graph 或 user-item graph 的 KG 進(jìn)行處理,獲取實體和關(guān)系的 embedding,并進(jìn)一步整合到推薦框架中。但是,該方法忽略了 KG 的信息連通性,缺少可解釋性。
  • 基于路徑(Path)的方法通過預(yù)先定義元路徑或自動挖掘連接模式,利用 user-item graph 來發(fā)現(xiàn) user 或 item 的路徑相似度?;诼窂降姆椒ㄟ€可以為推薦的結(jié)果的提供可解釋性。
  • 聯(lián)合方法是將基于 Embedding 的方法與基于路徑的方法相結(jié)合,充分挖掘兩方面的信息,是當(dāng)前的研究趨勢。此外,聯(lián)合方法還具有解釋推薦過程的能力,具備可解釋性。

   根據(jù)上述的方法分類,我將其用下面的一張圖來表示:

     上述代表性的模型在下圖中全部列出:

三、DataSets


   基于 KG 的推薦系統(tǒng)除了具有準(zhǔn)確性和可解釋性之外,另一個優(yōu)點是這種類型的輔助信息可以很自然地結(jié)合到不同應(yīng)用的推薦系統(tǒng)中。為了證明 KG 作為輔助信息的有效性,基于 KG 的推薦系統(tǒng)在不同場景下的數(shù)據(jù)集上進(jìn)行了評估。在本節(jié)中,我們將根據(jù)數(shù)據(jù)集對這些工作進(jìn)行分類,如下:

四、未來研究方向


 雖然已經(jīng)提出了許多新的模型來利用 KG 作為推薦的輔助信息,但仍存在一些機會。在此概述和討論一些未來的研究方向:

  • 1 動態(tài)推薦(Dynamic Recommendation):現(xiàn)有的大多數(shù)方法都是采用用戶的靜態(tài)偏好推薦。然而,在某些情況下,如在線購物、新聞推薦、Twitter 和論壇,用戶的興趣可能會很快受到社會事件或朋友的影響。在這種情況下,使用靜態(tài)偏好建模的推薦可能不足以理解實時興趣愛好。為了捕獲動態(tài)偏好,利用動態(tài)圖網(wǎng)絡(luò)可以作為一種解決方案。
  • 2 多任務(wù)學(xué)習(xí)(Multi-task Learning):知識圖譜中可能存在丟失的事實,從而導(dǎo)致丟失關(guān)系或?qū)嶓w,用戶的偏好也可能因此而被忽略,從而導(dǎo)致推薦結(jié)果的惡化。將知識圖譜補全和推薦系統(tǒng)聯(lián)合訓(xùn)練可以有效提高推薦效果。
  • 3 跨領(lǐng)域推薦(Cross-Domain Recommendation):由于不同領(lǐng)域的數(shù)據(jù)信息不一致,交互數(shù)據(jù)也不等同,例如,在亞馬遜平臺上,圖書評論比其他領(lǐng)域更多,然而不同領(lǐng)域的交互數(shù)據(jù)可以互為補充,因此通過遷移學(xué)習(xí)等技術(shù),可以共享源領(lǐng)域域中數(shù)據(jù)相對豐富的交互數(shù)據(jù),以便更好地推薦目標(biāo)領(lǐng)域。
  • 4 知識增強的語言表示(Knowledge Enhanced Language Representation):增強知識的文本表示策略應(yīng)用于推薦任務(wù)中,可以更好地學(xué)習(xí) user/item 表示,獲得更準(zhǔn)確的推薦結(jié)果。
  • 5 知識圖譜 Embedding 方法(Knowledge Graph Embedding Method, KGE):雖然現(xiàn)在已經(jīng)將 KGE 方法應(yīng)用到上述基于知識圖譜的推薦系統(tǒng)中,然而,沒有一些研究工作表明在數(shù)據(jù)源、推薦場景和模型架構(gòu)等不同情況下,應(yīng)該采用何種特定的 KGE 方法。因此,另一個研究方向是比較不同 KGE 方法在不同條件下的優(yōu)勢。
  • 6 用戶輔助信息(User Side Information):目前,基于 KG 的推薦系統(tǒng)大多是通過加入 item 輔助信息來構(gòu)建 KG,很少有模型考慮 user 輔助信息。然而,如用戶社交網(wǎng)絡(luò)等信息也可以自然地整合到當(dāng)前基于 KG 的推薦系統(tǒng)框架中。因此,在知識圖譜中考慮 user 輔助信息可以是另一個研究方向。 

總結(jié):本文對基于知識圖譜的推薦系統(tǒng)進(jìn)行了研究,總結(jié)了近年來該領(lǐng)域的研究成果。知識圖譜不僅能夠作為輔助信息來改善推薦效果,并且能夠為推薦提供可解釋性。此外,還介紹了不同場景中使用的數(shù)據(jù)集以及指出了未來的研究方向,希望能促進(jìn)該領(lǐng)域的發(fā)展。 

參考資料


本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
面向可解釋性的知識圖譜推理研究
美團基于知識圖譜的個性化新聞推薦系統(tǒng)
「可解釋知識圖譜推理」最新方法綜述
面向大規(guī)模網(wǎng)絡(luò)安全知識圖譜的快速表示學(xué)習(xí)模型
Bioinformatics | 鏈路感知的圖注意力網(wǎng)絡(luò)用于藥物-藥物相互作用預(yù)測
一文詳解知識圖譜關(guān)鍵技術(shù)與應(yīng)用 | 公開課筆記
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服