林允儿视频桌面壁纸,唐嫣罗晋视频

以下文章來源于AI自然語言處理與知識圖譜，作者Elesdspline

導(dǎo)語

本文是2020年針對知識圖譜作為輔助信息用于推薦系統(tǒng)的一篇綜述。知識圖譜對于推薦系統(tǒng)不僅能夠進(jìn)行更精確的個性化推薦，而且對推薦也是具有可解釋性的，有跡可循。

本文匯總了近些年來知識圖譜輔助推薦系統(tǒng)的一些研究工作，并按不同的方法進(jìn)行劃分類別(下圖是我根據(jù)論文畫出的大綱方法類別圖)；除此之外，匯總了不同場景下的知識圖譜數(shù)據(jù)集，涵蓋7個場景；最后闡述了未來的一些可研究方向及趨勢。

基于知識圖譜的推薦方法

一、背景知識

推薦系統(tǒng)已經(jīng)廣泛應(yīng)用在實際生活中的很多場景，特別是個性化推薦系統(tǒng)已經(jīng)有越來越多的研究工作和落地實踐，但是仍然面臨著一些問題，例如數(shù)據(jù)稀疏、冷啟動等問題。

說明：

稀疏性問題： 實際場景中，用戶和物品的交互信息往往是非常稀疏的。如電影推薦中，電影往往成千上萬部，但是用戶打過分的電影往往只有幾十部。使用如此少的觀測數(shù)據(jù)來預(yù)測大量的未知信息，會極大增加過擬合的風(fēng)險。
冷啟動問題： 對于新加入的用戶或者物品，其沒有對應(yīng)的歷史信息，因此難以進(jìn)行準(zhǔn)確的建模和推薦。

近年來，利用知識圖譜作為輔助信息生成推薦已經(jīng)引起了人們相當(dāng)大的興趣，這種方法不僅可以緩解上述問題，更準(zhǔn)確的進(jìn)行個性化推薦，而且可以對推薦的結(jié)果也是可解釋的，是有跡可循的。下面我們將分別來看一下這兩方面。

1.1 推薦系統(tǒng)

推薦系統(tǒng)在實際生活中已經(jīng)有很多的應(yīng)用場景，比如我們所熟知的電影、音樂、POI、新聞、教育、書籍，購物等。

推薦系統(tǒng)的目的旨在為 user (用戶) 推薦一個（或一系列）未觀測的 item (物品，電影，新聞等)?；静襟E如下：

學(xué)習(xí) user 和 item 的向量表示
根據(jù) 1 中的 user 和 item 向量表示，計算表示 user 對 item 的偏好得分，得分函數(shù)可以采用內(nèi)積、DNN等。
基于 2 中計算的得分，進(jìn)行排序推薦。

推薦系統(tǒng)主要包含以下三種方法：

Collaborative Filtering (CF): 基于協(xié)同過濾的推薦系統(tǒng)，協(xié)同過濾算法是從相似度度量出發(fā)，考慮 user 或者 item 之間的相似度進(jìn)行相關(guān)推薦，它比較常用的兩種方法是基于內(nèi)存（memory-based）和基于模型（model-based）的兩種方法。
Content-based Filtering (CB)：基于內(nèi)容的推薦系統(tǒng)，與基于協(xié)同過濾從全局 user 和 item 的交互數(shù)據(jù)中學(xué)習(xí)他們的向量表示相比，基于內(nèi)容的推薦方法從 item 的內(nèi)容中學(xué)習(xí) user 和 item 的表示。它認(rèn)為 user 可能對與他們過去交互過的 item 中相似的 item 感興趣。
Hybrid Method：混合推薦系統(tǒng)，CF方法容易遇到冷啟動或者交互矩陣數(shù)據(jù)稀疏的問題，而混合推薦系統(tǒng)可以利用基于內(nèi)容的推薦系統(tǒng)中的 user 和 item 信息來緩解這一問題?；旌贤扑]系統(tǒng)通過將 user 和 item 的內(nèi)容信息，即用戶輔助信息和物品輔助信息整合到 CF 的框架中，可以獲得更好的推薦性能。

1.2 基于知識圖譜的推薦系統(tǒng)

近段時間，基于知識圖譜的推薦系統(tǒng)(KG-based recommendation system, KGRS)引起研究者的廣泛興趣，主要是把知識圖譜作為輔助信息整合到推薦系統(tǒng)中，這樣的做法帶來兩個方面的優(yōu)勢，其一是能夠提高推薦系統(tǒng)的準(zhǔn)確性，其二是能夠為推薦系統(tǒng)提供可解釋性。

準(zhǔn)確性：知識圖譜可以用來表示實體之間的關(guān)系，可以將 item 及其屬性信息映射到知識圖譜中，以理解 item 之間的相互關(guān)系，此外，還可以將 user 和 user 的輔助信息整合到知識圖譜中，更準(zhǔn)確地捕捉 user 和 item 之間的關(guān)系以及 user 的偏好。

下圖所示是一個基于知識圖譜的推薦系統(tǒng)，我們來簡單看一下，KG 中包含了電影(圓形代表)、用戶，演員和導(dǎo)演(人頭像代表)以及電影風(fēng)格(攝影機代表)這幾種實體節(jié)點，實體之間又包含了幾種不同的關(guān)系，通過這個知識圖譜，給 Bob 推薦了兩部電影 “Avatar”《阿凡達(dá)》和 “Blood Diamond”《血鉆》?？磮D能夠看出，電影和用戶之間有著不同的潛在關(guān)系，有助于提高推薦的準(zhǔn)確性。

可解釋性： 基于 KG 的推薦系統(tǒng)的另一個優(yōu)點是推薦結(jié)果具有可解釋性。在上面的圖中，通過遵循圖譜中的關(guān)系序列，我們可以知道向 Bob 推薦這兩部電影的原因。例如，推薦《阿凡達(dá)》的一個原因是，《阿凡達(dá)》與 Bob 之前看過的“Interstellar”《星際穿越》屬于同一類型風(fēng)格的電影。

下圖中列出了一些流行的知識圖譜，根據(jù)所涵蓋知識的范圍，這些知識圖譜可分為兩類，一類是 cross-domain 的知識圖譜，另一類是 domain-specific 的知識圖譜，也就是說一類是包含知識廣的通用型知識圖譜，一類是包含特定領(lǐng)域知識的垂直領(lǐng)域知識圖譜。

二、Methods

通過對最近研究的相關(guān)調(diào)研，發(fā)現(xiàn)基于 KG 的推薦系統(tǒng)對 KG 的應(yīng)用有三種方式:

基于 Embeddig 的方法(The embedding-based method)
基于路徑的方法(The path-based method)
聯(lián)合的方法(The unified method)

我們接下來將在各小節(jié)了解一下對應(yīng)的方法，在這之前，先給出下面的一章圖片，列出相關(guān)的符號和概念。

2.1 基于Embeddig的方法

基于 Embedding 的方法通常直接使用來自知識圖譜的信息來豐富 item 或 user 的表示。為了充分利用 KG 的信息，需要應(yīng)用KGE/KRL算法將 KG 中的實體和關(guān)系映射到低維向量空間。

KGE 算法可分為兩類：基于翻譯的模型，如 TransE、TransH、TransR、TransD等；語義匹配模型，如 DistMult等。

說明：

關(guān)于知識圖譜嵌入的Translate模型匯總（TransE，TransH，TransR，TransD）的知識點擊這
關(guān)于融合事實信息的知識圖譜嵌入——語義匹配模型的知識，點擊這

根據(jù) KG 是否包含 user，又將這類方法分為兩部分，即 item graph 和 user-item graph。

2.1.1 使用 item graph

該方法中，KG 由 item 及其相關(guān)屬性組成，這些屬性是從數(shù)據(jù)集或外部知識庫中提取的。我們將這樣的圖命名為 item graph。注意，user 不包括在 item graph 中。

這類方法利用 KGE 等模型對 item graph 編碼獲取更加豐富的 item embedding，然后結(jié)合 item 的多種信息構(gòu)成完整的 item 表示，例如 user-item 交互矩陣信息、KG 信息、item 屬性信息、item 內(nèi)容信息等。然后再單獨計算 user 的表示(可以從交互矩陣中獲取)和得分函數(shù)。

得分函數(shù)的公式如下，其中 user 和 item 的向量表示分別為 μ? 和 ν? ，目的是計算 user 選擇 item 的可能性大小，然后排序之后返回相應(yīng)的 item。這里的 f 可以是內(nèi)積、DNN等。

在這類方法中，有一些典型的模型代表，如 CKE、DKN、KSR。

CKE：（Collaborative Knowledge base Embedding）CKE是一個基于協(xié)同過濾和知識圖譜特征學(xué)習(xí)的推薦系統(tǒng)，相關(guān)知識點擊這里
DKN：（Deep Knowledge-Aware Network），相關(guān)知識點擊這里

2.1.2 使用 user-item graph

該方法直接構(gòu)建 user-item graph，其中 user、item 及其相關(guān)屬性作為節(jié)點(實體)。在 user-item graph 中，屬性級關(guān)系(品牌、類別等)和 user 相關(guān)關(guān)系(co-buy、co-view等)作為邊(關(guān)系)。在利用 KGE 編碼得到相關(guān)的實體表示后，既可以利用 item graph 中的公式(1)計算 user 的偏好，也可以將關(guān)系向量考慮進(jìn)去，采用新的計算方法，如下：

在這類方法中，有一些代表性模型如 CFKG、SHINE、DKFM。

2.1.3 其他的方法

以往的一些研究工作一般直接利用 KGE 技術(shù)學(xué)習(xí)到的 user 或者 item 表示進(jìn)行推薦。最近，有些研究工作嘗試通過改進(jìn) KGE 方法學(xué)習(xí)到的實體/關(guān)系表示來提高推薦性能，例如結(jié)合 GAN 的 KTGAN 方法,以及結(jié)合 TransE、GNN 和貝葉斯框架的 BEM 方法。

除此之外，另一種趨勢是采用多任務(wù)學(xué)習(xí)(Multi-task Learning)的方法，在一些基本 KG 相關(guān)任務(wù)的共同學(xué)習(xí)下做推薦任務(wù)。大概來說，有一個推薦系統(tǒng)的任務(wù) f 用于從 user-item 交互矩陣中學(xué)習(xí)，推薦 user 感興趣的 item，對應(yīng)的在 KG 的三元組分類任務(wù) g 中，判斷這個三元組是否有效，這兩個任務(wù)在損失函數(shù)部分結(jié)合，共同學(xué)習(xí)。這樣學(xué)習(xí)的一個大概動機在于推薦系統(tǒng)中的 item embedding 共享來自 KG 中的實體 embedding。

這類方法的一些典型代表如：KTUP、MKR、RCF等。

2.2 基于 Path 的方法

基于 Path 的方法構(gòu)建 user-item graph，并利用 KG 中實體的連通性模式進(jìn)行推薦，基本思想是考慮到 user 和/或 item 之間連通相似性（實體語義相似性），進(jìn)而提升推薦效果。根據(jù) path 的不同使用方式又做了細(xì)分，主要是基于 path 的連通相似度和把 path 嵌入到低維空間，獲取 path embedding，我們下面分別看一下。

2.2.1 path 的連通相似性

這種方式是利用計算不同路徑下實體之間的語義相似性，并作為一種正則方法優(yōu)化 user 和 item 的表示，進(jìn)一步就可以采用公式(1)中內(nèi)積的方式計算 user 選擇 item 的偏好可能性。有三種類型的實體相似性方法如下：

User-User Similarity: 如果 user 之間具有較高的元路徑相似度，那么將迫使 user 在向量空間中接近。
Item-Item Similarity: 與上面的類似，如果 item 基于元路徑的相似度高，則 item 的向量表示應(yīng)該接近。
User-Item Similarity: 如果 user 和 item 的元路徑相似度很高，那么 user 和 item 的向量就會非常接近。

這個方法的典型模型有: FMG、Hete-MF、HeteRec、HeteRec_p、Hete-CF、SemRec、HERec、RuleRec。

2.2.2 Path embedding

這種方法直接學(xué)習(xí)連接 user 和 item 之間的顯式 path(部分/所有) embedding，以便直接對 user-item 的關(guān)系建模。

具體來說一下，假設(shè)存在 user 和 item 之間存在 K 個路徑，針對其中的路徑 p ，學(xué)習(xí)到其向量表示為 Ηρ，最終的路徑信息如下，其中 g 可能是 max-pooling 或者是加權(quán)的 sum-pooling。

接下來可以采用下面的方式計算 user 對 item 的偏好。

這一方法的代表模型如：MCRec、RKGE、KPRN、PGPR、EIUM、Ekar

2.3 聯(lián)合的方法

基于 embedding 的方法利用 KG 中 user/item 的語義表示進(jìn)行推薦，而基于路徑的方法使用語義連通信息，而且這兩種方法只利用 KG 中一個方面的信息。

為了更好地利用KG中的信息，提出了將實體和關(guān)系的語義表示與路徑連通信息相結(jié)合的統(tǒng)一方法，統(tǒng)一的方法是基于 Embedding 傳播的思想。這些方法以 KG 中的路徑連通性為指導(dǎo)精煉了實體表示(user/item)。

這里面也是分為了兩類方法，具體的下面簡單看一下。

2.3.1 基于 user 的歷史行為

這個基本思想是利用 user 在歷史交互行為中交互過的 item 以及 item 的多跳鄰居這些行為豐富 user 的表示信息。

豐富的 user 表示可以表示如下，其中

代表 multi-hop ripple sets，g 代表 concatenate embeddings 的操作。

因為傳播是從 user 參與的 item 開始的，所以這個過程可以看作是在 KG 中傳播 user 的偏好。

代表的模型如：RippleNet、AKUPM、RCoLM

2.3.2 基于 item 的多跳鄰居

這種方式是利用 item 的多跳鄰居(multi-hop neighbors)

來豐富 item 表示。一個通常的表示如下：

是候選 item 的 ripple set，g 代表 concatenate embeddings 的操作，concatenate 要做兩步的操作。首先要學(xué)習(xí)候選 item 的 k 階鄰居的表示：

然后更新

其中 agg 可以是 Sum Aggregator、Concat Aggregator、Neighbor Aggregator、Bi-Interaction Aggregator等。

典型的代表模型如：KGCN、KGCN-LS、KGAT、KNI、IntentGC、AKGE.

2.4 Methods 小結(jié)

基于 Embedding 的方法使用 KGE 方法對 item graph 或 user-item graph 的 KG 進(jìn)行處理，獲取實體和關(guān)系的 embedding，并進(jìn)一步整合到推薦框架中。但是，該方法忽略了 KG 的信息連通性，缺少可解釋性。
基于路徑(Path)的方法通過預(yù)先定義元路徑或自動挖掘連接模式，利用 user-item graph 來發(fā)現(xiàn) user 或 item 的路徑相似度?；诼窂降姆椒ㄟ€可以為推薦的結(jié)果的提供可解釋性。
聯(lián)合方法是將基于 Embedding 的方法與基于路徑的方法相結(jié)合，充分挖掘兩方面的信息，是當(dāng)前的研究趨勢。此外，聯(lián)合方法還具有解釋推薦過程的能力，具備可解釋性。

根據(jù)上述的方法分類，我將其用下面的一張圖來表示：

上述代表性的模型在下圖中全部列出：

三、DataSets

基于 KG 的推薦系統(tǒng)除了具有準(zhǔn)確性和可解釋性之外，另一個優(yōu)點是這種類型的輔助信息可以很自然地結(jié)合到不同應(yīng)用的推薦系統(tǒng)中。為了證明 KG 作為輔助信息的有效性，基于 KG 的推薦系統(tǒng)在不同場景下的數(shù)據(jù)集上進(jìn)行了評估。在本節(jié)中，我們將根據(jù)數(shù)據(jù)集對這些工作進(jìn)行分類，如下：

四、未來研究方向

雖然已經(jīng)提出了許多新的模型來利用 KG 作為推薦的輔助信息，但仍存在一些機會。在此概述和討論一些未來的研究方向：

1 動態(tài)推薦(Dynamic Recommendation)：現(xiàn)有的大多數(shù)方法都是采用用戶的靜態(tài)偏好推薦。然而，在某些情況下，如在線購物、新聞推薦、Twitter 和論壇，用戶的興趣可能會很快受到社會事件或朋友的影響。在這種情況下，使用靜態(tài)偏好建模的推薦可能不足以理解實時興趣愛好。為了捕獲動態(tài)偏好，利用動態(tài)圖網(wǎng)絡(luò)可以作為一種解決方案。
2 多任務(wù)學(xué)習(xí)(Multi-task Learning)：知識圖譜中可能存在丟失的事實，從而導(dǎo)致丟失關(guān)系或?qū)嶓w，用戶的偏好也可能因此而被忽略，從而導(dǎo)致推薦結(jié)果的惡化。將知識圖譜補全和推薦系統(tǒng)聯(lián)合訓(xùn)練可以有效提高推薦效果。
3 跨領(lǐng)域推薦(Cross-Domain Recommendation)：由于不同領(lǐng)域的數(shù)據(jù)信息不一致，交互數(shù)據(jù)也不等同，例如，在亞馬遜平臺上，圖書評論比其他領(lǐng)域更多，然而不同領(lǐng)域的交互數(shù)據(jù)可以互為補充，因此通過遷移學(xué)習(xí)等技術(shù)，可以共享源領(lǐng)域域中數(shù)據(jù)相對豐富的交互數(shù)據(jù)，以便更好地推薦目標(biāo)領(lǐng)域。
4 知識增強的語言表示(Knowledge Enhanced Language Representation)：增強知識的文本表示策略應(yīng)用于推薦任務(wù)中，可以更好地學(xué)習(xí) user/item 表示，獲得更準(zhǔn)確的推薦結(jié)果。
5 知識圖譜 Embedding 方法(Knowledge Graph Embedding Method， KGE)：雖然現(xiàn)在已經(jīng)將 KGE 方法應(yīng)用到上述基于知識圖譜的推薦系統(tǒng)中，然而，沒有一些研究工作表明在數(shù)據(jù)源、推薦場景和模型架構(gòu)等不同情況下，應(yīng)該采用何種特定的 KGE 方法。因此，另一個研究方向是比較不同 KGE 方法在不同條件下的優(yōu)勢。
6 用戶輔助信息(User Side Information)：目前，基于 KG 的推薦系統(tǒng)大多是通過加入 item 輔助信息來構(gòu)建 KG，很少有模型考慮 user 輔助信息。然而，如用戶社交網(wǎng)絡(luò)等信息也可以自然地整合到當(dāng)前基于 KG 的推薦系統(tǒng)框架中。因此，在知識圖譜中考慮 user 輔助信息可以是另一個研究方向。

總結(jié)：本文對基于知識圖譜的推薦系統(tǒng)進(jìn)行了研究，總結(jié)了近年來該領(lǐng)域的研究成果。知識圖譜不僅能夠作為輔助信息來改善推薦效果，并且能夠為推薦提供可解釋性。此外，還介紹了不同場景中使用的數(shù)據(jù)集以及指出了未來的研究方向，希望能促進(jìn)該領(lǐng)域的發(fā)展。

參考資料

https://mp.weixin.qq.com/s/D7ndRXbazbL5f316aiDd1A
https://blog.csdn.net/weixin_42341986/article/details/105773376
https://blog.csdn.net/qq_27590277/article/details/107194665
https://mp.weixin.qq.com/s/2YbfL_1_SyM4wNozyaj4lw
https://www.omegaxyz.com/2020/01/13/kge-semantic-matching-models/
[1] Guo Q, Zhuang F, Qin C, et al. A Survey on Knowledge Graph-Based Recommender Systems[J]. arXiv preprint arXiv:2003.00911, 2020.
[2] Zhang F, Yuan N J, Lian D, et al. Collaborative knowledge base embedding for recommender systems[C]//Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 2016: 353-362.
[3] Zhang Y, Ai Q, Chen X, et al. Learning over knowledge-base embeddings for recommendation[J]. arXiv preprint arXiv:1803.06540, 2018
[4] Wang H, Zhang F, Wang J, et al. Ripplenet: Propagating user preferences on the knowledge graph for recommender systems[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management. 2018: 417-426

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频