概率圖模型是一類用圖來(lái)表達(dá)變量相關(guān)關(guān)系的概率模型。它以圖為表示工具,最常見(jiàn)的是用一個(gè)結(jié)點(diǎn)表示一個(gè)或一組隨機(jī)變量,結(jié)點(diǎn)之間的邊表示變量間的概率相關(guān)關(guān)系,即“變量關(guān)系圖”。根據(jù)邊的性質(zhì)不同,概率圖模型可大致分為兩類:
1. 使用有向無(wú)環(huán)圖表示變量間的依賴關(guān)系,稱為有向圖模型或貝葉斯網(wǎng);
2. 使用無(wú)向圖表示變量間的相關(guān)關(guān)系,稱為無(wú)向圖模型或馬爾科夫網(wǎng)。
如上圖所示,隱馬爾可夫模型中的變量可分為兩組:第一組是狀態(tài)變量。通常假定狀態(tài)變量是隱藏的、不可被觀測(cè)的,因此狀態(tài)變量亦稱隱變量。第二組時(shí)觀測(cè)變量在隱爾科夫模型中,系統(tǒng)通常在多個(gè)狀態(tài)之間轉(zhuǎn)換,因此狀態(tài)變量yi的取值范圍Y(稱為狀態(tài)空間)通常是有N個(gè)可能取值的離散空間。觀測(cè)變量xi可以使離散型也可以是連續(xù)型。
上圖顯示出一個(gè)簡(jiǎn)單的馬爾可夫隨機(jī)場(chǎng),對(duì)于圖中結(jié)點(diǎn)的一個(gè)子集,若其中任意兩結(jié)點(diǎn)間都有邊連接,則稱該節(jié)點(diǎn)子集為一個(gè)團(tuán)。若在一個(gè)團(tuán)中加入另外任何一個(gè)結(jié)點(diǎn)都不再形成團(tuán),則稱該團(tuán)為“極大團(tuán)”。換言之,極大團(tuán)就是不能被其他團(tuán)所包含的團(tuán),在圖中
在馬爾科夫隨機(jī)場(chǎng)中,多個(gè)變量之間的聯(lián)合概率分布能基于團(tuán)分解為多個(gè)因子的乘積,每個(gè)因子僅與一個(gè)團(tuán)相關(guān)。
下面了解一下學(xué)習(xí)與推斷~
概率圖模型的推斷:大致可分為兩類。第一類是精確推斷方法,希望能計(jì)算出目標(biāo)變量的邊際分布或條件分布的精確值;遺憾的是,一般情形下,此類算法的計(jì)算復(fù)雜度隨著極大團(tuán)規(guī)模的增長(zhǎng)呈指數(shù)增長(zhǎng),適用范圍有限;第二類是近似推斷方法,希望在較低的時(shí)間復(fù)雜度下獲得原問(wèn)題的近似解,下面介紹一下兩種代表性的精確推斷方法,然后再介紹近似推斷方法~
精確推斷方法:
1. 變量消去:是一類動(dòng)態(tài)規(guī)劃算法,它利用圖模型所描述的條件獨(dú)立性來(lái)削減計(jì)算目標(biāo)概率值所需的計(jì)算量,該方法是最直觀的精確推斷算法,也是構(gòu)建其他精確推斷算法的基礎(chǔ)。
2. 信念傳播:將變量消去法中的求和操作看作一個(gè)消息傳遞過(guò)程,較好地解決了求解多個(gè)邊際分布時(shí)的重復(fù)計(jì)算問(wèn)題。
近似推斷:
1. MCMC采樣(馬爾科夫鏈蒙特卡羅方法):我們關(guān)系某些概率分布并非因?yàn)閷?duì)這些概率分布本身感興趣,而是要基于它們計(jì)算某些期望,并且還可以進(jìn)一步基于這些期望做出決策。直接計(jì)算或逼近這個(gè)期望比推斷概率分布更容易。
2. 變分推斷:通過(guò)使用已知簡(jiǎn)單分布來(lái)逼近需推斷的復(fù)雜分布,并通過(guò)限制近似分布的類型,從而得到一種局部最優(yōu)、但具有確定解的近似后驗(yàn)分布。
補(bǔ)充閱讀:
話題模型:是一族生成式有向圖模型,主要用于處理離散型的數(shù)據(jù)(如文本集合),在信息檢索、自然語(yǔ)言處理等領(lǐng)域有廣泛應(yīng)用。----LDA是話題模型的典型代表。
聯(lián)系客服