摘要
來(lái)源:防務(wù)快訊
作者:王昊奮,易侃,吳蔚,胡芳槐
摘要
針對(duì)多模態(tài)態(tài)勢(shì)存在知識(shí)表示困難、知識(shí)化過(guò)程復(fù)雜、多模態(tài)知識(shí)難以融合、知識(shí)智能應(yīng)用程度低等難題,提出了面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知多模態(tài)數(shù)據(jù)及知識(shí)的統(tǒng)一知識(shí)表示模型,實(shí)現(xiàn)了事實(shí)類知識(shí)、動(dòng)態(tài)事件、規(guī)則知識(shí)和多模態(tài)知識(shí)等高效表示。在此基礎(chǔ)上,引入基于知識(shí)圖譜的表示學(xué)習(xí)技術(shù),為多模態(tài)數(shù)據(jù)及知識(shí)的統(tǒng)一處理提供了方法,可支撐多模態(tài)知識(shí)的提取、融合、補(bǔ)全和聯(lián)合學(xué)習(xí),從而實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)圖譜的構(gòu)建;最后,以表示學(xué)習(xí)為基礎(chǔ),提出了基于態(tài)勢(shì)感知知識(shí)圖譜的知識(shí)推理框架,實(shí)現(xiàn)能力強(qiáng)、高效率、可解釋的復(fù)合推理,為上層應(yīng)用提供實(shí)現(xiàn)途徑。
1、問(wèn)題的提出
態(tài)勢(shì)感知 (SA) 指對(duì)環(huán)境中目標(biāo)的認(rèn)知、對(duì)其意義的理解以及對(duì)其近期狀態(tài)的預(yù)測(cè),是一種基于環(huán)境的動(dòng)態(tài)從整體洞悉安全風(fēng)險(xiǎn)的能力,覆蓋感知、理解和預(yù)測(cè)3個(gè)層次。Endsley的態(tài)勢(shì)感知模型已被廣泛采用,包括感知、理解和預(yù)測(cè)3個(gè)不同階段或?qū)哟?該模型整個(gè)過(guò)程以人為主導(dǎo),整個(gè)過(guò)程依賴指揮人員的心智。Henriques等將Endsley模型中的心智模型改為人工智能模型,使得當(dāng)前熱門(mén)的人工智能技術(shù)能夠有效地在整個(gè)模型中發(fā)揮作用,結(jié)合人工智能的態(tài)勢(shì)感知模型如圖1所示。模型中態(tài)勢(shì)感知、態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè)每一步都有交互和反饋;同時(shí)形成了包含知識(shí)規(guī)則的知識(shí)庫(kù),知識(shí)能夠與人工智能方法結(jié)合,對(duì)態(tài)勢(shì)感知的整個(gè)流程進(jìn)行指導(dǎo)與反饋。
態(tài)勢(shì)感知也可視為等同于美國(guó)空軍(USAF)戰(zhàn)爭(zhēng)理論家約翰·博伊德上校描述的觀察—判斷—決策—行動(dòng) (OODA) 循環(huán)的觀察和判斷階段。
圖1 結(jié)合人工智能的態(tài)勢(shì)感知模型
國(guó)內(nèi)一些學(xué)者在態(tài)勢(shì)感知基礎(chǔ)上提出了態(tài)勢(shì)認(rèn)知的概念。雖然態(tài)勢(shì)認(rèn)知尚無(wú)統(tǒng)一定義,但大多數(shù)學(xué)者認(rèn)為其核心理念是模擬人類獲得知識(shí)、理解知識(shí)和應(yīng)用知識(shí)的過(guò)程。通過(guò)獲取目標(biāo)態(tài)勢(shì)數(shù)據(jù),利用專業(yè)知識(shí)認(rèn)識(shí)、理解目標(biāo)未來(lái)發(fā)展趨勢(shì),并給出結(jié)論判斷,通常包括態(tài)勢(shì)數(shù)據(jù)感知、態(tài)勢(shì)理解、態(tài)勢(shì)預(yù)測(cè)和態(tài)勢(shì)決策評(píng)估等關(guān)鍵步驟。該過(guò)程中的感知與Endsley模型中態(tài)勢(shì)察覺(jué)對(duì)應(yīng)。由此可見(jiàn),態(tài)勢(shì)認(rèn)知的定義與Endsley的態(tài)勢(shì)感知3級(jí)延伸定義大體一致,因此本文仍采用Endsley提出的廣義態(tài)勢(shì)感知的概念,即不僅包含態(tài)勢(shì)察覺(jué),還包含態(tài)勢(shì)理解與態(tài)勢(shì)預(yù)測(cè)。
態(tài)勢(shì)感知概念最早在軍事領(lǐng)域提出,已成為軍事指揮和控制 (C2)不可分割的一部分。圖2給出了戰(zhàn)場(chǎng)態(tài)勢(shì)感知的總體概況。由圖可知,戰(zhàn)場(chǎng)態(tài)勢(shì)感知需綜合利用多方面的數(shù)據(jù),并進(jìn)行數(shù)據(jù)的處理、融合和分析,最終進(jìn)行輔助作戰(zhàn)決策。戰(zhàn)場(chǎng)態(tài)勢(shì)感知的數(shù)據(jù)來(lái)源包括各類情報(bào)信息(開(kāi)源情報(bào)、地理空間情報(bào)和信號(hào)情報(bào)等)、傳感器數(shù)據(jù)、衛(wèi)星數(shù)據(jù)、偵察數(shù)據(jù)、雷達(dá)數(shù)據(jù)和各種目標(biāo)裝備產(chǎn)生的數(shù)據(jù),以及歷史規(guī)律知識(shí)和人的戰(zhàn)場(chǎng)知識(shí)等。
圖2 戰(zhàn)場(chǎng)態(tài)勢(shì)感知示意圖
這些數(shù)據(jù)具有類型多、數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜和數(shù)據(jù)稀疏等特點(diǎn)。從數(shù)據(jù)格式角度看,常用作戰(zhàn)數(shù)據(jù)類型包括情報(bào)文本、圖像、視頻、語(yǔ)音、數(shù)據(jù)庫(kù)、時(shí)序數(shù)據(jù)、地理信息系統(tǒng)(GIS)數(shù)據(jù)、格式報(bào)和矢量圖等,包含了結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。作戰(zhàn)態(tài)勢(shì)知識(shí)從各類作戰(zhàn)數(shù)據(jù)中使用相應(yīng)的知識(shí)提取技術(shù)提取出來(lái),以及由指揮人員從歷史經(jīng)驗(yàn)中總結(jié)出來(lái);知識(shí)類型也非常多,包括基礎(chǔ)的目標(biāo)知識(shí)及目標(biāo)間的關(guān)系、戰(zhàn)場(chǎng)地理環(huán)境、事件與事件間的關(guān)聯(lián)、時(shí)空知識(shí)、作戰(zhàn)規(guī)則知識(shí)和指揮流程等。計(jì)算機(jī)如何有效表示與組織這些數(shù)據(jù)和知識(shí),如何實(shí)現(xiàn)數(shù)據(jù)和知識(shí)的有效處理、理解并基于這些數(shù)據(jù)和知識(shí)進(jìn)行推理計(jì)算,是實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)感知中感知、理解和預(yù)測(cè)3個(gè)階段的前提條件,是最終為作戰(zhàn)決策提供有效支撐的基礎(chǔ)。
現(xiàn)有的戰(zhàn)場(chǎng)態(tài)勢(shì)感知數(shù)據(jù)處理及知識(shí)加工相關(guān)研究通常僅對(duì)其中部分環(huán)節(jié)進(jìn)行研究,如針對(duì)作戰(zhàn)大數(shù)據(jù)的組織、面向態(tài)勢(shì)知識(shí)的表示、戰(zhàn)場(chǎng)時(shí)空知識(shí)表示、態(tài)勢(shì)實(shí)體知識(shí)表示學(xué)習(xí)、態(tài)勢(shì)感知知識(shí)圖譜構(gòu)建和基于態(tài)勢(shì)感知知識(shí)圖譜的應(yīng)用等;另外,現(xiàn)有研究通常僅對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中部分?jǐn)?shù)據(jù)或知識(shí)進(jìn)行處理。
知識(shí)圖譜作為大數(shù)據(jù)時(shí)代的知識(shí)工程集大成者,以其強(qiáng)大的語(yǔ)義表達(dá)能力、知識(shí)提取融合能力、多態(tài)存儲(chǔ)能力和推理計(jì)算能力,為大規(guī)模多模態(tài)數(shù)據(jù)的知識(shí)化組織和智能應(yīng)用提供了有效解決方案。知識(shí)圖譜的強(qiáng)大語(yǔ)義表達(dá)能力能夠有效表示戰(zhàn)場(chǎng)態(tài)勢(shì)場(chǎng)景的多模態(tài)知識(shí),并結(jié)合多態(tài)存儲(chǔ)能力輔助實(shí)現(xiàn)數(shù)據(jù)的覺(jué)察與感知;知識(shí)圖譜的知識(shí)提取融合能力可從態(tài)勢(shì)感知數(shù)據(jù)中有效提取知識(shí)并實(shí)現(xiàn)不同模態(tài)數(shù)據(jù)中知識(shí)的融合,從而提升對(duì)態(tài)勢(shì)數(shù)據(jù)的理解;最后,以多模態(tài)態(tài)勢(shì)知識(shí)圖譜為基礎(chǔ)的知識(shí)推理計(jì)算能力能夠極大程度提升預(yù)測(cè)能力。
為支撐戰(zhàn)場(chǎng)態(tài)勢(shì)場(chǎng)景由數(shù)據(jù)→知識(shí)→推理和智能應(yīng)用的全過(guò)程提升,本文重點(diǎn)研究基于戰(zhàn)場(chǎng)態(tài)勢(shì)圖譜的統(tǒng)一知識(shí)表示、知識(shí)表示學(xué)習(xí)與知識(shí)推理技術(shù),通過(guò)統(tǒng)一的知識(shí)表示方法以實(shí)現(xiàn)全域態(tài)勢(shì)數(shù)據(jù)建模,輔助實(shí)現(xiàn)態(tài)勢(shì)數(shù)據(jù)的覺(jué)察與感知。首先,研究態(tài)勢(shì)知識(shí)表示學(xué)習(xí)技術(shù)以支撐態(tài)勢(shì)知識(shí)的提取和融合,提升對(duì)態(tài)勢(shì)數(shù)據(jù)的理解;然后,研究基于知識(shí)的推理技術(shù),以實(shí)現(xiàn)態(tài)勢(shì)圖譜的知識(shí)補(bǔ)全,并支撐基于態(tài)勢(shì)知識(shí)圖譜的智能預(yù)測(cè)應(yīng)用;最后,在3大核心支撐技術(shù)的基礎(chǔ)上提出面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景的新一代多模態(tài)知識(shí)表示、表示學(xué)習(xí)及知識(shí)推理框架,構(gòu)建面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的知識(shí)中臺(tái)。
2、戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)表示
戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)表示的核心目標(biāo)是針對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)與知識(shí)的特點(diǎn),將態(tài)勢(shì)感知相關(guān)的多模態(tài)數(shù)據(jù)、事實(shí)知識(shí)、動(dòng)態(tài)知識(shí)、決策過(guò)程知識(shí)和隱式模糊知識(shí)等進(jìn)行統(tǒng)一表示與組織,為戰(zhàn)場(chǎng)態(tài)勢(shì)感知數(shù)據(jù)的知識(shí)化、知識(shí)組織與存儲(chǔ)以及上層的知識(shí)應(yīng)用及決策提供支撐。
主要研究?jī)?nèi)容包括:1) 實(shí)現(xiàn)態(tài)勢(shì)感知多模態(tài)數(shù)據(jù)表示,包括傳感器、衛(wèi)星及偵察裝備捕獲的信號(hào)、圖片、音頻和視頻等數(shù)據(jù),開(kāi)源數(shù)據(jù)、地理空間等情報(bào)數(shù)據(jù),支撐機(jī)器對(duì)其進(jìn)行有效地建模表示、存儲(chǔ)管理并提供知識(shí)化、知識(shí)關(guān)聯(lián)及知識(shí)計(jì)算的方法;2) 對(duì)態(tài)勢(shì)知識(shí)進(jìn)行表示,包括靜態(tài)的事實(shí)類知識(shí)(目標(biāo)和武器裝備知識(shí)等)、動(dòng)態(tài)類知識(shí)(事件)、規(guī)則類知識(shí)(判斷規(guī)則和作戰(zhàn)規(guī)則等)、過(guò)程類知識(shí)(決策的過(guò)程)以及隱式模糊類知識(shí)(決策模型),使知識(shí)能夠被機(jī)器有效理解并使機(jī)器能夠?qū)χR(shí)進(jìn)行推理從而支撐智能應(yīng)用。良好的表示方法使數(shù)據(jù)及知識(shí)在實(shí)現(xiàn)機(jī)器理解、計(jì)算和推理的同時(shí)也盡可能讓人能夠易于理解,從而進(jìn)行知識(shí)的維護(hù)管理、校驗(yàn)評(píng)估和反饋溯源等。
2.1 經(jīng)典知識(shí)表示技術(shù)
經(jīng)典的知識(shí)表示方法包括邏輯表示、產(chǎn)生式規(guī)則、框架表示、語(yǔ)義網(wǎng)絡(luò)和Petri網(wǎng)等。邏輯表示法形式接近于人類的自然語(yǔ)言,邏輯嚴(yán)密精確,缺點(diǎn)是難以表達(dá)不確定性知識(shí)和模糊性知識(shí)??蚣苁敲枋鰧?duì)象(如戰(zhàn)場(chǎng)目標(biāo))屬性的一種數(shù)據(jù)結(jié)構(gòu),它是由若干結(jié)點(diǎn)和關(guān)系(統(tǒng)稱為槽slot)構(gòu)成的網(wǎng)絡(luò)。Petri網(wǎng)是對(duì)離散并行系統(tǒng)的數(shù)學(xué)表示,適用于描述異步的、并發(fā)的計(jì)算機(jī)系統(tǒng)模型。這些知識(shí)表示方法因其局限性或僅適用于特定場(chǎng)景,在態(tài)勢(shì)感知場(chǎng)景中基本不適用。
語(yǔ)義網(wǎng)絡(luò)(semantic network)是一種以網(wǎng)絡(luò)格式表達(dá)人類知識(shí)構(gòu)造的形式,在一個(gè)語(yǔ)義網(wǎng)絡(luò)中,信息被表達(dá)為一組結(jié)點(diǎn),結(jié)點(diǎn)通過(guò)一組帶標(biāo)記的有向直線彼此相連,用于表示結(jié)點(diǎn)間的關(guān)系。知識(shí)圖譜本質(zhì)上也是一種語(yǔ)義網(wǎng)絡(luò),只是知識(shí)圖譜中使用了更強(qiáng)大的知識(shí)表示方法。
產(chǎn)生式規(guī)則以條件-結(jié)果(IF-THEN)的形式表示知識(shí),是一種非常直觀的知識(shí)表示方法。IF 后面部分描述了規(guī)則的先決條件,而THEN 后面部分描述了規(guī)則的結(jié)論。產(chǎn)生式規(guī)則非常適用于態(tài)勢(shì)感知場(chǎng)景中專家決策知識(shí)的表示。
2.2 知識(shí)圖譜知識(shí)表示方法
知識(shí)圖譜的核心知識(shí)表示方法有2種。1) 使用資源描述框架(模式)(RDF(S))和網(wǎng)絡(luò)本體語(yǔ)言(OWL)2種語(yǔ)義網(wǎng)知識(shí)表示技術(shù);2) 使用屬性圖。
1) RDF與OWL
RDF本質(zhì)是一個(gè)數(shù)據(jù)模型(data model)。其中,R為資源(resource),可指代任何具有URI標(biāo)識(shí)符的網(wǎng)頁(yè)和圖片等;D為對(duì)資源的描述,包括屬性和資源間的關(guān)系;F為框架,包括描述的模型、語(yǔ)言及描述的語(yǔ)法。RDF形式上表示為S-P-O形式的三元組(subject, predicate, object),在知識(shí)圖譜中也稱其為一條知識(shí)或事實(shí);RDF由節(jié)點(diǎn)和邊組成,節(jié)點(diǎn)表明實(shí)體/資源、屬性,邊表明實(shí)體和實(shí)體間的關(guān)系以及實(shí)體和屬性的關(guān)系,同時(shí)還能在節(jié)點(diǎn)和邊的取值上增加約束,從而形成統(tǒng)一知識(shí)標(biāo)準(zhǔn)。RDF的存儲(chǔ)序列化方式有RDF/XML、N-Triples、Turtle、RDFa和JSON-LD等。
RDF的表達(dá)能力有限,無(wú)法區(qū)分類和對(duì)象,也無(wú)法定義和描述類的關(guān)系/屬性,而RDFS通過(guò)對(duì)RDF進(jìn)行類似的類定義及其屬性定義,可以在一定程度上解決RDF表達(dá)能力受限的問(wèn)題;通過(guò)RDF(S)可表達(dá)一些簡(jiǎn)單語(yǔ)義,但在更復(fù)雜場(chǎng)景下,RDF(S)語(yǔ)義表達(dá)能力顯得太弱。因此, W3C(萬(wàn)維網(wǎng)聯(lián)盟)提出了OWL語(yǔ)言擴(kuò)展RDF(S),作為語(yǔ)義網(wǎng)上表示本體的推薦語(yǔ)言。OWL擴(kuò)展的描述能力包括對(duì)局部值域的屬性定義,類、屬性和個(gè)體的等價(jià)性,不相交類的定義,基數(shù)約束,關(guān)于屬性特征的描述等。
2) 屬性圖
屬性圖是由 頂點(diǎn)(vertex)、邊(edge)、標(biāo)簽(label)、關(guān)系類型和屬性(property)組成的有向圖;頂點(diǎn)又稱 節(jié)點(diǎn)(node),邊又稱關(guān)系(relationship);在屬性圖中,節(jié)點(diǎn)和關(guān)系是最重要的實(shí)體。節(jié)點(diǎn)與關(guān)系均可包含屬性,屬性可以任何鍵值形式存在;關(guān)系連接節(jié)點(diǎn),每個(gè)關(guān)系均有一個(gè)方向、一個(gè)標(biāo)簽、一個(gè)開(kāi)始節(jié)點(diǎn)和結(jié)束節(jié)點(diǎn)。關(guān)系方向的標(biāo)簽使屬性圖具有語(yǔ)義化特征。關(guān)系屬性又稱邊屬性,可通過(guò)在關(guān)系上增加屬性,給圖方法提供有關(guān)邊的元信息,如創(chuàng)建時(shí)間和邊權(quán)重等。
屬性圖已被圖數(shù)據(jù)庫(kù)廣泛采用,Neo4J和JanausGraph等圖數(shù)據(jù)庫(kù)均采用了屬性圖模型。
2.3 態(tài)勢(shì)感知知識(shí)表示需求
以俄烏戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景為例,戰(zhàn)場(chǎng)態(tài)勢(shì)知識(shí)包括基礎(chǔ)靜態(tài)知識(shí)(俄烏雙方的軍事裝備、軍事基地、部隊(duì)編制和關(guān)鍵人物等)、開(kāi)源情報(bào)數(shù)據(jù)(如互聯(lián)網(wǎng)媒體中各類報(bào)道)、戰(zhàn)場(chǎng)環(huán)境數(shù)據(jù)(如烏東戰(zhàn)場(chǎng)的地理環(huán)境、氣象天氣和河湖水文等)、戰(zhàn)場(chǎng)感知數(shù)據(jù)(雙方的衛(wèi)星、雷達(dá)和偵察機(jī)等偵察數(shù)據(jù))、動(dòng)態(tài)時(shí)空知識(shí)(事件、事件序列及其關(guān)聯(lián),如某次戰(zhàn)斗事件、一系列的連續(xù)戰(zhàn)斗)和作戰(zhàn)指揮決策知識(shí)(雙方作戰(zhàn)規(guī)則、意圖以及指揮員的決策流程)等多種類型。如何將這些數(shù)據(jù)及知識(shí)使用統(tǒng)一的框架表示,完成從戰(zhàn)場(chǎng)感知數(shù)據(jù)→戰(zhàn)場(chǎng)態(tài)勢(shì)知識(shí)→作戰(zhàn)態(tài)勢(shì)判斷決策的演化,是態(tài)勢(shì)感知多模態(tài)知識(shí)表示的核心問(wèn)題。
美國(guó)知名大數(shù)據(jù)情報(bào)公司Palantir提出使用動(dòng)態(tài)本體論實(shí)現(xiàn)情報(bào)數(shù)據(jù)的組織。本體包括對(duì)象(object)、屬性(properties)和關(guān)系(relationship)3種成分。對(duì)象指被建模的事物,又分為文檔(document)、實(shí)體(entity)和事件(event),文檔是基于文本的,實(shí)體是一些類,如人、地點(diǎn),而事件是以時(shí)間出現(xiàn)的事物;屬性指對(duì)象的特征;關(guān)系指對(duì)象間的關(guān)聯(lián)。Palantir動(dòng)態(tài)本體論通過(guò)對(duì)象來(lái)描述文檔、實(shí)體和事件等,很大程度地增強(qiáng)了知識(shí)表示能力,實(shí)現(xiàn)了動(dòng)態(tài)事件和文檔知識(shí)的表示;然而,它難以實(shí)現(xiàn)態(tài)勢(shì)感知場(chǎng)景中的圖像視頻、事件關(guān)聯(lián)及主題、作戰(zhàn)規(guī)則、決策流程及地理空間等知識(shí)的表示;同時(shí),對(duì)于多種模態(tài)知識(shí)的統(tǒng)一向量表示也未提供表示方案。
由此可見(jiàn),態(tài)勢(shì)感知知識(shí)表示需綜合利用多種知識(shí)表示方法,現(xiàn)在的主流知識(shí)表示方法通常只適用于表示態(tài)勢(shì)感知場(chǎng)景中的部分?jǐn)?shù)據(jù)或知識(shí);態(tài)勢(shì)感知數(shù)據(jù)和知識(shí)與常見(jiàn)知識(shí)表示方法的對(duì)應(yīng)如表1所述。
表1 態(tài)勢(shì)感知知識(shí)表示技術(shù)適用性說(shuō)明
2.4 新一代態(tài)勢(shì)感知知識(shí)表示
本文提出的態(tài)勢(shì)感知知識(shí)表示框架如圖3所示,自底向上分為基礎(chǔ)數(shù)據(jù)表示、本體知識(shí)表示、動(dòng)態(tài)本體與規(guī)則和復(fù)合知識(shí)4層?;A(chǔ)數(shù)據(jù)表示層實(shí)現(xiàn)各模態(tài)戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)的表示,使得不同類別的數(shù)據(jù)使用其最適合的表示方式,從而選用相應(yīng)的存儲(chǔ)來(lái)支撐上層應(yīng)用需求;本體知識(shí)表示層給出了基礎(chǔ)(靜態(tài))態(tài)勢(shì)知識(shí)的表示方法,主要使用基于語(yǔ)義網(wǎng)知識(shí)表示技術(shù)和屬性圖,形成以概念、概念體系、實(shí)體、屬性、關(guān)系和鏈接數(shù)據(jù)結(jié)合的知識(shí)表示模型;動(dòng)態(tài)本體與規(guī)則中定義了動(dòng)態(tài)類的知識(shí)及業(yè)務(wù)規(guī)則,其中動(dòng)態(tài)知識(shí)指需依據(jù)其他數(shù)據(jù)或知識(shí)動(dòng)態(tài)計(jì)算的知識(shí),或隨時(shí)間動(dòng)態(tài)變化的知識(shí);復(fù)合知識(shí)包括事件主題和時(shí)空主題等主題模型、事件間的事理關(guān)系以及業(yè)務(wù)處理的流程等知識(shí)。
圖3 態(tài)勢(shì)感知知識(shí)表示框架
2.4.1 基礎(chǔ)數(shù)據(jù)表示
基礎(chǔ)數(shù)據(jù)表示層采用經(jīng)典數(shù)據(jù)庫(kù)的數(shù)據(jù)表示模型實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)感知數(shù)據(jù)的表示,具體包括:1) 關(guān)系數(shù)據(jù)庫(kù)的E-R圖表示模型;2) 文檔數(shù)據(jù)庫(kù)的文檔表示模型;3) 向量數(shù)據(jù)庫(kù)的向量表示模型;4) 時(shí)態(tài)數(shù)據(jù)庫(kù)的時(shí)序序列模型;5) 空間數(shù)據(jù)庫(kù)的興趣點(diǎn)(POI)、感興趣區(qū)域(ROI)和路徑等基礎(chǔ)GIS模型;6) 計(jì)算機(jī)輔助建模的三維空間模型。
上述表示模型均有成熟的數(shù)據(jù)存儲(chǔ)與計(jì)算產(chǎn)品及方案,因此本框架直接沿用這些成熟的表示方案。在俄烏戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中,地理空間數(shù)據(jù)、偵察數(shù)據(jù)和網(wǎng)頁(yè)文檔等基礎(chǔ)數(shù)據(jù),均以上述相應(yīng)的數(shù)據(jù)表示方法進(jìn)行描述。
2.4.2 本體知識(shí)表示
本體知識(shí)表示主要使用RDF(S)、OWL和QB4ST等語(yǔ)義網(wǎng)知識(shí)表示方式,描述態(tài)勢(shì)感知場(chǎng)景中的靜態(tài)知識(shí),形成概念-實(shí)體-屬性-關(guān)系-知識(shí)鏈接的復(fù)合模型。
1) 概念:根據(jù)語(yǔ)義內(nèi)容的共同特點(diǎn)或關(guān)系劃分出的類稱為概念,概念具有層級(jí),通常使用上下位關(guān)系描述概念間的層級(jí);
2) 實(shí)體:概念中具體對(duì)象稱為實(shí)體,對(duì)應(yīng)于現(xiàn)實(shí)世界中存在的具體事物;
3) 屬性:用于描述實(shí)體本身性質(zhì);
4) 關(guān)系:用于描述不同實(shí)體間的聯(lián)系;
5) 知識(shí)鏈接:與知識(shí)圖譜中各類知識(shí)關(guān)聯(lián)的外部數(shù)據(jù)統(tǒng)稱為知識(shí)鏈接,通過(guò)知識(shí)鏈接可以實(shí)現(xiàn)不同模態(tài)知識(shí)及數(shù)據(jù)的關(guān)聯(lián)。
在俄烏戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中,雙方軍事裝備、軍事基地和部隊(duì)編制等靜態(tài)知識(shí),以及軍事基地等附帶的空間屬性信息等,均以本體知識(shí)方式表示。
2.4.3 動(dòng)態(tài)本體與規(guī)則表示
態(tài)勢(shì)感知場(chǎng)景中作戰(zhàn)等規(guī)則的表示采用產(chǎn)生規(guī)則表示與置信規(guī)則表示2種方法;置信規(guī)則指多條帶概率的規(guī)則進(jìn)行條件關(guān)聯(lián)形成的一組規(guī)則集合,通常采用基于置信規(guī)則庫(kù)(BRB)的建模表示方法。
動(dòng)態(tài)屬性與關(guān)系形成依賴于其他知識(shí),即由其他知識(shí)計(jì)算得到或當(dāng)其他知識(shí)滿足特定條件時(shí)才形成,例如目標(biāo)敵機(jī)的前進(jìn)速度和戰(zhàn)場(chǎng)風(fēng)力等級(jí);由其他知識(shí)計(jì)算得到的動(dòng)態(tài)知識(shí)采用數(shù)學(xué)計(jì)算公式表示,例如某飛機(jī)的速度由2次偵察位置的距離與時(shí)間計(jì)算獲得;當(dāng)其他知識(shí)滿足特定條件才形成的知識(shí)則使用更復(fù)雜的計(jì)算模型表示,包括計(jì)算公式與規(guī)則等。
戰(zhàn)場(chǎng)態(tài)勢(shì)中動(dòng)作可視為一系列元事件,元事件表示一個(gè)動(dòng)作的發(fā)生或狀態(tài)的變化,由驅(qū)動(dòng)事件觸發(fā)詞(trigger)和描述事件結(jié)構(gòu)的元素(argument,如時(shí)間地點(diǎn)、人物等)組成;元事件是一個(gè)簡(jiǎn)單的復(fù)合知識(shí)體。戰(zhàn)場(chǎng)事件之間存在各種關(guān)系,使用事件關(guān)系表示,這些關(guān)系又稱事理,包括順承關(guān)系和因果關(guān)系等。
俄烏戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中雙方指揮部的作戰(zhàn)規(guī)則、部隊(duì)的攻擊范圍、轟炸事件與交火事件以及連續(xù)發(fā)生的一系列事件等知識(shí),屬于動(dòng)態(tài)本體與規(guī)則的表示范疇。
2.4.4 復(fù)合知識(shí)模型
前述3層的知識(shí)通常相對(duì)獨(dú)立存在,雖然知識(shí)之間有各種關(guān)聯(lián)關(guān)系,但并未將其中相似或相關(guān)的知識(shí)作為一個(gè)邏輯整體進(jìn)行組織與使用,對(duì)于邏輯獨(dú)立的知識(shí)之間沒(méi)有實(shí)現(xiàn)它們之間的語(yǔ)義關(guān)聯(lián)關(guān)系,復(fù)合知識(shí)的引入可表示該類復(fù)雜知識(shí)。其中,主題模型是實(shí)現(xiàn)知識(shí)邏輯劃分與組織的方法,在面向態(tài)勢(shì)感知場(chǎng)景中主題模型指從各類知識(shí)中計(jì)算出與某一抽象主題相關(guān)的知識(shí),并使用不同方式表示,包括主題事件與時(shí)空主題。主題事件指一系列與抽象主題相關(guān)的元事件列表;時(shí)空主題通常與主題事件結(jié)合使用,即從時(shí)間和空間2個(gè)維度對(duì)主題進(jìn)行描述,考慮了主題語(yǔ)義信息在時(shí)間及空間上的變化。
復(fù)合知識(shí)還包括事理關(guān)系與流程。事理關(guān)系用于表達(dá)事件之間的非分類學(xué)邏輯關(guān)系,包括順承關(guān)系、因果關(guān)系和條件關(guān)系等,從而實(shí)現(xiàn)對(duì)動(dòng)態(tài)事件知識(shí)中邏輯知識(shí)的描述。流程知識(shí)指以流程圖形式組織的知識(shí),用于說(shuō)明解決已知問(wèn)題的方法,如作戰(zhàn)決策過(guò)程;流程圖是對(duì)算法、工作流或流程的一種框圖表示,以不同類型的框表明不同種類的步驟,每2個(gè)步驟之間以箭頭連接。該表示方法便于說(shuō)明解決已知問(wèn)題。
俄烏戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中的基輔圍攻及俄對(duì)烏海空軍打擊等主題事件、俄兵力分散導(dǎo)致重大損失轉(zhuǎn)而集中轉(zhuǎn)移到烏東等事件之間的關(guān)聯(lián),以及雙方指揮官做出的攻擊或防守方案的過(guò)程等流程知識(shí)均屬于復(fù)合知識(shí)。
3、面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的表示學(xué)習(xí)
第2章提出了面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知數(shù)據(jù)及知識(shí)的統(tǒng)一知識(shí)表示模型,其目標(biāo)為通過(guò)統(tǒng)一的表示實(shí)現(xiàn)數(shù)據(jù)及知識(shí)的統(tǒng)一管理,進(jìn)而形成面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的多模態(tài)知識(shí)圖譜,并通過(guò)態(tài)勢(shì)感知知識(shí)圖譜支撐作戰(zhàn)場(chǎng)景應(yīng)用建設(shè)。
知識(shí)圖譜的構(gòu)建過(guò)程主要包括知識(shí)的建模、提取、融合和補(bǔ)全等步驟,每個(gè)步驟均有不同方法。知識(shí)圖譜的構(gòu)建總體包含了自頂向下和自底向上2種方法。前者通常由專家進(jìn)行知識(shí)本體的定義和實(shí)體的編輯填充;后者則通過(guò)模型從各類數(shù)據(jù)中自動(dòng)抽取概念、實(shí)體以及它們之間的關(guān)系。從方法角度而言,包含基于詞典的方法、基于語(yǔ)言學(xué)規(guī)則的方法和基于機(jī)器學(xué)習(xí)的方法等。
戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景因涉及的數(shù)據(jù)和知識(shí)類型繁多,如果使用傳統(tǒng)方法對(duì)各類數(shù)據(jù)或知識(shí)采用對(duì)應(yīng)的方法,則需使用很多不同類別的方法。為統(tǒng)一知識(shí)圖譜構(gòu)建、融合實(shí)例及基于知識(shí)圖譜的下游任務(wù),文獻(xiàn)總結(jié)了基于知識(shí)圖譜表示學(xué)習(xí)方法的解決方案:知識(shí)圖譜的部分構(gòu)建任務(wù)以及基于知識(shí)圖譜的下游應(yīng)用任務(wù),大部分可轉(zhuǎn)換為基于知識(shí)圖譜的表示學(xué)習(xí)來(lái)解決,構(gòu)建任務(wù)包括基于知識(shí)圖譜的關(guān)系抽取、實(shí)體對(duì)齊、本體映射和知識(shí)補(bǔ)全等,應(yīng)用任務(wù)主要包括基于知識(shí)圖譜的推理衍生任務(wù)。另一方面,基于多模態(tài)知識(shí)圖譜的表示學(xué)習(xí)為不同模態(tài)知識(shí)和知識(shí)間的聯(lián)合處理提供了解決方案,這對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景的多模態(tài)知識(shí)提取和計(jì)算尤其重要。
廣義的表示學(xué)習(xí)指從輸入信息中自動(dòng)學(xué)習(xí)有效特征的學(xué)習(xí)方法,以提高機(jī)器學(xué)習(xí)模型性能;表示學(xué)習(xí)的關(guān)鍵是解決輸入數(shù)據(jù)的底層特征和高層語(yǔ)義信息間的語(yǔ)義鴻溝。機(jī)器學(xué)習(xí)中有局部表示(local representation)和分布式表示(distributed representation)2種方式來(lái)表示特征。局部表示的向量每個(gè)分量對(duì)應(yīng)一個(gè)數(shù)據(jù),各個(gè)分量相互排斥;其向量維度高,向量間距離無(wú)法表示數(shù)據(jù)間的關(guān)聯(lián),擴(kuò)展性差。分布式表示使用低維稠密向量表示,向量中每個(gè)單獨(dú)的分量沒(méi)有意義,分量的組合才能表明具體屬性。分布式表示是深度學(xué)習(xí)最重要的性質(zhì),神經(jīng)網(wǎng)絡(luò)可將高維的局部表示空間映射到低維的分布式表示空間,該過(guò)程又稱嵌入,如圖像矩陣嵌入和詞嵌入。
近年來(lái),基于大規(guī)模弱標(biāo)注數(shù)據(jù)的預(yù)訓(xùn)練模型在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域得到了廣泛應(yīng)用(代表模型分別為ImageNet和BERT)。預(yù)訓(xùn)練模型在基礎(chǔ)淺層嵌入的基礎(chǔ)上進(jìn)一步實(shí)現(xiàn)高層級(jí)特征的學(xué)習(xí)和保存,上層任務(wù)無(wú)需從底層開(kāi)始訓(xùn)練;該預(yù)訓(xùn)練-微調(diào)(pre-train, fine-tune)模式成為一種新范式。為進(jìn)一步簡(jiǎn)化上游任務(wù)的微調(diào)訓(xùn)練,一種新的、稱為Prompt的新范式在自然語(yǔ)言處理領(lǐng)域興起,讓預(yù)訓(xùn)練模型直接適應(yīng)下游任務(wù)。從預(yù)訓(xùn)練模型中構(gòu)建知識(shí)圖譜也得到了多項(xiàng)研究關(guān)注。
總體而言,在知識(shí)表示方面,從基于離散符號(hào)的知識(shí)表示到通過(guò)知識(shí)表示學(xué)習(xí)得到基于稠密向量的分布式表示(如圖4所示),能夠更好捕獲隱匿的知識(shí),并且通過(guò)對(duì)接神經(jīng)網(wǎng)絡(luò)的強(qiáng)大能力,將推理過(guò)程轉(zhuǎn)化為向量間的計(jì)算,從而擺脫傳統(tǒng)基于符號(hào)搜索的推理計(jì)算方式,使推理效率更高。
圖4 從符號(hào)知識(shí)表示到向量知識(shí)表示
戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中知識(shí)圖譜構(gòu)建既需使用廣義表示學(xué)習(xí)能力從多模態(tài)數(shù)據(jù)中學(xué)習(xí)特征并提取知識(shí),又需利用基于態(tài)勢(shì)感知知識(shí)圖譜的表示學(xué)習(xí)完成知識(shí)的補(bǔ)全和上游任務(wù)。本章先介紹常見(jiàn)的知識(shí)表示學(xué)習(xí)方法,再闡述基于態(tài)勢(shì)感知知識(shí)圖譜的表示學(xué)習(xí)。
3.1 知識(shí)圖譜表示學(xué)習(xí)方法
面向知識(shí)圖譜的表示學(xué)習(xí),又稱知識(shí)圖譜的圖嵌入學(xué)習(xí),旨在將知識(shí)圖譜的實(shí)體與關(guān)系映射到低維且稠密的分布式向量表示。依據(jù)圖嵌入學(xué)習(xí)方法的設(shè)計(jì)思路和信息利用程度,可分為基于隨機(jī)游走、基于翻譯距離、基于語(yǔ)義匹配、基于傳統(tǒng)深度學(xué)習(xí)、基于圖神經(jīng)網(wǎng)絡(luò)以及融入額外信息6類圖嵌入學(xué)習(xí)方法。圖5給出了知識(shí)圖譜表示學(xué)習(xí)的一個(gè)示例及常用方法示意圖。
圖5 知識(shí)圖譜表示學(xué)習(xí)示例及常用方法
1) 基于隨機(jī)游走的圖嵌入學(xué)習(xí):該方法先從圖中每個(gè)節(jié)點(diǎn)出發(fā)進(jìn)行隨機(jī)游走,獲取每個(gè)節(jié)點(diǎn)對(duì)應(yīng)的隨機(jī)游走節(jié)點(diǎn)序列,再將每個(gè)節(jié)點(diǎn)序列視為一個(gè)文本句子,節(jié)點(diǎn)序列中的節(jié)點(diǎn)為文本句子中詞,最后利用Word2Vec法得到每個(gè)節(jié)點(diǎn)的表征向量。常用的節(jié)點(diǎn)表征方法包括DeepWalk、Node2Vec和LINE等。
2) 基于翻譯距離的圖嵌入學(xué)習(xí):該方法采用距離評(píng)分函數(shù)對(duì)關(guān)系進(jìn)行建模, Bordes等首次提出基于轉(zhuǎn)移的表示學(xué)習(xí)模型TransE。TransE建模簡(jiǎn)單且學(xué)習(xí)效果良好,其學(xué)習(xí)效率較傳統(tǒng)的知識(shí)推理方法高,因此能夠適應(yīng)大規(guī)模知識(shí)圖譜構(gòu)建。當(dāng)然,該模型也存在不足,包括僅適用于處理1對(duì)1關(guān)系、不能利用實(shí)體的語(yǔ)義層級(jí)信息?;诖耍瑢W(xué)者們提出了一系列TransE的擴(kuò)展模型,如TransH、TransR和TransD等。
3) 基于語(yǔ)義匹配的圖嵌入學(xué)習(xí):該方法通過(guò)匹配實(shí)體和關(guān)系在向量空間的相似性,采用相似度評(píng)分函數(shù)對(duì)事實(shí)三元組建模。代表模型包括RESCAL及其擴(kuò)展和神經(jīng)網(wǎng)絡(luò)匹配模型等。其中,雙線性(RESCAL)模型將關(guān)系映射為轉(zhuǎn)換矩陣,將每個(gè)實(shí)體通過(guò)轉(zhuǎn)換矩陣與向量相關(guān)聯(lián),從而獲取潛在語(yǔ)義;DistMult模型將關(guān)系矩陣限制為對(duì)角矩陣簡(jiǎn)化運(yùn)算量;Complex Embeddings(ComplEx)通過(guò)引入復(fù)值嵌入來(lái)擴(kuò)展DistMult模型,以便更好地建模非對(duì)稱關(guān)系。
4) 基于深度學(xué)習(xí)的圖嵌入學(xué)習(xí):該方法基于現(xiàn)有的深度學(xué)習(xí)模型來(lái)學(xué)習(xí)三元組知識(shí)的特征,按照使用的深度學(xué)習(xí)模型類別,大致可分為基于卷積神經(jīng)網(wǎng)絡(luò)、基于循環(huán)神經(jīng)網(wǎng)絡(luò)和基于膠囊網(wǎng)絡(luò)3類模型。該方法已較少使用,通常被5)描述的基于圖神經(jīng)網(wǎng)絡(luò)方法取代。
5) 基于圖神經(jīng)網(wǎng)絡(luò)的圖嵌入學(xué)習(xí):該方法本質(zhì)上是一種基于深度學(xué)習(xí)的圖嵌入學(xué)習(xí)方法的一種,圖神經(jīng)網(wǎng)絡(luò)憑借其強(qiáng)大的建模圖結(jié)構(gòu)數(shù)據(jù)的能力,能夠更深入地挖掘?qū)W習(xí)圖的結(jié)構(gòu)信息,并對(duì)圖的結(jié)構(gòu)信息進(jìn)行深度編碼。目前圖神經(jīng)網(wǎng)絡(luò)模型已成功應(yīng)用于社交網(wǎng)絡(luò)、醫(yī)藥研究和知識(shí)圖譜等領(lǐng)域。其常用方法包括圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)和圖注意力網(wǎng)絡(luò)(GAT)2種,還包括圖自編碼器、圖生成網(wǎng)絡(luò)和圖時(shí)空網(wǎng)絡(luò)。
6) 引入額外信息的圖嵌入學(xué)習(xí):上述學(xué)習(xí)方法基本專注于學(xué)習(xí)圖譜的結(jié)構(gòu)特征,難以利用知識(shí)圖譜中概念信息和文本描述信息等其他知識(shí)。因此,學(xué)者們提出了融入知識(shí)圖譜中其他知識(shí)的圖嵌入學(xué)習(xí)方法,即在圖嵌入學(xué)習(xí)過(guò)程中融入實(shí)體名稱、關(guān)系名稱和實(shí)體描述等信息,以提升圖嵌入表示可學(xué)習(xí)到的語(yǔ)義信息。
3.2 態(tài)勢(shì)感知知識(shí)圖譜表示學(xué)習(xí)
面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)圖譜具有規(guī)模大、知識(shí)類別豐富等特征,且對(duì)學(xué)習(xí)方法的時(shí)效性有較高要求。綜合這些特征及需求,在戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中重點(diǎn)運(yùn)用基于隨機(jī)游走、基于翻譯距離和基于圖神經(jīng)網(wǎng)絡(luò)3種圖嵌入學(xué)習(xí)方法,同時(shí)使用引入額外信息的圖嵌入學(xué)習(xí)方法以學(xué)習(xí)到更多語(yǔ)義信息。態(tài)勢(shì)感知知識(shí)表示學(xué)習(xí)方法適用性說(shuō)明如表2所示。
表2 態(tài)勢(shì)感知知識(shí)表示學(xué)習(xí)方法適用性說(shuō)明
3.3 態(tài)勢(shì)感知多模態(tài)表示學(xué)習(xí)
在戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中,除了文本知識(shí)和事實(shí)類知識(shí)外,還包括圖像、視頻、語(yǔ)音、時(shí)空和事件等多種模態(tài)的動(dòng)態(tài)知識(shí),而且在實(shí)際作戰(zhàn)環(huán)境中,對(duì)這些實(shí)時(shí)捕獲動(dòng)態(tài)多模態(tài)數(shù)據(jù)的處理比靜態(tài)知識(shí)更加重要。因此,還需引入基于多模態(tài)的表示學(xué)習(xí)方法。
多模態(tài)表示學(xué)習(xí)需同時(shí)從多個(gè)異質(zhì)信息源提取被研究對(duì)象的特征,還要考慮多個(gè)模態(tài)信息的一致性和互補(bǔ)性。按照多模態(tài)表示共享方式可將多模態(tài)表示學(xué)習(xí)分為公共表示學(xué)習(xí)和特異性表示學(xué)習(xí)2類。前者將所有模態(tài)的特征均投影到同一個(gè)表示空間;后者為不同模態(tài)學(xué)習(xí)不同的特征表示空間。多模態(tài)融合的核心問(wèn)題是異質(zhì)性間隙,為了便于討論如何縮小異質(zhì)性差距,根據(jù)不同模態(tài)集成的底層結(jié)構(gòu)將多模態(tài)表示學(xué)習(xí)方法分為聯(lián)合表示、協(xié)調(diào)表示和編解碼器3個(gè)子框架。公共表示學(xué)習(xí)示意圖如圖6所示。
戰(zhàn)場(chǎng)態(tài)勢(shì)感知的多模態(tài)學(xué)習(xí)擬采用目前的多模態(tài)表示學(xué)習(xí)框架,不同之處在于除了常規(guī)的文本、圖像和音頻等模態(tài)數(shù)據(jù)外,還需融合時(shí)空、傳感信號(hào)和動(dòng)態(tài)規(guī)則等知識(shí),為其設(shè)計(jì)合適的編碼器,最終達(dá)到態(tài)勢(shì)多模態(tài)知識(shí)統(tǒng)一表示學(xué)習(xí)的目的。
圖6 公共表示學(xué)習(xí)示意圖
4、面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的推理
態(tài)勢(shì)感知的預(yù)測(cè)環(huán)節(jié)本質(zhì)上可視作一個(gè)推理過(guò)程,即通過(guò)到目標(biāo)的感知與理解,通過(guò)推理得到目標(biāo)的行為預(yù)測(cè)。本章先介紹基于知識(shí)圖譜推理的各種方法,再簡(jiǎn)要說(shuō)明戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中的推理。
推理指基于已知的事實(shí)或知識(shí)推斷得出未知的隱藏事實(shí)或知識(shí)的過(guò)程。面向知識(shí)圖譜的知識(shí)推理分類方法有很多。按照推理模式的維度可分為演繹推理、歸納推理和溯因推理;按照知識(shí)表示方法可分為基于符號(hào)表示和基于向量表示2種推理;按照推理方法可分為基于規(guī)則的推理、基于表示學(xué)習(xí)的推理、基于神經(jīng)網(wǎng)絡(luò)的推理和混合推理。
4.1 知識(shí)推理方法
1) 基于規(guī)則的推理:基于規(guī)則的推理通過(guò)定義或?qū)W習(xí)知識(shí)中存在的規(guī)則進(jìn)行推理,根據(jù)規(guī)則的真值類型又可分為硬邏輯規(guī)則和軟邏輯規(guī)則。硬邏輯規(guī)則中每條規(guī)則的真值均為1,軟邏輯規(guī)則即每條規(guī)則的真值為[0,1]的概率,該類規(guī)則可通過(guò)真值重寫(xiě)轉(zhuǎn)化為硬邏輯規(guī)則。硬邏輯規(guī)則可寫(xiě)成知識(shí)圖譜本體中的SWRL(語(yǔ)義網(wǎng)規(guī)則語(yǔ)言)規(guī)則,再通過(guò)Pellet、Hermit 等本體推理機(jī)進(jìn)行推理。規(guī)則推理在大型知識(shí)圖譜上的效率受限于其離散性,Cohen提出了一種可微的規(guī)則推理機(jī)TensorLog,將知識(shí)庫(kù)中每個(gè)實(shí)體用一個(gè)one-hot向量表示,每個(gè)關(guān)系 r 定義為一個(gè)矩陣算子 M,將邏輯推理規(guī)則形式化為給定實(shí)體和關(guān)系預(yù)測(cè)另一個(gè)實(shí)體的矩陣相乘問(wèn)題,由此量化為實(shí)體得分和置信度的學(xué)習(xí)問(wèn)題。前者通過(guò)得分向量乘以one-hot向量轉(zhuǎn)置獲得;后者通過(guò)最大化知識(shí)圖譜三元組學(xué)習(xí)參數(shù)表達(dá)。
2) 基于表示學(xué)習(xí)的推理:基于知識(shí)圖譜的表示學(xué)習(xí)已在第3章中詳述,基于知識(shí)表示學(xué)習(xí)的推理即使用表示學(xué)習(xí)的方法實(shí)現(xiàn)推理,在此不做贅述。基于表示學(xué)習(xí)的推理還能實(shí)現(xiàn)知識(shí)圖譜中的多跳邏輯推理。
3) 基于神經(jīng)網(wǎng)絡(luò)的推理:基于神經(jīng)網(wǎng)絡(luò)的推理依賴神經(jīng)網(wǎng)絡(luò)的表征能力直接建模知識(shí)圖譜事實(shí)元組,得到向量表示用于推理。與基于表示學(xué)習(xí)的推理相比,其表達(dá)能力更加豐富,推理能力更強(qiáng),但復(fù)雜度更高,可解釋性更弱。
4) 混合推理:基于規(guī)則的推理方法擁有較高準(zhǔn)確率,但難以擴(kuò)展和平移;基于神經(jīng)網(wǎng)絡(luò)的推理具備更好的推理能力、學(xué)習(xí)能力和泛化能力,但神經(jīng)網(wǎng)絡(luò)結(jié)果不可預(yù)測(cè)和解釋。因此,學(xué)者們提出混合推理以結(jié)合不同推理方法間的優(yōu)勢(shì),主要包括混合規(guī)則與分布式表示、混合神經(jīng)網(wǎng)絡(luò)與分布式表示的推理?;旌弦?guī)則與分布式表示的推理使用傳統(tǒng)推理規(guī)則發(fā)現(xiàn)法通過(guò)計(jì)算關(guān)系間的分布式相似度實(shí)現(xiàn);混合神經(jīng)網(wǎng)絡(luò)與分布式表示的推理通過(guò)神經(jīng)網(wǎng)絡(luò)引入外部知識(shí)建模知識(shí)圖譜三元組或通過(guò)神經(jīng)網(wǎng)絡(luò)方法建模知識(shí)圖譜,其輸出進(jìn)一步用于表示模型。此外,基于神經(jīng)-符號(hào)整合的推理認(rèn)為人工智能中基于形式邏輯和演繹推理的符號(hào)系統(tǒng)與基于人工神經(jīng)網(wǎng)絡(luò)的人工智能系統(tǒng)不同之處不僅在于它們的內(nèi)部工作方式,還在于它們的功能。學(xué)者們通過(guò)研究神經(jīng)-符號(hào)的整合推理,考慮將符號(hào)系統(tǒng)的透明性和推理能力與人工神經(jīng)網(wǎng)絡(luò)的健壯性和學(xué)習(xí)能力結(jié)合在一起?;旌贤评矸椒ù篌w上可通過(guò)混合不同推理方法實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),然而深層次的混合模式才能充分利用各方法的優(yōu)勢(shì)。因此,如何對(duì)不同推理方法進(jìn)行深度整合,特別是深度學(xué)習(xí)直接建模知識(shí)圖譜以充分應(yīng)用神經(jīng)網(wǎng)絡(luò)的推理性能將成為未來(lái)研究的熱點(diǎn)。
4.2 戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)推理
如前文所述,在面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的場(chǎng)景中,知識(shí)的類型有很多,包括事實(shí)類三元組知識(shí)、規(guī)則知識(shí)和事理知識(shí)等?;诓煌悇e知識(shí)的推理需使用對(duì)應(yīng)方法,例如,基于規(guī)則知識(shí)的推理需采用基于規(guī)則的推理方法,基于態(tài)勢(shì)感知圖譜推理可使用基于表示學(xué)習(xí)的推理;另一方面,作戰(zhàn)環(huán)境中的推理均要求推理結(jié)果可解釋。因此,在戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景中,會(huì)分別依據(jù)各類別知識(shí)使用不同的知識(shí)推理方法,同時(shí)會(huì)使用混合推理方法來(lái)增強(qiáng)推理能力的同時(shí)保持推理及結(jié)果的可解釋性。態(tài)勢(shì)感知知識(shí)推理方法適用性說(shuō)明如表3所示。
表3 態(tài)勢(shì)感知知識(shí)推理方法適用性說(shuō)明
5、戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)中臺(tái)
基于第2~4章所述面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的知識(shí)表示、表示學(xué)習(xí)與知識(shí)推理,能夠有效為戰(zhàn)場(chǎng)態(tài)勢(shì)感知從數(shù)據(jù)→知識(shí)→應(yīng)用的全生命周期管理提供核心技術(shù)支撐,在此基礎(chǔ)上形成面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的一體化知識(shí)中臺(tái),其架構(gòu)如圖7所示。
圖7 戰(zhàn)場(chǎng)態(tài)勢(shì)感知知識(shí)中臺(tái)架構(gòu)
知識(shí)中臺(tái)的核心能力為知識(shí)表示、表示學(xué)習(xí)和知識(shí)推理,并以此為基礎(chǔ)支撐知識(shí)全生命周期中的其他過(guò)程;統(tǒng)一的知識(shí)表示技術(shù)與統(tǒng)一的多模態(tài)知識(shí)存儲(chǔ)相對(duì)應(yīng),知識(shí)表示技術(shù)決定知識(shí)存儲(chǔ)方式;表示學(xué)習(xí)為知識(shí)的建模、抽取、融合與補(bǔ)全提供技術(shù)基礎(chǔ),形成以表示學(xué)習(xí)為基礎(chǔ)的統(tǒng)一方法;知識(shí)推理為態(tài)勢(shì)感知應(yīng)用場(chǎng)景的深度知識(shí)應(yīng)用提供實(shí)現(xiàn)路徑。同時(shí),知識(shí)中臺(tái)還可接入外部能力來(lái)為知識(shí)全生命周期過(guò)程提供更全面的能力支撐。
基于態(tài)勢(shì)感知知識(shí)中臺(tái)的態(tài)勢(shì)感知應(yīng)用場(chǎng)景工作過(guò)程如下:對(duì)于場(chǎng)景中收集的多模態(tài)數(shù)據(jù),使用相應(yīng)的知識(shí)表示方法進(jìn)行表示并存入對(duì)應(yīng)的存儲(chǔ);通過(guò)以表示學(xué)習(xí)及外部能力為支撐的知識(shí)建模、抽取與融合等步驟,實(shí)現(xiàn)多模態(tài)態(tài)勢(shì)感知知識(shí)圖譜構(gòu)建;以態(tài)勢(shì)感知知識(shí)圖譜為基礎(chǔ),基于知識(shí)推理能力及其他計(jì)算能力構(gòu)建面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的各類應(yīng)用模型,并運(yùn)用于戰(zhàn)場(chǎng)、國(guó)防及軍事基地安全等應(yīng)用場(chǎng)景。
6、結(jié)束語(yǔ)
人工智能技術(shù)已逐步深入應(yīng)用于戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景,以深度學(xué)習(xí)為代表的感知智能技術(shù)和以知識(shí)圖譜為代表的認(rèn)知智能技術(shù)目前已在態(tài)勢(shì)感知場(chǎng)景中得到廣泛應(yīng)用;同時(shí),結(jié)合數(shù)據(jù)與知識(shí)雙輪驅(qū)動(dòng)的新一代人工智能技術(shù)成為當(dāng)前態(tài)勢(shì)感知場(chǎng)景中研究探索的主流,同時(shí)也是未來(lái)的發(fā)展方向。數(shù)據(jù)與知識(shí)雙輪驅(qū)動(dòng)的戰(zhàn)場(chǎng)態(tài)勢(shì)感知新一代人工智能對(duì)數(shù)據(jù)及知識(shí)的有效表示、計(jì)算與推理提出了更高要求。
本文提出了一種結(jié)合多種知識(shí)表示方法的態(tài)勢(shì)知識(shí)統(tǒng)一表示框架,以實(shí)現(xiàn)不同類別數(shù)據(jù)及知識(shí)的高效表示;在此基礎(chǔ)上,提出以表示學(xué)習(xí)為基礎(chǔ)實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)與知識(shí)驅(qū)動(dòng)的融合,包括基于知識(shí)圖譜的表示學(xué)習(xí)及面向戰(zhàn)場(chǎng)多模態(tài)數(shù)據(jù)的表示學(xué)習(xí),為知識(shí)抽取、融合、補(bǔ)全與推理提供技術(shù)支撐;最后,在表示學(xué)習(xí)基礎(chǔ)上歸納了適用于面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景的復(fù)合推理方法,為戰(zhàn)場(chǎng)決策提供實(shí)現(xiàn)途徑。基于面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的知識(shí)表示、表示學(xué)習(xí)與知識(shí)推理,能夠有效地為戰(zhàn)場(chǎng)態(tài)勢(shì)感知從數(shù)據(jù)→知識(shí)→應(yīng)用的全生命周期管理提供核心技術(shù)支撐;在此基礎(chǔ)上可形成面向戰(zhàn)場(chǎng)態(tài)勢(shì)感知的一體化知識(shí)中臺(tái)。
為了能夠更好地適用于真實(shí)戰(zhàn)場(chǎng)態(tài)勢(shì)感知場(chǎng)景,后續(xù)研究的工作方向及面臨的挑戰(zhàn)包括:1)響應(yīng)速度,包括數(shù)據(jù)處理、知識(shí)加工及知識(shí)推理的響應(yīng)速度;2)數(shù)據(jù)缺失問(wèn)題:由于相互干擾,態(tài)勢(shì)感知數(shù)據(jù)不可避免出現(xiàn)缺失,如何處理數(shù)據(jù)缺失是方法模型適用的前提;3)錯(cuò)誤數(shù)據(jù)剔除,由于作戰(zhàn)雙方對(duì)抗必然會(huì)接收到對(duì)方故意制造的假數(shù)據(jù),需剔除錯(cuò)誤數(shù)據(jù)以避免得到錯(cuò)誤的決策模型。
聯(lián)系客服