來源:《中國計算機學(xué)會通訊》2015年第3期《譯文》
作者:圖鄔卡·魯特撒羅(Tuukka Ruotsalo)
朱利奧·亞庫奇(Giulio Jacucci)
佩特里·麥里馬克(Petri Myllym?ki)
塞繆爾·卡斯基(Samuel Kaski)
譯者:劉奕群
http://www.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2851766225118
即使在搜索開始時用戶并沒有顯式給出搜索意圖,系統(tǒng)也應(yīng)當(dāng)使用戶的搜索逐步逼近其所需要的相關(guān)信息。
主要觀點:
● 現(xiàn)代搜索引擎在協(xié)助用戶完成復(fù)雜查詢?nèi)蝿?wù)方面的能力仍極為有限,用戶需要將大量認知精力耗費在尋找導(dǎo)航提示上,這使得閱讀和選擇所需信息的過程不可避免地受到影響。
● 交互式搜索意圖理解通過計算建模和可視化交互的方式協(xié)助用戶進行信息探索,通過有效的交互界面使得用戶有效獲取信息。
● 在進行任務(wù)級別的信息查找時,交互式搜索意圖理解能夠極大提高用戶的信息獲取效率(提升超過100%)。
研究背景:
根據(jù)用戶行為分析的最新研究進展,用戶搜索行為中有相當(dāng)比例屬于“信息探索”的范疇,用戶在進行這類搜索時,其信息需求往往較為復(fù)雜并且具有動態(tài)演化的特性[18]。用戶因而面臨著如何構(gòu)建合適的查詢以表述其信息需求,進而查找到所需信息的問題。信息搜索研究中的一系列相關(guān)工作,如弗納斯(Furnas)等人[13],薩拉塞維克(Saracevic)與坎特(Kantor)[21],以及貝茨(Bates)[7,8]等人的工作都展示了這一問題的存在。通過編寫查詢的方式來獲取信息并不屬于人類所熟悉的交互行為模式,例如,弗納斯等人[13]的工作中,兩名具有同樣搜索意圖的實驗對象在選擇查詢關(guān)鍵詞上的一致性概率僅有不足0.2,這意味著通用搜索環(huán)境中80%到90%的失敗幾率。薩拉塞維克與坎特[21],以及后來的趙(Zhao)與卡倫(Callan)[25]也得到了類似的實驗結(jié)果。這些發(fā)現(xiàn)充分說明,以用戶編寫查詢?yōu)橹饕换シ绞降乃阉骷夹g(shù)存在著局限,而更加合理的搜索交互技術(shù)應(yīng)當(dāng)能夠?qū)τ脩羯形辞逦硎龅乃阉餍枨筮M行主動發(fā)現(xiàn)與建模。
當(dāng)前商用搜索引擎的簡單交互方式以向用戶提供搜索結(jié)果列表為主要形式,這使得用戶不得不將其有限的注意力資源集中在發(fā)現(xiàn)可能與其信息需求相關(guān)的信息資源上,而更為理想的搜索引擎系統(tǒng),應(yīng)當(dāng)具備發(fā)現(xiàn)用戶潛在搜索意圖的能力。實際應(yīng)用環(huán)境里,用戶對其信息需求的描述往往很難做到最優(yōu),通常情況下,用戶查詢僅能為其真實搜索意圖提供有限的線索,這要求搜索引擎系統(tǒng)需要提供相應(yīng)技術(shù)功能,使用戶能夠在與搜索引擎的交互過程中逐漸優(yōu)化其意圖表達。這種更加適應(yīng)人類信息處理能力的搜索交互機制需要整合人機交互、信息檢索和機器學(xué)習(xí)等方面的技術(shù)成果,為克服搜索引擎與人類認知能力之間的障礙提供有效手段。
當(dāng)前,已經(jīng)有部分研究人員開展了自適應(yīng)搜索和交互式搜索的技術(shù)研究。赫斯特(Hearst)等人[16]基于信息過濾與可視化技術(shù)開發(fā)了多種用戶搜索交互界面,以層次化、屬性化[24]與結(jié)果聚類[16]等形式來展示查詢關(guān)鍵詞與搜索結(jié)果之間的相似性[15]。馬爾基奧尼尼(Marchionini)[18]提出了一種支持信息探索功能的搜索界面,并提供了相應(yīng)的視頻瀏覽與內(nèi)容檢索功能。盡管這部分研究工作都具有很強的實用性,也展示了提升搜索性能的潛力,但它們?nèi)耘f局限在對搜索引擎針對給定用戶查詢所反饋的結(jié)果信息的挖掘整合上。當(dāng)用戶并不熟悉相關(guān)領(lǐng)域的背景知識和語境時,其最初的信息需求表述(甚至包括后續(xù)的查詢修改)往往不是最優(yōu)的[12],這將使得上述技術(shù)方案的有效性大打折扣。
不僅如此,用戶通常會在搜索過程中逐漸習(xí)得與查詢需求相關(guān)的表述形式,這使得用戶的查詢過程往往受到搜索引擎針對最初查詢返回結(jié)果內(nèi)容的限制。例如,用戶在進行“搜索引擎”這一主題的查詢時,所獲得的信息條目中絕大部分都只包括與“搜索引擎”相關(guān)的詞匯,這使得用戶基本不可能探索到與“搜索引擎”相關(guān)的其他主題的內(nèi)容(如“信息檢索”、“信息搜索行為”等)。在這些相關(guān)工作之外,絕大部分信息檢索理論與系統(tǒng)研究均假設(shè)用戶在搜索交互過程中僅進行較為有限的交互,而主要充當(dāng)被動的信息獲取者的角色。
將搜索意圖理解與可視化用戶交互技術(shù)結(jié)合,能夠有效協(xié)助用戶發(fā)現(xiàn)新知識并極大提升其信息獲取過程的效率。
現(xiàn)代商用搜索引擎每天處理數(shù)以億計的請求,并在毫秒級向用戶反饋相應(yīng)的搜索結(jié)果。對于那些用戶可以方便地組織查詢進行查找的任務(wù)(例如“定位最近的餐館”、“找到某本書的書評信息”等),搜索引擎的處理效果日臻完美。然而,搜索引擎卻不太擅于處理那些使用簡單的關(guān)鍵詞查詢無法很好描述的復(fù)雜查詢?nèi)蝿?wù)(例如信息挖掘或者發(fā)現(xiàn)等)。在這類通常被稱為“探索類搜索”的信息挖掘與發(fā)現(xiàn)任務(wù)中,用戶通常無法有效地描述其需求,并且在反復(fù)的搜索和閱讀過程中產(chǎn)生新的搜索意圖[8, 9, 18]。這一現(xiàn)象在當(dāng)前各類信息檢索系統(tǒng)中普遍存在,其根源則可以追溯到20世紀(jì)80年代就被研究人員描述過的“詞匯不匹配”問題[13]。本質(zhì)上,“詞匯不匹配”問題的根源在于:由于知識背景的差異,內(nèi)容信息的生產(chǎn)者和消費者通常使用截然不同的詞匯來描述相同的含義,這造成了“編碼”(撰寫內(nèi)容)與“解碼”(搜索內(nèi)容)過程不匹配的困境[8, 21]。
隨著網(wǎng)絡(luò)應(yīng)用水平的提高,搜索行為逐漸從簡單的網(wǎng)頁定位任務(wù)進化為包括信息探索在內(nèi)的一系列復(fù)雜任務(wù)[23],信息需求和查詢意圖的不確定性也與日俱增,如何協(xié)助用戶更好地完成各類復(fù)雜搜索任務(wù)則變得日益重要。
為此,交互式搜索意圖理解技術(shù)應(yīng)運而生,通過增強信息檢索系統(tǒng)與用戶之間的交互能力,該項技術(shù)能夠超越傳統(tǒng)搜索實現(xiàn)發(fā)現(xiàn)信息的功能。在交互式搜索意圖理解技術(shù)的支持下,搜索引擎系統(tǒng)挖掘可能與用戶需求相關(guān)的搜索意圖,并將這些意圖通過可視化的方式展現(xiàn)在當(dāng)前需求的周圍,用戶可以對這些搜索意圖進行選擇,搜索引擎會根據(jù)用戶的選擇實時修正對用戶搜索意圖的評估。
交互式搜索意圖理解系統(tǒng)基于如下兩個原則進行設(shè)計:
可視化:系統(tǒng)需要能夠?qū)⒂脩舻男畔⑿枨蠛涂赡艿乃阉饕鈭D在二維信息空間中加以可視化展示(如圖1所示);
動態(tài)調(diào)整:由于用戶的反饋通常是有限且偏頗的,因此,系統(tǒng)所建立的用戶意圖模型必須能夠?qū)Σ淮_定性加以處理,并且有效地平衡用戶在信息空間中的廣度探索與深度挖掘這兩方面的需求。
通過對用戶查詢和數(shù)據(jù)元素(如關(guān)鍵詞等)的可視化,交互式搜索意圖理解系統(tǒng)能夠展示其對用戶搜索意圖的理解,并將當(dāng)前的查詢需求和可能的搜索意圖發(fā)展方向在信息空間中加以展示。在查詢過程之初,搜索引擎對用戶信息需求的理解往往十分有限,這要求系統(tǒng)需要能夠在初始查詢輸入時即可對用戶意圖加以預(yù)測。將用戶意圖及他們之間的關(guān)系展示在信息空間之后,用戶能夠?qū)υ撃P瓦M行必要的反饋,系統(tǒng)依據(jù)反饋信息更新其對用戶意圖的評估,并返回相應(yīng)檢索信息,更新信息空間的展示。
交互式搜索意圖理解示例
SciNet科技文獻搜索系統(tǒng)(http://augmentedresearch.hiit. fi/)是一個依照交互式搜索意圖理解技術(shù)的兩大原則設(shè)計實現(xiàn)的信息檢索系統(tǒng)(如圖2所示)[20]。該系統(tǒng)目前已經(jīng)索引了超過5000萬篇科技文獻,旨在協(xié)助用戶更好地理解初始查詢內(nèi)容,并通過反饋迭代快速定位到特定研究領(lǐng)域的相關(guān)文獻[14, 20]。
在圖2所展示的應(yīng)用場景中,用戶希望了解“三維手勢(3D gesture)”的相關(guān)內(nèi)容,他輸入這個詞作為其初始查詢。隨后,SciNet系統(tǒng)將包含用戶當(dāng)前搜索意圖和可能的搜索意圖以及他們之間關(guān)系的信息空間圖以雷達圖的形式展現(xiàn)給用戶。用戶即可在此界面上對系統(tǒng)提供的各個可能的搜索意圖進行操作,并逐漸推進搜索進程。
圖2(a)展示了系統(tǒng)對初始查詢“三維手勢(3D gesture)”的響應(yīng)結(jié)果,可以看到,“視頻游戲(video games)”、“用戶界面(user interface)”、“手勢識別(gesture recognition)”、“虛擬現(xiàn)實(virtual reality)”等可能的搜索意圖被展示在不同的方向上。在圖2(b)中,用戶選中了“手勢識別(gesture recognition)”作為進一步的搜索目標(biāo),系統(tǒng)因而根據(jù)用戶的交互歷史提供了更為具體(如“最近鄰方法”、“隱馬爾科夫模型”等)或者更為寬泛(如“指示手勢”、“空間交互”等)的一系列后續(xù)搜索方向供其選擇。在這一過程中,系統(tǒng)依照用戶反饋對候選搜索意圖的相關(guān)性和不確定性進行評估,并基于一種快速的在線回歸模型完成任務(wù)級別的搜索意圖理解[20]。搜索意圖在系統(tǒng)中被展示為一系列的關(guān)鍵詞項,而選擇哪些意圖加以展示的過程是基于“探索-挖掘”(exploration-exploitation)范式來完成的。這一選擇過程中,系統(tǒng)對候選搜索意圖的相關(guān)性和確定性均予以重視,這使得不同類型的搜索意圖都可能在系統(tǒng)中得以展現(xiàn),用戶因而可以較自由地選擇進行廣度探索或深度挖掘。例如,如果用戶在選擇了“手勢識別”之后又選擇了“隱馬爾科夫模型”,則系統(tǒng)一方面基于深度挖掘的策略推薦與這一系列選擇最為相關(guān)的內(nèi)容,即基于隱馬爾科夫模型進行手勢識別相關(guān)的具體技術(shù)論文,另一方面也會基于廣度探索的策略展示一些更具不確定性的搜索意圖(如手勢識別中的其他計算模型等)。
從信息檢索研究的角度來講,向用戶主動展示一部分具有不確定性的候選搜索意圖是與以最大化相關(guān)性為主要目標(biāo)的傳統(tǒng)方法背道而馳的。交互式搜索意圖理解系統(tǒng)引入這一策略,主動提供一些盡管與初始查詢并不顯著相關(guān),但可能對用戶探索發(fā)現(xiàn)信息有益的資源,從而協(xié)助用戶解決“詞匯不匹配”問題。實驗結(jié)果顯示,這一策略能夠顯著提升任務(wù)級搜索性能。
為了實現(xiàn)這一功能,系統(tǒng)的用戶交互界面提供了一種較為自然的相關(guān)性反饋機制,系統(tǒng)提供了隨鼠標(biāo)移動的關(guān)鍵詞內(nèi)容放大功能,以便利用戶閱讀。用戶只須將關(guān)鍵詞拖近或拖離雷達圖中央,就可以提升或降低其重要程度,并觸發(fā)系統(tǒng)即時對搜索意圖和搜索結(jié)果進行更新。與其他展現(xiàn)形式相比,系統(tǒng)所采用的雷達圖能夠較好地平衡信息展現(xiàn)的數(shù)量與可讀性,避免了用戶交互自由度設(shè)置不當(dāng)帶來的與可視化界面交互困難的問題。
搜索意圖的可視化交互
SciNet系統(tǒng)的例子向我們展示了可視化技術(shù)能夠有效引導(dǎo)用戶反饋。用戶反饋可以直接對構(gòu)建搜索意圖模型(圖2雷達圖區(qū)域中的內(nèi)圈)或確定未來探索方向(圖2雷達圖區(qū)域的外圈)作出貢獻。由于受“詞匯不匹配”問題的影響,絕大部分用戶往往難以將其信息需求準(zhǔn)確表述為查詢關(guān)鍵詞,因而其初始構(gòu)建的查詢也往往不夠精準(zhǔn)。因此,在后續(xù)的交互過程中,建立合理的交互與反饋機制引導(dǎo)用戶反饋進而明確搜索意圖就顯得格外重要。這一論斷可以認為是建立在認知科學(xué)中普遍被承認的“辨識比回憶更容易完成”[3]的基礎(chǔ)上,根據(jù)這一理論,人類辨識特定事物的能力往往優(yōu)于從無到有描述該事物的能力。
盡管如此,大量信息檢索領(lǐng)域的相關(guān)研究工作證實,即使相關(guān)性反饋能夠使搜索系統(tǒng)更好地滿足用戶搜索需求,用戶卻并不樂意提供這種顯式的反饋信息[18]。這一現(xiàn)象與另外兩個認知科學(xué)中的發(fā)現(xiàn)密切相關(guān),即:相比復(fù)雜的事物而言,用戶更容易辨識簡單的事物;相比獨立的概念而言,用戶更容易理解相關(guān)的概念[6]。鑒于以上發(fā)現(xiàn),要求用戶判斷特定的文檔相關(guān)性甚至比要求其組織一個新查詢更加困難。
信息可視化技術(shù)將費時費力的相關(guān)性評估工作轉(zhuǎn)變成為了一個更加自然流暢的辨識過程。與要求用戶閱讀完整的文檔內(nèi)容并進行相關(guān)性判斷相比,從文檔中提取關(guān)鍵內(nèi)容供用戶進行搜索意圖的選擇顯然更加便捷[1, 17]。
最近的研究工作中,可視化技術(shù)也被應(yīng)用于文獻引用關(guān)系的推理與挖掘,例如:增量交互式數(shù)據(jù)網(wǎng)絡(luò)[10]等。盡管此類系統(tǒng)展示了可視化在推理挖掘中的重要性,此類系統(tǒng)往往僅允許用戶基于數(shù)據(jù)網(wǎng)絡(luò)中已有的鏈接進行信息訪問,而并不支持用戶參與修正搜索意圖模型的操作[1]。
借助搜索意圖可視化技術(shù),信息檢索系統(tǒng)呈現(xiàn)給用戶一系列適合人類視覺感知系統(tǒng)處理的意圖信息,并且隨著用戶與系統(tǒng)的交互引發(fā)相應(yīng)意圖數(shù)據(jù)隨之動態(tài)變化的同時,這一特性仍然能夠保持。這類交互系統(tǒng)需要支持在線計算的數(shù)據(jù)驅(qū)動的可視化技術(shù),以便交互過程的在線運算需求。不僅如此,該系統(tǒng)除了展現(xiàn)用戶已經(jīng)較為熟悉和容易辨識的信息條目之外,還應(yīng)從這些用戶熟悉的條目出發(fā),通過關(guān)聯(lián)關(guān)系展現(xiàn)對用戶進行信息探索有益的其他信息,以避免用戶陷入高度重復(fù)的上下文信息(通常被稱為“上下文氣泡”)中。
在廣度探索與深度挖掘中尋找平衡
在我們展示的以SciNet為代表的交互式搜索場景中,搜索具有高度動態(tài)演化的特性,這使得我們不僅要充分利用用戶反饋推進信息深度挖掘過程,也應(yīng)當(dāng)為信息的廣度探索提供必要的支持。用戶應(yīng)當(dāng)既能夠在信息空間中聚焦于特定主題(信息挖掘),又能夠適當(dāng)擴展其搜索以了解更多相關(guān)主題的內(nèi)容(信息探索)。
這一機制的建立對于試圖了解陌生領(lǐng)域信息的用戶尤為重要。通常情況下,檢索用戶容易陷入心理學(xué)家描述的“錨定偏置”的心理狀態(tài)中,即用戶在不確定性較高的情況下,有過分依賴于其最早獲得的特定信息(錨定信息)而不愿進行調(diào)整的傾向[22]。用戶在交互過程中因而不愿放棄初始的信息需求描述或?qū)ζ溥M行較大修改,這將導(dǎo)致用戶后續(xù)的查詢意圖描述偏向于已有的知識結(jié)構(gòu),并影響其對新信息的進一步發(fā)現(xiàn)與探索。
這一行為現(xiàn)象對使用機器學(xué)習(xí)方法進行搜索意圖理解提出了新的挑戰(zhàn),一種理想的機器學(xué)習(xí)方法應(yīng)當(dāng)能夠在預(yù)測用戶搜索意圖的同時,允許用戶保持對搜索過程的掌控,這使得在線學(xué)習(xí)方法成為了必然的選擇。在線學(xué)習(xí)方法能夠在每次獲知用戶反饋信息后及時更新模型,以便對搜索意圖的未來演化方向加以預(yù)測。在線學(xué)習(xí)方法的目的是通過交互方式對內(nèi)容的相關(guān)性進行預(yù)測,這意味著在算法進行預(yù)測之后,用戶將即時給出預(yù)測效果的反饋,而相關(guān)反饋信息則會被立即用于檢索系統(tǒng)對預(yù)測模型的優(yōu)化。
傳統(tǒng)機器學(xué)習(xí)方法在面向在線預(yù)測問題時,往往無法判斷何種交互選項最有助于系統(tǒng)提升預(yù)測與可視化效果,簡單地將當(dāng)前系統(tǒng)認為最為相關(guān)的意圖作為預(yù)測方向?qū)⑹顾惴ㄊ芾в诖蝺?yōu)解,使得用戶停留在其先驗知識定義的有限信息空間(“上下文氣泡”)中。例如,由于其初始查詢的范圍過于具體,搜索“三維手勢”的用戶在此策略下將無法獲取到諸如“指示手勢”等需要加以探索才能獲得的信息。一種在收集利用用戶反饋信息的同時保持信息探索能力的策略是采用增強學(xué)習(xí)中的“探索-挖掘”范式[5]。在該學(xué)習(xí)范式中,預(yù)測模型與其環(huán)境(用戶)形成在線的信息環(huán)路,學(xué)習(xí)過程則是一個在廣度探索(展示用戶未探索到的信息條目以收集反饋信息)與深度挖掘(展示與當(dāng)前搜索意圖最為相關(guān)的信息條目)中尋找平衡的過程。
在在線學(xué)習(xí)方法所構(gòu)建的意圖模型指導(dǎo)下,搜索系統(tǒng)將協(xié)助用戶在不確定性條件下進行信息搜索,并提供針對模型預(yù)測結(jié)果的反饋信息。由于反饋信息數(shù)量有限,質(zhì)量也參差不齊,關(guān)于用戶需求的判定結(jié)果主要是不確定性的,這使得檢索系統(tǒng)需要具備處理不確定性數(shù)據(jù)的能力。此外,鑒于上述算法都是建立在概率模型的基礎(chǔ)上,它們將對預(yù)測結(jié)果的不確定性進行定量度量,并以此決定展現(xiàn)給用戶的是最優(yōu)條目[5]。
從單一查詢效用到任務(wù)整體效果
在進行處理用戶信息需求的信息檢索系統(tǒng)研究時,需要充分意識到系統(tǒng)設(shè)計的出發(fā)點并非提升單一查詢級別的效用,而是提升整個任務(wù)級別的效果。在交互信息檢索系統(tǒng)中,用戶經(jīng)常被要求付出額外的努力以完成搜索任務(wù)。盡管這些努力可能并非全部有效,用戶往往仍能夠通過這一過程更加有效地完成任務(wù)。為了對檢索性能有全局性的理解,我們認為應(yīng)當(dāng)同時關(guān)注檢索系統(tǒng)兩個方面的特性:檢索系統(tǒng)在處理具有清晰表述的特定信息需求時的效果,以及在系統(tǒng)交互模式下用戶完成任務(wù)的整體效果。
我們設(shè)計了基于任務(wù)的檢索實驗,以驗證SciNet系統(tǒng)的性能。在該實驗中,要求每位用戶在30分鐘時間內(nèi)使用檢索系統(tǒng)訪問一個超過5000萬篇學(xué)術(shù)論文的語料庫。我們比較了具有交互意圖理解能力的檢索系統(tǒng)與一個針對手工輸入查詢返回搜索結(jié)果列表的傳統(tǒng)檢索系統(tǒng)的性能。檢索結(jié)果質(zhì)量、可視化使用方式與反饋機制均被納入了性能評估的范疇[14, 20]。實驗結(jié)果證明,交互意圖理解能夠顯著提升用戶完成搜索任務(wù)的效果。根據(jù)專家的評判,交互意圖理解系統(tǒng)任務(wù)完成的效果明顯較優(yōu),而用戶交互界面在提升交互能力的同時并未增加搜索所需的時間。我們認為,SciNet系統(tǒng)提供的可視化與交互模型改進了信息檢索質(zhì)量,因此相對傳統(tǒng)檢索系統(tǒng)而言帶來了較大的性能提升。特別值得一提的是,交互意圖理解方法在不損失精度的同時召回了更多新信息。這一實驗結(jié)果說明,與基于傳統(tǒng)交互方式的檢索系統(tǒng)相比,交互意圖理解技術(shù)能夠有效提升信息探索與發(fā)現(xiàn)的效率(參見表1)。
普適計算環(huán)境中的意圖理解
對于檢索系統(tǒng)而言,吸引用戶更好地完成交互過程將有助于建立更好的交互模式,并降低用戶信息需求表達中的不確定性。前文中,我們發(fā)現(xiàn)SciNet系統(tǒng)能夠顯著提升用戶完成檢索任務(wù)的效果,但這僅僅是在搜索系統(tǒng)設(shè)計中融入人本計算理念的最初一步。具有意圖感知能力的檢索系統(tǒng)應(yīng)當(dāng)至少可以利用如下兩種技術(shù)形式進一步提升其性能。
可穿戴設(shè)備與增強現(xiàn)實技術(shù)
利用頭戴式可視設(shè)備(Head-Mounted Displays, HMDs),檢索系統(tǒng)可以通過預(yù)知用戶可能感興趣的事物實現(xiàn)功能擴展,為用戶提供增強現(xiàn)實的場景體驗。用戶對所展示元素的顯式或隱式反饋在一定程度上展示了其真實意圖,系統(tǒng)進而就可以利用這些上下文反饋信息即時改進對用戶意圖的估計。圖3(a)展示了特定信息元素(如研究主題、研究小組、論文等)是如何在頭戴式可視設(shè)備構(gòu)建的增強現(xiàn)實場景中進行展示,以便用戶進行辨識和交互的[2]。依照圖中的示例,在用戶參加會議的海報論文展示環(huán)節(jié)的過程中,系統(tǒng)可以通過各類視覺線索收集信息以推知用戶興趣和意圖,從而在用戶不與搜索引擎進行任何交互的前提下建立搜索意圖模型。
利用生理計算技術(shù)收集隱式反饋信息 可穿戴計算技術(shù)的進步(如可穿戴式腦電圖儀的出現(xiàn))使得實時收集用戶的情感或認知狀態(tài)成為可能,包括智能手表等腕部可穿戴設(shè)備中也集成了越來越多的生理狀態(tài)傳感器(如測定皮膚電流或心跳的傳感器)。這使得研究者可以收集到眾多之前難以獲知的人類生理信號,并將其應(yīng)用于反饋信息的提取中。
已有研究工作說明,情感狀態(tài)信息有助于提升相關(guān)性預(yù)測的準(zhǔn)確性[4],而生理心理信號也已被多媒體檢索系統(tǒng)用于提升性能[19]。圖3(b)展示了一個利用腦電傳感器收集大腦信號并進行詞項級別相關(guān)性預(yù)測的實驗系統(tǒng)。在實驗中,通過收集被試用戶的神經(jīng)活動信息,可以直接對特定文本詞項與特定主題的相關(guān)性進行判定[11]?;谏硖卣鞯南嚓P(guān)性判斷信息或面向視覺環(huán)境的隱式反饋信息可以作為顯式反饋信息的有益補充,協(xié)助檢索系統(tǒng)提升意圖理解的效果。
結(jié)論
大量近期研究進展說明,搜索引擎在支持用戶完成探索類查詢?nèi)蝿?wù)方面還有相當(dāng)大的提升余地。總體而言,研究人員普遍意識到,需要構(gòu)建更加合理的檢索與信息探索機制,以便將人類與計算機的信息處理能力更有效地結(jié)合。
交互式搜索意圖理解是一種在理論上合理、在實際應(yīng)用中也行之有效的方法,能夠有力支持用戶進行信息探索與發(fā)現(xiàn)的過程。它能夠提升用戶的信息處理能力,并協(xié)助用戶在繁雜的信息空間中進行高效的信息發(fā)現(xiàn)。
交互式搜索意圖理解為用戶提供了更好獲知信息空間的有效手段,也使得用戶能夠更有效地提供反饋信息,以便系統(tǒng)能夠高效地理解用戶的真實搜索意圖。
為推動用戶更加主動地參與到搜索系統(tǒng)交互反饋的機制中,以便提升其信息探索與知識獲取的水平,需要搜索交互技術(shù)跳出傳統(tǒng)的“關(guān)鍵詞查詢框+結(jié)果列表展示”的窠臼,以便用戶能夠更有效地與系統(tǒng)進行交流并更好地掌控其信息發(fā)現(xiàn)的過程。在交互過程中,基于包含大量噪音的用戶反饋信息實時對意圖進行理解建模是非常困難的過程,需要機器學(xué)習(xí)模型具有在線學(xué)習(xí)與擴展的能力。信息檢索系統(tǒng)的設(shè)計過程也必須最終整合包括交互可視化、意圖預(yù)測、多模態(tài)反饋等方面的技術(shù),還需要對任務(wù)和目標(biāo)級別的高層上下文信息有充分的認知。
與簡單的定位相關(guān)文檔相比,我們需要檢索系統(tǒng)在協(xié)助人類完成信息獲取任務(wù)方面發(fā)揮更大的作用。用戶因而需要一種適應(yīng)其信息獲取能力與行為模式的搜索引擎系統(tǒng),而不是只能被動地適應(yīng)系統(tǒng)本身。■
致謝:
本文工作得到芬蘭科學(xué)院(278090, Multi-vire 255725 and the COIN Center of Excellence 251170),芬蘭國家技術(shù)創(chuàng)新局(D2I and Re:KnoW)以及歐盟理事會第7框架項目(MindSee 611570)的部分支持。部分數(shù)據(jù)來自于湯姆遜路透公司Web of Science數(shù)據(jù)庫,也有部分數(shù)據(jù)采集自ACM, IEEE及Springer數(shù)字圖書館的內(nèi)容。
注:
* 本文譯自Communications of the ACM, "Interactive Intent Modeling: Information Discovery Beyond Search", 2015, 58(1): 86~92一文。
表:
表1 交互意圖理解技術(shù)的主要優(yōu)勢
|
|
|
|
|
|
圖:
作者:
圖鄔卡·魯特撒羅(Tuukka Ruotsalo):阿爾托大學(xué)赫爾辛基信息技術(shù)研究所博士后研究員。tuukka.ruotsalo@aalto.fi
朱利奧·亞庫奇(Giulio Jacucci):芬蘭赫爾辛基大學(xué)計算機科學(xué)系教授,MultiTaction 公司聯(lián)合創(chuàng)始人。giulio.jacucci@cs.helsinki.fi
佩特里·麥里馬克(Petri Myllym?ki):芬蘭赫爾辛基大學(xué)計算機科學(xué)系教授。petri.myllymaki@cs.helsinki.fi
塞繆爾·卡斯基(Samuel Kaski):阿爾托大學(xué)赫爾辛基信息技術(shù)研究所所長,阿爾托大學(xué)信息與計算機科學(xué)系教授。samuel.kaski@hiit.fi
譯者:
劉奕群
CCF高級會員。清華大學(xué)副教授。主要研究方向為互聯(lián)網(wǎng)信息檢索。yiqunliu@tsinghua.edu.cn
參考文獻
[1] Ahn, J.-W. and Brusilovsky, P. Adaptive visualization for exploratory information retrieval. Information Processing & Management 49, 5 (Sept. 2013), 1139~1164.
[2] Ajanki, A., Billinghurst, M., Gamper, H., J?rvenp??, T., Kandemir, M., Kaski, S., Koskela, M., Kurimo, M., Laaksonen, J., Puolam?ki, K., Ruokolainen, T., and Tossavainen, T. An augmented reality interface to contextual information. Virtual Reality 15, 2-3 (June 2011), 161~173.
[3] Anderson, J.R. Learning and Memory: An Integrated Approach, First Edition. John Wiley & Sons, New York, 2000.
[4] Arapakis, I., Athanasakos, K., and Jose, J.M. A comparison of general vs. personalised affective models for the prediction of topical relevance. In Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval (Geneva, Switzerland, July 19–23). ACM Press, New York, 2010, 371~378.
[5] Auer, P. Using confidence bounds for exploitation exploration trade-offs. Journal of Machine Learning Research 3 (Mar. 2003), 397~422.
[6] Avons, S., Wright, K., and Pammer, K. The word-length effect in probed and serial recall. The Quarterly Journal of Experimental Psychology 47, 1 (1994), 207~231.
[7] Bates, M.J. Subject access in online catalogs: A design model. Journal of the American Society for Information Science 37, 6 (Nov. 1986), 357~376.
[8] Bates, M.J. Indexing and access for digital libraries and the Internet: Human, database, and domain factors. Journal of the American Society for Information Science 49, 13 (1998), 1185~1205.
[9] Belkin, N.J., Oddy, R.N., and Brooks, H.M. Ask for information retrieval: Part I: Background and theory. In Readings in Information Retrieval. Morgan Kaufmann Publishers Inc., San Francisco, CA, 1997, 299~304.
[10] Chau, D.H., Kittur, A., Hong, J.I., and Faloutsos, C. Apolo: Making sense of large network data by combining rich user interaction and machine learning. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (Vancouver, BC, Canada, May 7–12). ACM Press, New York, 2011, 167~176.
[11] Eugster, M.J.A., Ruotsalo, T., Spapé, M.M., Kosunen, I., Barral, O., Ravaja, N., Jacucci, G., and Kaski, S. Predicting term-relevance from brain signals. In Proceedings of the 37th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (Gold Coast, Queensland, Australia, July 6–11). ACM Press, New York, 2014, 425~434.
[12] Fu, W.-T. and Gray, W.D. Resolving the paradox of the active user: Stable suboptimal performance in interactive tasks. Cognitive Science 28, 6 (Nov. 2004), 901~935.
[13] Furnas, G.W., Landauer, T.K., Gomez, L.M., and Dumais, S.T. The vocabulary problem in human-system communication. Commun.ACM 30, 11 (Nov. 1987), 964~971.
[14] Glowacka, D., Ruotsalo, T., Konuyshkova, K., Athukorala, K., Kaski, S., and Jacucci, G. Directing exploratory search: Reinforcement learning from user interactions with keywords. In Proceedings of the 2013 International Conference on Intelligent User Interfaces (Santa Monica, CA, Mar. 19–22). ACM, Press, New York, 2013, 117~128.
[15] Hearst, M.A. Tilebars: Visualization of term distribution information in full text information access. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (Denver, CO, May 7–11). ACM Press/Addison-Wesley Publishing Co., New York, 1995, 59~66.
[16] Hearst, M.A. and Pedersen, J.O. Reexamining the cluster hypothesis: Scatter/gather on retrieval results. In Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (Zurich, Switzerland, Aug. 18–22). ACM Press, New York, 1996, 76~84.
[17] Lehmann, S., Schwanecke, U., and D?rner, R. Interactive visualization for opportunistic exploration of large document collections. Information Systems 35, 2 (Apr. 2010), 260~269.
[18] Marchionini, G. Exploratory search: From finding to understanding. Commun. ACM 49, 4 (Apr. 2006), 41~46.
[19] Moshfeghi, Y. and Jose, J.M. An effective implicit relevance feedback technique using affective, physiological and behavioural features. In Proceedings of the 36th International ACM Conference on Research and Development in Information Retrieval (Dublin, Ireland, July 28–Aug. 1). ACM Press, New York, 2013, 133~142.
[20] Ruotsalo, T., Peltonen, J., Eugster, M., and et al.. Directing exploratory search with interactive intent modeling. In Proceedings of the 22nd ACM International Conference on Information & Knowledge Management (San Francisco, CA, Oct. 27–Nov. 1). ACM Press, New York, 2013, 1759~1764.
[21] Saracevic, T., Kantor, P., Chamis, A. Y., and Trivison, D. A study of information seeking and retrieving. I. Background and methodology. Journal of the American Society for Information Science 39, 3 (May 1988), 161~176.
[22] Strack, F. and Mussweiler, T. Explaining the enigmatic anchoring effect: Mechanisms of selective accessibility. Journal of Personality and Social Psychology 73, 3 (Sept. 1997), 437~446.
[23] Wilson, M.L., Kules, B., Schraefel, M.C., and Shneiderman, B. From keyword search to exploration: Designing future search interfaces for the Web. Foundations and Trends in Web Science 2, 1 (Jan. 2010), 1~97.
[24] Yee, K.-P., Swearingen, K., Li, K., and Hearst, M. Faceted metadata for image search and browsing. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (Ft. Lauderdale, FL, Apr. 5–10). ACM Press, New York, 2003, 401~408.
[25] Zhao, L. and Callan, J. Term necessity prediction. In Proceedings of the 19th ACM International Conference on Information and Knowledge Management (Toronto, Canada, Oct. 26–30). ACM Press, New York, 2010, 259~268.
聯(lián)系客服