麻省理工學(xué)院的神經(jīng)科學(xué)家發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)雖然擅長識別圖像和聲音的各種呈現(xiàn),但經(jīng)常錯誤地將無意義的刺激識別為熟悉的物體或單詞,這表明這些模型發(fā)展出與人類感知不同的獨特的、特殊的“不變性”。 該研究還表明,對抗性訓(xùn)練可以稍微改善模型的識別模式,這提出了一種評估和增強感官知覺計算模型的新方法。
該研究的資深作者麥克德莫特說:“這篇論文表明,你可以使用這些模型來導(dǎo)出非自然信號,這些信號最終可以對模型中的表征進行診斷。這項測試將成為我們這個領(lǐng)域用來評估模型的一系列測試的一部分?!?/p>
Jenelle Feather 博士 22 歲,現(xiàn)任 Flatiron 研究所計算神經(jīng)科學(xué)研究中心研究員,是這篇開放獲取論文的主要作者,該論文今天發(fā)表在《自然神經(jīng)科學(xué)》雜志上。 麻省理工學(xué)院研究生 Guillaume Leclerc 和麻省理工學(xué)院 Cadence 設(shè)計系統(tǒng)計算教授 Aleksander M?dry 也是該論文的作者。
近年來,研究人員訓(xùn)練了深度神經(jīng)網(wǎng)絡(luò),可以分析數(shù)百萬個輸入(聲音或圖像)并學(xué)習(xí)共同特征,使他們能夠像人類一樣準(zhǔn)確地對目標(biāo)單詞或物體進行分類。 這些模型目前被認為是生物感覺系統(tǒng)的領(lǐng)先模型。
人們相信,當(dāng)人類感覺系統(tǒng)執(zhí)行這種分類時,它會學(xué)會忽略與物體核心身份無關(guān)的特征,例如照射在物體上的光線數(shù)量或從什么角度觀看物體。 這被稱為不變性,意味著即使對象在那些不太重要的特征上表現(xiàn)出差異,也會被認為是相同的。
“傳統(tǒng)上,我們對感覺系統(tǒng)的思考方式是,它們?yōu)橥皇挛锏牟煌纠赡芫哂械乃凶儺悂碓唇⒘瞬蛔冃?,”Feather說。 “有機體必須認識到它們是同一件事,即使它們表現(xiàn)為非常不同的感官信號?!?/p>
研究人員想知道,經(jīng)過訓(xùn)練來執(zhí)行分類任務(wù)的深度神經(jīng)網(wǎng)絡(luò)是否可能會產(chǎn)生類似的不變性。 為了嘗試回答這個問題,他們使用這些模型來生成刺激,這些刺激在模型內(nèi)產(chǎn)生與研究人員給予模型的示例刺激相同的反應(yīng)。
當(dāng)這些神經(jīng)網(wǎng)絡(luò)被要求生成圖像或單詞并將其與特定輸入(例如熊的圖片)歸為同一類別時,它們生成的大部分內(nèi)容對于人類觀察者來說是無法識別的。 右側(cè)是模型分類為“熊”的示例。 圖片來源:麻省理工學(xué)院研究人員
他們將這些刺激稱為“模型同色異體”,復(fù)興了經(jīng)典感知研究中的一個想法,即系統(tǒng)無法區(qū)分的刺激可以用來診斷其不變性。 同色異譜的概念最初是在人類感知研究中發(fā)展起來的,用于描述看起來相同的顏色,即使它們是由不同波長的光組成的。
令他們驚訝的是,研究人員發(fā)現(xiàn),以這種方式產(chǎn)生的大多數(shù)圖像和聲音看起來和聽起來都與模型最初給出的例子完全不同。 大多數(shù)圖像都是一堆看起來隨機的像素,聲音類似于難以理解的噪音。 當(dāng)研究人員向人類觀察者展示圖像時,在大多數(shù)情況下,人類不會將模型合成的圖像分類為與原始目標(biāo)示例相同的類別。
“人類根本無法識別它們。 它們看起來或聽起來都不自然,而且不具有人們可以用來對物體或單詞進行分類的可解釋特征,”Feather 說。
研究結(jié)果表明,這些模型以某種方式發(fā)展出了自己的不變性,與人類感知系統(tǒng)中發(fā)現(xiàn)的不變性不同。 這導(dǎo)致模型將成對的刺激視為相同,盡管它們與人類截然不同。
研究人員在許多不同的視覺和聽覺模型中發(fā)現(xiàn)了相同的效果。 然而,這些模型中的每一個似乎都發(fā)展出了自己獨特的不變性。 當(dāng)一個模型的同色異譜顯示給另一個模型時,第二個模型和人類觀察者一樣無法識別同色異譜。
“從中得出的關(guān)鍵推論是,這些模型似乎具有我們所說的特殊不變性,他們已經(jīng)學(xué)會了對刺激空間中的這些特定維度保持不變,并且它是特定于模型的,因此其他模型不具有相同的不變性?!?/p>
研究人員還發(fā)現(xiàn),他們可以通過使用一種稱為對抗性訓(xùn)練的方法,使模型的同色異聚體更容易被人類識別。 這種方法最初是為了克服對象識別模型的另一個限制而開發(fā)的,即對圖像引入微小的、幾乎難以察覺的變化可能會導(dǎo)致模型誤識別它。
研究人員發(fā)現(xiàn),對抗性訓(xùn)練涉及在訓(xùn)練數(shù)據(jù)中包含一些稍微改變的圖像,產(chǎn)生的模型的同色異體更容易被人類識別,盡管它們?nèi)匀徊蝗缭即碳つ敲慈菀鬃R別。 研究人員表示,這種改進似乎與訓(xùn)練對模型抵抗對抗性攻擊的能力的影響無關(guān)。
“這種特殊形式的訓(xùn)練有很大的效果,但我們真的不知道為什么會產(chǎn)生這種效果,”Feather說。 “這是未來研究的一個領(lǐng)域?!?/p>
研究人員表示,分析計算模型產(chǎn)生的同色異體可能是一個有用的工具,可以幫助評估計算模型對人類感官知覺系統(tǒng)底層組織的模仿程度。
“這是一個行為測試,你可以在給定的模型上運行,看看模型和人類觀察者之間是否共享不變性,它還可以用來評估給定模型中不變性的特殊性,這可以幫助發(fā)現(xiàn)未來改進我們模型的潛在方法。”
聯(lián)系客服