嚴(yán)冰冰 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
深層卷積人工神經(jīng)網(wǎng)絡(luò)(Deep Convolutional ANN)是近年來視覺處理領(lǐng)域的寵兒,它們起源于簡單的淺層網(wǎng)絡(luò)(如八層結(jié)構(gòu)的AlexNet),進(jìn)化出多層級、多分支的復(fù)雜結(jié)構(gòu)(如NASNet、ResNet)。
這些深層的前饋神經(jīng)網(wǎng)絡(luò)雖然在物體識別測試中表現(xiàn)卓越,但都存在局限。
這些深層ANN繼續(xù)進(jìn)化,是否會變得越來越不像真實的大腦?
為了回答這個問題,MIT的DiCarlo實驗室推出線上測試平臺Brain-Score,評估ANN與大腦在物體識別過程中的相似程度,同時與多方合作,開發(fā)淺層網(wǎng)絡(luò)CORnet系列。
其中,最優(yōu)秀的是CORnet-S選手,它的構(gòu)造與大腦的解剖結(jié)構(gòu)更加對應(yīng),且在機(jī)器學(xué)習(xí)評估中表現(xiàn)優(yōu)異,是迄今為止靈長類視覺腹側(cè)通路的最佳模型,為視覺處理領(lǐng)域ANN的開發(fā)與對大腦功能的深入理解提供了新思路。
CORnet-S由4個層級組成,分別對應(yīng)大腦視覺腹側(cè)通路中的V1、V2、V4與IT區(qū)域,在第4層之后增加一個線性分類解碼器,對應(yīng)從IT區(qū)域信號輸出到行為選擇的處理過程。
△CORnet-S對應(yīng)大腦視覺腹側(cè)通路的4個區(qū)域;來源:arXiv:1909.06161 [cs.CV]
CORnet-S的每個層級都是一個簡單的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò),由卷積、激活、非線性化、歸一化、池化等步驟組成,其中V2、V4、IT區(qū)域的回路結(jié)構(gòu)一致,但神經(jīng)數(shù)目不同。
△CORnet-S參數(shù);來源:https://doi.org/10.1101/408385
CORnet-S增加了層級內(nèi)部循環(huán)的特征,其中V2與IT區(qū)域重復(fù)2次,V4區(qū)域重復(fù)4次,并且增加了跳躍連接。
△來源:arXiv:1909.06161 [cs.CV]
層級內(nèi)部循環(huán),即將該層級的輸出作為輸入重新進(jìn)入該層級,多次重復(fù)后得到最終的輸出,模擬腦區(qū)內(nèi)部循環(huán)。
Brain-Score平臺從以下幾個方面評估ANN性能:
在Brain-Score平臺上可以看到,相比其他的視覺處理人工神經(jīng)網(wǎng)絡(luò),CORnet-S得分最高,在ImageNet測試中也名列前茅,是淺層網(wǎng)絡(luò)中表現(xiàn)最好的。綜合考慮ANN的前饋簡易度因素,CORnet-S也十分具有優(yōu)勢。
△
聯(lián)系客服