這一周英特爾放出兩個(gè)重磅消息:其一是3月16日英特爾與康奈爾大學(xué)利用英特爾神經(jīng)擬態(tài)芯片Loihi來識(shí)別爆炸物等危險(xiǎn)化學(xué)品氣味方面的研究,取得重大的突破。其二是3月19日英特爾用768個(gè)Loihi芯片構(gòu)造了一個(gè)新的神經(jīng)擬態(tài)研究系統(tǒng)Pohoiki Springs,這個(gè)系統(tǒng)達(dá)到了1億個(gè)神經(jīng)元的規(guī)模,而上一次構(gòu)建的系統(tǒng)Pohoiki Beach是64個(gè)芯片800萬個(gè)神經(jīng)元,這次擴(kuò)大了12倍。
在這兩個(gè)重磅消息的背后釋放出許多重要的信號(hào),人類對于除視覺、聽覺之外的味覺嗅覺等研究有新突破,帶來新想象空間和應(yīng)用空間,人類對大腦的認(rèn)知以及類腦芯片、AI芯片又跨上新臺(tái)階,未來的芯片發(fā)展之路又有可能另辟蹊徑。這一切、一切的背后有諸多信息需要解密,3月20日,《中國電子報(bào)》記者連線采訪英特爾中國研究院院長宋繼強(qiáng)。
嗅覺和味覺AI為什么遠(yuǎn)比視覺和聽覺AI要落后?
我們知道人類在視覺、聽覺識(shí)別方面相對成熟,但在味覺、嗅覺等方面識(shí)別仍面臨很多挑戰(zhàn)。而這次在英特爾與康奈爾合作在氣味和爆炸物識(shí)別的突破有什么突破意義?關(guān)于味覺、嗅覺識(shí)別的主要的挑戰(zhàn)是什么?通常采用什么樣的路徑來解決這類問題?
宋繼強(qiáng)表示,人類的味覺靠舌頭、嗅覺靠鼻子,目前為止,人工智能做得比較好的是視覺、聽覺,這兩個(gè)人類主要感官。之所以在兩個(gè)領(lǐng)域做的比較好,有幾個(gè)原因,其一是視覺、聽覺兩類數(shù)據(jù)相對容易獲得而且數(shù)據(jù)量大。在此前的信息化時(shí)代,比如2000年開始攝像頭普及,更早時(shí)候麥克風(fēng)普及,讓我們積累了大量圖片數(shù)據(jù)、語音數(shù)據(jù)。其二是這兩類數(shù)據(jù)的標(biāo)注相對容易。人類基于捕捉下來的照片或是錄制的音頻進(jìn)行標(biāo)注,基于人類的基本認(rèn)知知識(shí)容易實(shí)現(xiàn),容易確定它的正確與否。
“而深度學(xué)習(xí)之所以能夠獲得現(xiàn)在的效果是因?yàn)閹讉€(gè)關(guān)鍵:第一數(shù)據(jù)量足夠,第二有標(biāo)注好的數(shù)據(jù),第三是要保證訓(xùn)練的數(shù)據(jù)集和未來要處理的問題的測試數(shù)據(jù)集的分布是一致的,這樣訓(xùn)練出來的模型,才能夠很好地處理真實(shí)的場景?!彼卫^強(qiáng)表示,這也是為什么我們看到深度神經(jīng)網(wǎng)絡(luò)擅長處理視覺數(shù)據(jù)、語音數(shù)據(jù)的原因。
而嗅覺和味覺,目前的數(shù)據(jù)非常少,而且沒有很好地標(biāo)注。究竟誰可以將這些數(shù)據(jù)進(jìn)行標(biāo)注非得是專家在實(shí)驗(yàn)室才可以進(jìn)行。比如葡萄酒的品酒,同一個(gè)葡萄酒十個(gè)專家來品嘗可能會(huì)有不同的結(jié)果,同一個(gè)葡萄酒讓同一個(gè)專家在不同的時(shí)間段品,也可能打出不同的分。所以它有難度。
“數(shù)據(jù)量不夠多,而且主觀評測標(biāo)準(zhǔn)也不夠,味覺的差異性太大。嗅覺相對客觀一些,因?yàn)樾嵊X本身是依據(jù)不同的氣味,主要源于空氣中包含的一些化學(xué)分子成份不同、密度不同。人的鼻子、動(dòng)物的鼻子、電子鼻對于氣味的區(qū)分能力不一樣。普通人能夠區(qū)分三四百種不同氣味,稍加訓(xùn)練可以達(dá)到上千種、數(shù)千種,但現(xiàn)實(shí)中真正可以區(qū)分的氣味其實(shí)是在萬種以上,這些數(shù)據(jù)我們?nèi)粘:茈y拿到大量數(shù)據(jù),所以它絕對是小數(shù)據(jù)量的場景。”宋繼強(qiáng)說。
但嗅覺數(shù)據(jù)的使用場合非常多,比如爆炸品的檢測,比如生活中危害、有害氣體的提早檢測,比如對水果或農(nóng)作物的成熟度檢測,比如對檢修污染的檢測等,靠氣味能夠檢測的非常多。目前因受限于數(shù)據(jù)量不夠充分,檢測手段不夠高明,嗅覺AI的發(fā)展比視覺和聽覺落后非常多。
為什么用神經(jīng)擬態(tài)計(jì)算而不是其他計(jì)算?
我們知道人工智能發(fā)展有三個(gè)關(guān)鍵:數(shù)據(jù)、算法、算力,為什么解決嗅覺、味覺等問題上要采用類腦計(jì)算,而不是其他的計(jì)算來解決這些問題?神經(jīng)擬態(tài)計(jì)算比其他計(jì)算解決此類問題有什么優(yōu)點(diǎn)?用量子計(jì)算是不是也可以很好地解決此類問題?
宋繼強(qiáng)表示,神經(jīng)擬態(tài)計(jì)算的優(yōu)勢在于,第一,不需要依賴于大量的數(shù)據(jù)。神經(jīng)擬態(tài)計(jì)算可以從一個(gè)樣本的訓(xùn)練中就可以達(dá)到百分之九十多的相對比較高的準(zhǔn)確率,這和過去人們專門去定制一些規(guī)則特征來識(shí)別的效果非常相似。人定立規(guī)則的意思是,假如我知道這個(gè)氣味由哪幾種分子構(gòu)成,比如二氧化硫是臭雞蛋味,我就可以知道這其中什么樣的分子會(huì)導(dǎo)致臭雞蛋味,可以定制一些化學(xué)傳感器、其他的有機(jī)物傳感器來指定檢測這兩種特定的分子構(gòu)成,然后標(biāo)注成這是二氧化硫的氣味。但神經(jīng)擬態(tài)芯片不需要人做這樣的劃分,而是直接取出來。這張Loihi識(shí)別模型圖很好地解釋了神經(jīng)擬態(tài)芯片做這件事情的機(jī)理。
它是從人腦做嗅覺識(shí)別的過程去獲得啟發(fā),人是通過鼻腔讓空氣吸進(jìn)來,如果想甄別味道更快,可能要快速呼吸幾下,讓它的濃度、流動(dòng)的速度都加快起來,可以接觸到更多氣味。所以它是讓空氣流動(dòng)和鼻子里的傳感細(xì)胞接觸。這張圖里還顯示出傳感細(xì)胞分成幾種、每種的構(gòu)造以及不同的感知細(xì)胞。然后連到底下的感知神經(jīng)元,感知細(xì)胞相當(dāng)于我們在構(gòu)造電子鼻時(shí),放了一些化學(xué)傳感器或者有機(jī)物傳感器。這樣我們就構(gòu)造出一個(gè)類似于人的鼻腔通道,然后感知?dú)怏w流過它的分子接觸,傳感細(xì)胞時(shí)間的、空間的序列,構(gòu)造出一個(gè)陣列一樣的傳感器的組合,就可以在氣味經(jīng)過的時(shí)候形成一個(gè)時(shí)間上的脈沖序列,然后它有空間上的分布。這就與人的嗅覺系統(tǒng)的感知機(jī)理比較接近。同時(shí)因?yàn)槿四X里是靠神經(jīng)元機(jī)制形成刺激-激勵(lì),形成以后要在神經(jīng)元里累積,累積以后要去釋放,就與神經(jīng)擬態(tài)系統(tǒng)怎么用SNN模型,也就是脈沖神經(jīng)網(wǎng)絡(luò)的模型去模擬它相關(guān)。所以神經(jīng)擬態(tài)芯片是比較容易讓人們構(gòu)造一個(gè)模型,包含對時(shí)間和空間序列處理的一個(gè)模型,然后放在它上面,對數(shù)據(jù)進(jìn)行模式的匹配。通過這一測試能把它的模式很好地記錄下來,記錄下來之后再碰到這樣一個(gè)氣味就能夠產(chǎn)生最高響應(yīng)。同時(shí)為了不要讓其他可能的氣味誤識(shí)為它,這個(gè)陣列需要構(gòu)造得比較大,上面?zhèn)鞲屑?xì)胞的傳感器種類要更多。
“從這個(gè)工作圖上我們看到了它從理論到實(shí)踐的基礎(chǔ),以及可以擴(kuò)展識(shí)別更多種類氣體的擴(kuò)展化的路徑?!彼卫^強(qiáng)說,神經(jīng)擬態(tài)芯片解決了如何可以在低成本、數(shù)據(jù)量很少、功耗很低的背景下來解決聞味的問題。因?yàn)樵谝粋€(gè)Loihi芯片上構(gòu)造這樣的系統(tǒng),它的功耗非常低,功耗只是毫瓦級別,無論是是訓(xùn)練還是識(shí)別都不需要花太多電,所以可以把它做成類似于“電子鼻”的小設(shè)。而且它可以擴(kuò)展去識(shí)別很多種類的氣體。
那么量子計(jì)算等其他計(jì)算是否能夠擁有與神級擬態(tài)計(jì)算一樣的解題能力?宋繼強(qiáng)表示,當(dāng)然也可以用傳統(tǒng)計(jì)算機(jī)來解題,但如果是傳統(tǒng)計(jì)算機(jī)就需要構(gòu)造更精巧的算法,在傳統(tǒng)的CPU上當(dāng)然可以模擬各種各樣的計(jì)算場景,但是執(zhí)行效率肯定不如在Loihi上這么直接、這么低功耗。而量子計(jì)算是適合做大規(guī)模有并行選項(xiàng)同時(shí)驗(yàn)證的事情,并不是適合做嗅覺識(shí)別,因?yàn)樾嵊X識(shí)別需要針對只有少量的、有時(shí)間序列的數(shù)據(jù),進(jìn)行快速判別。
Pohoiki Springs難在哪里?有什么突破意義?
英特爾這次公布的新系統(tǒng)Pohoiki Springs研發(fā)難度有多大?與上一代的系統(tǒng)相比有哪些突破?這些突破有什么意義?
宋繼強(qiáng)表示,Pohoiki Springs是在上一代Pohoiki Beach的基礎(chǔ)上繼續(xù)進(jìn)行大規(guī)模的互聯(lián)。首先把互聯(lián)的規(guī)模加大,加大后面臨幾個(gè)問題:第一互聯(lián)之后怎么保證這些信息的傳遞,我們知道在一個(gè)64芯片的Pohoiki Beach板級方案上,所有的芯片之間的連接是在一塊電路板上,所以它們之間的速度是比較一致,很有保障的。當(dāng)我們把12倍的板子連起來時(shí),那就要增加更多的I/O連接組建和信息傳遞協(xié)議的處理,如何保證信息傳遞的有效和時(shí)效性。
第二是在上面支持軟件開發(fā)的時(shí)候,要更好地把硬件連接差異掩蓋掉,讓大家非常容易使用,就像使用一個(gè)大腦組織一樣,不同的分區(qū)可能不同有功能的組合,實(shí)現(xiàn)靈活分區(qū)使用,這需要一個(gè)分布計(jì)算的軟件層支持,所以這一層也比較關(guān)鍵。
第三是這上面要開發(fā)一些新模型也會(huì)涉及到更大規(guī)模的模型的設(shè)計(jì)和處理,這也比在小芯片上要困難。
它的難度分為三層,一是底層如何把這么多塊芯片互連起來,把它全部連接起來同時(shí)要保證連接的有效性和時(shí)效性,這在業(yè)界沒有做過。二是軟件層,要支持互連計(jì)算、分布式計(jì)算和靈活分區(qū),這也是沒有人做過的。三是支持更大規(guī)模的做動(dòng)態(tài)規(guī)劃和優(yōu)化的實(shí)驗(yàn),這也是英特爾首先做。
為什么要做這樣一個(gè)大規(guī)模的系統(tǒng)?宋繼強(qiáng)表示,因?yàn)樵诤芏囝I(lǐng)域的應(yīng)用里要做優(yōu)化、約束滿足、動(dòng)態(tài)規(guī)劃時(shí),需要耗費(fèi)很多時(shí)間需要消耗很多電力,而切換算法在神經(jīng)擬態(tài)芯片Loihi上做可以更快、功耗更低。
類腦計(jì)算何時(shí)真正接近于人腦?
計(jì)算機(jī)在不斷接人腦的維度上,目前走到了哪一步?如果我們用小溪、小河到大海來形容現(xiàn)在走到了哪一個(gè)程度?還要突破哪些屏障才能真正走到大海?
“這比較難給出確切答案?!彼卫^強(qiáng)說,一方面因?yàn)槿祟悓τ诖竽X的了解和認(rèn)知進(jìn)展并不像摩爾定律的那樣高速,它的進(jìn)展非常緩慢?,F(xiàn)在對于神經(jīng)元結(jié)構(gòu)基本了解,對于某些人的感知機(jī)理也有了解,特別像視覺、聽覺、嗅覺這些比較重要的感知機(jī)理有所了解,但其他更深層次的感知、認(rèn)知是怎么形成依然不了解。不過現(xiàn)在Loihi設(shè)計(jì)用的比較復(fù)雜的腦神經(jīng)元的工作模型,這是我們首先可以借鑒的。另一方面在器件上,人腦的工作方式和傳統(tǒng)的半導(dǎo)體的工作機(jī)理也并不完全一樣,所以我們也在做新的底層器件研發(fā),比如憶阻器,既可以存儲(chǔ)也可以計(jì)算的一種器件。
不過,宋繼強(qiáng)進(jìn)一步表示,除了我們對人腦的認(rèn)知機(jī)制與工作機(jī)制的了解需要繼續(xù)推進(jìn),我們還需要換一個(gè)維度,從超出人腦來看IT能夠帶來什么?!拔覀冋f人腦很神秘、很厲害,但是畢竟是一個(gè)生物組織,有它的極限。我現(xiàn)在手里有一個(gè)更強(qiáng)的武器比如IT、半導(dǎo)體、量子計(jì)算等工具,它會(huì)有比人腦更強(qiáng)的能力?!比绾卫眠@些東西、利用這些芯片與人腦的研究相結(jié)合、跨學(xué)科結(jié)合就能夠更好地往前推進(jìn)。
“最重要的是需要找到很好的應(yīng)用導(dǎo)向。”宋繼強(qiáng)表示,比如英特爾對于Loihi研究, Loihi的主要貢獻(xiàn)一方面它是新的架構(gòu)設(shè)計(jì),實(shí)現(xiàn)了大規(guī)模集連,而且把工具鏈做起來了。另一方面是Loihi構(gòu)建了一個(gè)社區(qū)(英特爾神經(jīng)擬態(tài)社區(qū)INRC),社區(qū)中不僅有所類腦神經(jīng)擬態(tài)計(jì)算研究的學(xué)術(shù)機(jī)構(gòu),也吸納進(jìn)來非常多不同種類的創(chuàng)業(yè)公司、五百強(qiáng)企業(yè),希望通過探索看看這樣的神經(jīng)擬態(tài)計(jì)算能夠很好地解決哪些應(yīng)用領(lǐng)域問題,由此來驅(qū)動(dòng)神經(jīng)擬態(tài)計(jì)算的發(fā)展。就像2012年深度學(xué)習(xí)在學(xué)術(shù)界嶄露頭角之后,于2016、2017年在產(chǎn)業(yè)界大規(guī)模使用于安防領(lǐng)域、生物認(rèn)證領(lǐng)域、金融領(lǐng)域等,以這樣的發(fā)展路徑能夠形成從技術(shù)到規(guī)?;瘧?yīng)用的生態(tài)?!斑@是一個(gè)并行發(fā)展而不是線性發(fā)展的事情,所以很難給你一個(gè)預(yù)測時(shí)間?!?宋繼強(qiáng)同時(shí)表示神經(jīng)擬態(tài)芯片在英特爾的芯片布局中屬于研究測試芯片,不是一個(gè)產(chǎn)品芯片,主要是在服務(wù)研究社區(qū)。未來如果有更大規(guī)模的商業(yè)應(yīng)用場景,不排除將其通用化。
聯(lián)系客服