文/陳根
在人工智能深度學(xué)習(xí)輸入的數(shù)據(jù)和其輸出的答案之間,存在著人們無法洞悉的“隱層”,它被稱為“黑箱”。這里的“黑箱”并不只意味著不能觀察,還意味著即使計算機試圖向我們解釋,人們也無法理解。
事實上,早在1962年,美國的埃魯爾在其《技術(shù)社會》一書中就指出,人們傳統(tǒng)上認為的技術(shù)由人所發(fā)明就必然能夠為人所控制的觀點是膚淺的、不切實際的。技術(shù)的發(fā)展通常會脫離人類的控制,即使是技術(shù)人員和科學(xué)家,也不能夠控制其所發(fā)明的技術(shù)。
進入人工智能時代,算法的飛速發(fā)展和自我進化已初步驗證了埃魯爾的預(yù)言,深度學(xué)習(xí)更是凸顯了“算法黑箱”現(xiàn)象帶來的某種技術(shù)屏障。以至于無論是程序錯誤,還是算法歧視,在人工智能的深度學(xué)習(xí)中,都變得難以識別。
與此同時,在生命科學(xué)方面,理解細胞差異、為細胞分類,對生命科學(xué)具有重要意義,一系列基于基因轉(zhuǎn)錄數(shù)據(jù)和深度學(xué)習(xí)的分類方法正在興起,然而,由于算法“黑箱”,以至于現(xiàn)有的方法可解釋性往往不足。
近日,由北京師范大學(xué)、中科研基因所研究人員合作在Nature Machine Intelligence 期刊發(fā)表論文,其中,研究人員利用改進后的膠囊網(wǎng)絡(luò)深度架構(gòu),應(yīng)用于轉(zhuǎn)錄組分析和細胞分類,取得良好效果并具有較強的可解釋性。
在研究人員提出的膠囊網(wǎng)絡(luò)中,膠囊代表多個神經(jīng)元組成的向量,作為基本的運算單位。每個向量(膠囊)代表特定對象的一種屬性。所以,膠囊網(wǎng)絡(luò)具有模塊化的架構(gòu),適用于同樣具有模塊化特征的生物學(xué)數(shù)據(jù)。
最初版本的膠囊網(wǎng)絡(luò)模型使用卷積神經(jīng)網(wǎng)絡(luò)作為特征提取器,用于圖像分類任務(wù)。在此次研究中,研究人員則將其改造成為“單細胞膠囊網(wǎng)絡(luò)”(scCapsNet ),以多個并聯(lián)的神經(jīng)網(wǎng)絡(luò)替換原有卷積神經(jīng)網(wǎng)絡(luò),作為特征提取器,用于單細胞表達譜的分類。
單細胞膠囊網(wǎng)絡(luò)從多個層面彌補了傳統(tǒng)機器學(xué)習(xí)透明度低及缺乏可解釋性的問題。這對于決策黑盒子透明化具有重要意義。
聯(lián)系客服