深度學習更像“煉金術”,真正突破要訴諸“人腦”
演講者為Tomaso Poggio,擔任MIT計算機科學與人工智能實驗室教授。他是這個世界最早從事人工智能研究的人之一,學生分布在DeepMind(做出AlphaGo)、Moblieye等當今AI頂尖企業(yè)。
深度學習:這個時代的煉金術
在這個時代,深度學習有點像煉金術。它要成為真正的化學,還需要很多工作。
23年前,我和Hassabis希望整合計算機視覺和深度學習,創(chuàng)造出一個學習系統(tǒng),自動辨別行人。當時我們識別出了行人、信號燈,但每秒有10個錯誤。這是1995年,我們已經非常滿意了。
但今天,Mobileye每30英里只出現(xiàn)1個錯誤,是當年的百萬分之一。這種巨大的進步,動因在哪里呢?
首先是機器學習的算法,第一是深度學習,第二是強化學習。它們都來自于認知科學和神經科學。
深度學習的架構,是60年代研究猴子的視覺系統(tǒng)時被發(fā)明出來的。創(chuàng)造它,是為了更好研究猴子在學習時大腦的神經結構。然后Fukushima提出了首個量化模型,20年前現(xiàn)代版的HMAX被提出。這些架構都一脈相承——一樣的層級架構。從下到上,神經的等級越來越高,每個高級神經元只和下個等級的神經元相連接。
2012年,我們又開發(fā)出AlexNet,它是目前性能最好的一個架構?;谏窠浛茖W,我們的工程學研究能不斷地發(fā)展。這是很重要的,因為我們還沒實現(xiàn)真正的人工智能。
神經科學:人工智能真正的曙光
深度學習能幫我們解決10%的難題。剩下的90%呢?答案可能在神經科學、認知科學的研究里。
我們必須研究人的思維和大腦。這也是MIT大腦、心智和機器中心CBMM正在研究的問題。我們希望能在理解認知方面有進步,能了解整個智能的架構,和背后的科學原理。大腦中智能的產生,是科學現(xiàn)在要解決的元問題。
為了有所突破,CBMM有以下三條路徑:1、計算機科學+機器學習。2、神經科學。3、認知科學。
我們要回答的則是三個基本問題:
1、逼近理論:深層網絡在什么情況下,會比淺層網絡更有效?
2、最優(yōu)化:應該如何設計經驗風險函數(shù)?
3、學習理論:為什么深度學習不會產生過度擬合?
這三個問題,是機器學習的奠基石。它們的答案很復雜,要解決它,我們需要與開始就思考深度學習的局限性,以及一些技術理論。
不理解大腦,就不能真正理解“機器的智能”
越來越人將意識到,下一個重大進展將來自我們對人類智慧、大腦的理解。DeepMind就認可這樣的理念(他們老大也是做神經科學的)。
我們正在CBM里面開發(fā)一個架構,是超越深度學習的,嘗試去描述我們的視覺智慧怎么運作。
現(xiàn)在,能將神經科學的成果成功運用的公司并不多。我們應該集中資源去做基礎研究。當一個新生兒理解事物時,他會為它貼上標簽,“這是小馬、那是汽車?!彼灰苌俚臉颖揪湍軞w納一個事物。這才是典型的生物學的運作方式,顯然跟當前機器的做法完全不同。
我們的大腦充滿了智慧,值得我們做更多研究。當我們談到機器時,并不能過多去跟人類大腦比較,即便它速度更快。在過去50年,計算機取得了很大的進展。但談到智慧本身,機器肯定還要從人類這里學習。
聯(lián)系客服