本文屬于個(gè)人觀點(diǎn),跟本人在職公司的立場(chǎng)無關(guān)。由于最近 GitHub 服務(wù)器在國(guó)內(nèi)訪問速度嚴(yán)重變慢,雖然經(jīng)過大幅度壓縮尺寸,文中的圖片仍然可能需要比較長(zhǎng)時(shí)間才能加載。這篇文章揭示了 AI 領(lǐng)域重要的謬誤和不實(shí)宣傳,為了阻止愚昧的蔓延,我鼓勵(lì)大家轉(zhuǎn)發(fā)這篇文章和它的后續(xù),轉(zhuǎn)發(fā)時(shí)只需要注明作者和出處就行。
這是這個(gè)系列文章的第二集,在這一集中,我想詳細(xì)分析一下 AI 領(lǐng)域到底理解多少人類神經(jīng)系統(tǒng)的構(gòu)造。
“神經(jīng)網(wǎng)絡(luò)”與人類神經(jīng)系統(tǒng)的關(guān)系是是很膚淺的。等你理解了所謂“神經(jīng)網(wǎng)絡(luò)”,就會(huì)明白它跟神經(jīng)系統(tǒng)幾乎沒有一點(diǎn)關(guān)系?!吧窠?jīng)網(wǎng)絡(luò)”只是一個(gè)誤導(dǎo)性質(zhì)的 marketing 名詞,它出現(xiàn)的目的只是為了讓外行產(chǎn)生不明覺厲的效果,以為它跟人類神經(jīng)系統(tǒng)有相似之處,從而對(duì)所謂的“人工智能”信以為真。
其實(shí)所謂“神經(jīng)網(wǎng)絡(luò)”應(yīng)該被叫做“可求導(dǎo)編程”。說穿了,所謂“神經(jīng)網(wǎng)絡(luò)”,“機(jī)器學(xué)習(xí)”,“深度學(xué)習(xí)”,就是利用微積分,梯度下降法,用大量數(shù)據(jù)擬合出一個(gè)函數(shù),所以它只能做擬合函數(shù)能做的那些事情。
用了千萬張圖片和幾個(gè)星期的計(jì)算,擬合出來的函數(shù)也不是那么可靠。人們已經(jīng)發(fā)現(xiàn)用一些辦法生成奇怪的圖片,能讓最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)輸出完全錯(cuò)誤的結(jié)果。
(圖片來源:http://www.evolvingai.org/fooling)
神經(jīng)網(wǎng)絡(luò)為什么會(huì)有這種缺陷呢?因?yàn)樗皇菙M合了一個(gè)“像素=>名字”的函數(shù)。這函數(shù)碰巧能區(qū)分訓(xùn)練集里的圖片,卻不能抓住物體的結(jié)構(gòu)和本質(zhì)。它只是像素級(jí)別的擬合,所以這里面有很多空子可以鉆。
深度神經(jīng)網(wǎng)絡(luò)經(jīng)常因?yàn)橐恍┫袼兀伾?,紋理匹配了物體的一部分,就認(rèn)為圖片上有這個(gè)物體。它無法像人類一樣理解物體的結(jié)構(gòu)和拓?fù)潢P(guān)系,所以才會(huì)被像素級(jí)別的膚淺假象所欺騙。
比如下面兩個(gè)奇怪的圖片,被認(rèn)為是一個(gè)菠蘿蜜和一個(gè)遙控器,僅僅因?yàn)樗鼈冎虚g出現(xiàn)了相似的紋理。
另外,神經(jīng)網(wǎng)絡(luò)還無法區(qū)分位置關(guān)系,所以它會(huì)把一些位置錯(cuò)亂的圖片也識(shí)別成某種物體。比如下面這個(gè),被認(rèn)為是一張人臉,卻沒發(fā)現(xiàn)五官都錯(cuò)位了。
神經(jīng)網(wǎng)絡(luò)為什么會(huì)犯這種錯(cuò)誤呢?因?yàn)樗哪繕?biāo)只是把訓(xùn)練集里的圖片正確分類,提高“識(shí)別率”。至于怎么分類,它可以是毫無原則的,它完全不理解物體的結(jié)構(gòu)。它并沒有看到“葉子”,“果皮”,“方盒子”,“按鈕”,它看到的只是一堆像素紋理。因?yàn)橛?xùn)練集里面的圖片,出現(xiàn)了類似紋理的都被標(biāo)記為“菠蘿蜜”和“遙控器”,沒有出現(xiàn)這紋理的都被標(biāo)記為其它物品。所以神經(jīng)網(wǎng)絡(luò)找到了區(qū)分它們的“分界點(diǎn)”,認(rèn)為看到這樣的紋理,就一定是菠蘿蜜和遙控器。
我試圖從神經(jīng)網(wǎng)絡(luò)的本質(zhì),從統(tǒng)計(jì)學(xué)來解釋這個(gè)問題。神經(jīng)網(wǎng)絡(luò)其實(shí)是擬合一個(gè)函數(shù),試圖把標(biāo)簽不同的樣本分開。擬合出來的函數(shù)試圖接近一個(gè)“真實(shí)分界線”。所謂“真實(shí)分界線”,是一個(gè)完全不會(huì)錯(cuò)的函數(shù),也就是“現(xiàn)實(shí)”。
數(shù)據(jù)量小的時(shí)候,函數(shù)特別粗糙。數(shù)據(jù)量大了,就逐漸逼近真實(shí)分界線。但不管數(shù)據(jù)量如何大,它都不可能得到完全準(zhǔn)確的“解析解”,不可能正好抓住“現(xiàn)實(shí)”。
除非現(xiàn)實(shí)函數(shù)特別簡(jiǎn)單,運(yùn)氣特別好,否則用數(shù)據(jù)擬合出來的函數(shù),都會(huì)有很多小“縫隙”。以上的像素攻擊方法,就是找到真實(shí)分界線附近,“縫隙”里面的樣本,它們正好讓擬合函數(shù)出現(xiàn)分類錯(cuò)誤。
人的視覺系統(tǒng)是完全不同的,人直接就看到了事物是什么,看到了“解析解”,看到了“現(xiàn)實(shí)”,而沒有那個(gè)用數(shù)據(jù)逼近的過程,所以除非他累得頭腦發(fā)麻或者喝了酒,你幾乎不可能讓他判斷錯(cuò)誤。
退一步來看,圖像識(shí)別所謂的“正確分類”都是人定義的。是人給了那些東西名字,是許多人一起標(biāo)注了訓(xùn)練用的圖片。所以這里所謂的“解析解”,“現(xiàn)實(shí)”,全都是人定義的。一定是某人看到了某個(gè)事物,他理解了它的結(jié)構(gòu)和性質(zhì),然后給了它一個(gè)名字。所以別的人也可以通過理解同一個(gè)事物的結(jié)構(gòu),來知道它是什么。
神經(jīng)網(wǎng)絡(luò)不能看到事物的結(jié)構(gòu),所以它們也就難以得到精確的分類,所以機(jī)器在圖像識(shí)別方面是幾乎不可能超越人類的?,F(xiàn)在所謂的“超人類視覺”的深度學(xué)習(xí)模型,大部分都是欺騙和愚弄大眾。使用沒有普遍性的數(shù)據(jù)集,使用不公平的準(zhǔn)確率標(biāo)準(zhǔn)來對(duì)比,所以才顯得機(jī)器好像比人還厲害了。這是一個(gè)嚴(yán)重的問題,在后面我會(huì)詳細(xì)分析。
神經(jīng)網(wǎng)絡(luò)就像應(yīng)試教育訓(xùn)練出來的學(xué)生,他們的目標(biāo)函數(shù)是“考高分”,為此他們不擇手段。等畢業(yè)工作遇到現(xiàn)實(shí)的問題,他們就傻眼了,發(fā)現(xiàn)自己沒學(xué)會(huì)什么東西。因?yàn)樗麄儗W(xué)習(xí)的時(shí)候只是在訓(xùn)練自己“從 ABCD 里區(qū)分出正確答案”。等到現(xiàn)實(shí)中沒有 ABCD 的時(shí)候,他們就不知道怎么辦了。
深度學(xué)習(xí)訓(xùn)練出來的那些“參數(shù)”是不可解釋的,因?yàn)樗鼈兇嬖诘哪康闹皇前褦?shù)據(jù)擬合出來,把不同種類的圖片分離開,而沒有什么意義。AI 人士喜歡給這種“不可解釋性”找借口,甚至有人說:“神經(jīng)網(wǎng)絡(luò)學(xué)到的數(shù)據(jù)雖然不可解釋,但它卻出人意料的有效。這些學(xué)習(xí)得到的模型參數(shù),其實(shí)就是知識(shí)!”
這些模型真的那么有效嗎?那為什么能夠被如此離譜的圖片所欺騙呢?說“那就是知識(shí)”,這說法簡(jiǎn)直荒謬至極,嚴(yán)重玷污了“知識(shí)”這個(gè)詞的意義。這些“學(xué)習(xí)”得到的參數(shù)根本就不是本質(zhì)的東西,不是知識(shí),真的就是一堆毫無道理可言的數(shù)字,只為了降低“誤差”,能夠把特征空間的圖片區(qū)分開來,所以神經(jīng)網(wǎng)絡(luò)才能被這樣鉆空子。
說這些參數(shù)是知識(shí),就像在說考試猜答案的技巧是知識(shí)一樣可笑?!傲硗鈳滋最}的第十題都是 B,所以這套題的第十題也選 B”…… 深度學(xué)習(xí)擬合函數(shù),就像拿歷年高考題和它們的答案來擬合函數(shù)一樣,想要不上課,不理解科目知識(shí)就做出答案來。有些時(shí)候它確實(shí)可以蒙對(duì)答案,但遇到前所未見的題目,或者題目被換了一下順序,就傻眼了。
人為什么可以不受這種欺騙呢?因?yàn)槿颂崛×烁呒?jí)的拓?fù)浣Y(jié)構(gòu),不是瞎蒙的,所以人的判斷不受像素的影響。因?yàn)樘崛×私Y(jié)構(gòu)信息,人的觀察是具有可解釋性的。如果你問一個(gè)小孩,為什么你說這是一只貓而不是一只狗呢?她會(huì)告訴你:“因?yàn)樗亩涫沁@樣的,它的牙是那樣的,它走路的姿勢(shì)是那樣的,它常常磨爪子,它用舌頭舔自己……”
做個(gè)實(shí)驗(yàn)好了,你可以問問你家孩子這是貓還是狗。如果是貓,為什么他們認(rèn)為這是一只貓而不是一只狗?
神經(jīng)網(wǎng)絡(luò)看到一堆像素,很多層處理之后也不知道是什么結(jié)構(gòu),分不清“眼睛”,“耳朵”和“嘴”,更不要說“走路”之類的動(dòng)態(tài)概念了,所以它也就無法告訴你它認(rèn)為這是貓的原因了。擬合的函數(shù)碰巧把這歸成了貓,如果你要追究原因,很可能是膚淺的:圖片上有一塊像素匹配了圖片庫里某只貓的毛色紋理。
有一些研究者把深度神經(jīng)網(wǎng)絡(luò)的各層參數(shù)拆出來,找到它們對(duì)應(yīng)的圖片中的像素和紋理,以此來證明神經(jīng)網(wǎng)絡(luò)里的參數(shù)是有意義的。咋一看好像有點(diǎn)道理,原來“學(xué)習(xí)”就能得到這么多好像設(shè)計(jì)過的濾鏡??!可是仔細(xì)一看,里面其實(shí)沒有多少有意義的內(nèi)容,因?yàn)樗鼈儗W(xué)到的參數(shù)只是能把那些圖片類別分離開。
所以人的視覺系統(tǒng)很可能是跟深度神經(jīng)網(wǎng)絡(luò)原理完全不同的,或者只有最低級(jí)的部分有相似之處。
為什么 AI 人士總是認(rèn)為視覺系統(tǒng)的高級(jí)功能都能通過“學(xué)習(xí)”得到呢?非??赡艿氖虑槭牵撕蛣?dòng)物視覺系統(tǒng)的“結(jié)構(gòu)理解”,“3D建模”功能不是學(xué)來的,而是早就固化在基因里了。想一想你生下來之后,有任何時(shí)候看到世界是平面的,毫無關(guān)聯(lián)的像素嗎?
所以我覺得,人和動(dòng)物生下來就跟現(xiàn)有的機(jī)器不一樣,結(jié)構(gòu)理解所需的硬件在胚胎里就已經(jīng)有了,只等發(fā)育和激活。人是有學(xué)習(xí)能力,可是人的學(xué)習(xí)是建立在結(jié)構(gòu)理解之上,而不是無結(jié)構(gòu)的像素。另外人的“學(xué)習(xí)”很可能處于比較高的層面,而不是神經(jīng)元那么“底層”的。人的神經(jīng)系統(tǒng)里面并沒有機(jī)器學(xué)習(xí)那種 back-propagation。
縱使你有再多的數(shù)據(jù),再多的計(jì)算力,你能超越為期幾十億年的,地球規(guī)模的自然進(jìn)化和選擇嗎?與其自己去“訓(xùn)練”或者“學(xué)習(xí)”,不如直接從人身上抄過來!但問題是,我們真的知道人的視覺系統(tǒng)是如何工作的嗎?
神經(jīng)科學(xué)家們其實(shí)并沒有完全搞明白人類視覺系統(tǒng)是如何工作的。就像所有的生物學(xué)領(lǐng)域一樣,人們的理解仍然是很粗淺的。神經(jīng)網(wǎng)絡(luò)與人類視覺系統(tǒng)的關(guān)系是膚淺的。每當(dāng)你質(zhì)疑神經(jīng)網(wǎng)絡(luò)與人類視覺系統(tǒng)的關(guān)系,AI 研究者就會(huì)抬出 Hubel & Wiesel 在 1959 年拿貓做的那個(gè)實(shí)驗(yàn):“有人已經(jīng)證明了人類視覺系統(tǒng)就是那樣工作的!” 如此的自信,不容置疑的樣子。
我問你啊,如果我們?cè)?1959 年就已經(jīng)知道人類視覺系統(tǒng)的工作原理細(xì)節(jié),為什么現(xiàn)在還各種模型改來改去,訓(xùn)練來訓(xùn)練去呢?直接模仿過來不就行了?所以這些人的說法是自相矛盾的。
你想過沒有,為什么到了 2019 年,AI 人士還拿一個(gè) 60 年前的實(shí)驗(yàn)來說明問題?這 60 年來就沒有新的發(fā)現(xiàn)了嗎?而且從 H&W 的實(shí)驗(yàn)?zāi)憧梢钥闯鰜恚徽f明了貓的視覺神經(jīng)有什么樣的底層功能(能夠做“線檢測(cè)”),卻沒有說那就是全部的構(gòu)造,沒說上層的功能都是那樣夠構(gòu)造的。
H&W 的實(shí)驗(yàn)只發(fā)現(xiàn)了最底層的“線檢測(cè)”,卻沒有揭示這些底層神經(jīng)元的信號(hào)到了上層是如何組合在一起的。“線檢測(cè)”是圖像處理的基礎(chǔ)操作。一個(gè)能夠識(shí)別拓?fù)浣Y(jié)構(gòu)的動(dòng)物視覺系統(tǒng),理所當(dāng)然應(yīng)該能做“線檢測(cè)”,但它應(yīng)該不止有這種低級(jí)功能。
視覺系統(tǒng)應(yīng)該還有更高級(jí)的結(jié)構(gòu),H&W 的實(shí)驗(yàn)并沒能回答這個(gè)問題,它仍然是一個(gè)黑盒子。AI 研究者們卻拿著 H&W 的結(jié)果大做文章,自信滿滿的聲稱已經(jīng)破解了動(dòng)物視覺系統(tǒng)的一切奧秘。
那些說“我們已經(jīng)完全搞明白了人類視覺是如何工作”的 AI 人士,應(yīng)該來看看這個(gè) 2005 年的分析 Herman grid 幻覺現(xiàn)象的幻燈片。這些研究來自 Schiller Lab,MIT 的腦科學(xué)和認(rèn)知科學(xué)實(shí)驗(yàn)室。通過一系列對(duì) Herman grid 幻覺圖案的改動(dòng)實(shí)驗(yàn),他們發(fā)現(xiàn)長(zhǎng)久以來(從 1960 年代開始)對(duì)產(chǎn)生這種現(xiàn)象的理解是錯(cuò)誤的:那些暗點(diǎn)不是來自視網(wǎng)膜的“邊沿強(qiáng)化”功能。他們猜想,這是來自大腦的 V1 視覺皮層的 S1 “方向選擇”細(xì)胞。接著,另一篇 2008 年的 paper 又說,Schiller 的結(jié)果是不對(duì)的,這種幻覺跟那些線條是直的有關(guān)系,因?yàn)槟闳绻涯切┌拙€弄彎,幻覺就消失了。然后他們提出了他們自己的,新的“猜想”。
從這種研究的方式我們可以看出,即使是 MIT 這樣高級(jí)的研究所,對(duì)視覺系統(tǒng)的研究還處于“猜”的階段,把人腦作為黑盒子,拿一些圖片來做“行為”級(jí)別的實(shí)驗(yàn)。他們并沒有完全破解視覺系統(tǒng),看到它的“線路”和“算法”具體如何工作,而是給它一些輸入,測(cè)試它的輸出。這就是“黑盒子”實(shí)驗(yàn)法。以至于很多關(guān)于人類視覺的理論都不是切實(shí)而確定的,很可能是錯(cuò)誤的猜想。
腦科學(xué)發(fā)展到今天也還是如此,AI 領(lǐng)域相對(duì)于腦科學(xué)的研究方式,又要低一個(gè)級(jí)別。2019 年了,仍然抬出神經(jīng)科學(xué)家 1959 年的結(jié)果來說事。閉門造車,對(duì)人家的最新成果一點(diǎn)都不關(guān)心?,F(xiàn)在的深度神經(jīng)網(wǎng)絡(luò)模型基本是瞎蒙出來的。把一堆像素操作疊在一起,然后對(duì)大量數(shù)據(jù)進(jìn)行“訓(xùn)練”,以為這樣就能得到所有的視覺功能。
動(dòng)物視覺系統(tǒng)里面真有“反向傳導(dǎo)”(back-propagation)這東西嗎?H&W 的實(shí)驗(yàn)里面并沒有發(fā)現(xiàn) back-propagation。實(shí)際上神經(jīng)科學(xué)家們至今也沒有發(fā)現(xiàn)神經(jīng)系統(tǒng)里面有 back-propagation,因?yàn)樯窠?jīng)元的信號(hào)傳遞機(jī)制不能進(jìn)行“反向”的通信。很多神經(jīng)科學(xué)家的結(jié)論是,人腦里面進(jìn)行 back-propagation 不大可能。
所以神經(jīng)網(wǎng)絡(luò)的各種做法恐怕沒有受到 H&W 實(shí)驗(yàn)的多大啟發(fā)。只是靠這么一個(gè)膚淺的相似之處來顯得自己接近了“人類神經(jīng)系統(tǒng)”。現(xiàn)在的所謂“神經(jīng)網(wǎng)絡(luò)”,其實(shí)只是一個(gè)普通的數(shù)學(xué)函數(shù)的表達(dá)式,里面唯一起作用的東西其實(shí)是微積分,所謂 back-propagation,就是微積分的求導(dǎo)操作。神經(jīng)網(wǎng)絡(luò)的“訓(xùn)練”,就是反復(fù)求導(dǎo)數(shù),用梯度下降方法進(jìn)行誤差最小化,擬合一個(gè)函數(shù)。這一切都跟神經(jīng)元的工作原理沒什么關(guān)系,完全就是數(shù)學(xué)。
為了消除無知帶來的困惑,你可以像我一樣,自己去了解一下人類神經(jīng)系統(tǒng)的工作原理。我推薦你看看這個(gè)叫《Interactive Biology》的 YouTube 視頻系列。你可以從中輕松地理解人類神經(jīng)系統(tǒng)一些細(xì)節(jié):神經(jīng)元的工作原理,視覺系統(tǒng)的原理,眼睛,視網(wǎng)膜的結(jié)構(gòu),聽覺系統(tǒng)的工作原理,等等。神經(jīng)學(xué)家們對(duì)此研究到了如此細(xì)節(jié)的地步,神經(jīng)傳導(dǎo)信息過程的每一個(gè)細(xì)節(jié)都展示了出來。
AI 領(lǐng)域真的理解人腦如何工作嗎?你可以參考一下這個(gè)演講:”Can the brain do back-propagation?” (人腦能做 back-propagation 嗎?)。演講人是深度學(xué)習(xí)的鼻祖級(jí)人物 Geoffrey Hinton。他和其它兩位研究者(Yoshua Bengio 和 Yann LeCun),因?yàn)閷?duì)深度學(xué)習(xí)做出的貢獻(xiàn),獲得了 2018 年的圖靈獎(jiǎng)。演講一開頭 Hinton 說,神經(jīng)科學(xué)家們說人腦做 back-propagation 是不可能的,然后他開始證明這是可能的,依據(jù)神經(jīng)元的工作原理,back-propagation 如何能用人腦神經(jīng)元來實(shí)現(xiàn)。
是的,如果你有能力讓人腦按你的“算法”工作的話,神經(jīng)元組成的系統(tǒng)也許真能做 back-propagation,可是人腦是你設(shè)計(jì)的嗎?很可惜我們無法改變?nèi)四X,而只能去“發(fā)現(xiàn)”它到底是如何工作。這不是人腦“能不能”的問題,而是“做不做”的問題。研究人腦是一個(gè)科學(xué)發(fā)現(xiàn)工作,而不是一個(gè)工程設(shè)計(jì)工作。
看了這個(gè)演講,我覺得 AI 人士已經(jīng)進(jìn)入了一種“上了天”的狀態(tài)。他們堅(jiān)定的認(rèn)為自己的模型(所謂的“神經(jīng)網(wǎng)絡(luò)”)就是終極答案,甚至試圖把人腦也塞進(jìn)這個(gè)模型,設(shè)想人腦神經(jīng)元如何能實(shí)現(xiàn)他們所謂的“神經(jīng)網(wǎng)絡(luò)”。可是他們沒有發(fā)現(xiàn),人腦的方式也許比他們的做法巧妙很多,根本跟他們的“神經(jīng)網(wǎng)絡(luò)”不一樣。
從這個(gè)視頻我們也可以看出,神經(jīng)科學(xué)界并不支持 AI 領(lǐng)域的說法。AI 領(lǐng)域是自己在那里瞎猜。視頻下面有一條評(píng)論我很欣賞,他用諷刺的口氣說:“Geoff Hinton 確切地知道人腦是如何工作的,因?yàn)檫@是他第 52 次發(fā)現(xiàn)人腦工作的新方式。”
AI 人士似乎總是有一種不切實(shí)際的“信仰”或者“信念”,他們堅(jiān)信機(jī)器一定可以具有人類一樣的智能,總有一天能夠在所有方面戰(zhàn)勝人類??偸秋@示出一副“人類沒什么了不起”的心態(tài),張口閉口拿“人類”說事,好像他們自己是另外一個(gè)物種,已經(jīng)知道人類的一切能力,有資格評(píng)判所有人的智力似的。
我不知道是什么導(dǎo)致了這種“AI 宗教”。有句話說得好:“我所有的自負(fù)都來自我的自卑,所有的英雄氣概都來自于我內(nèi)心的軟弱,所有的振振有詞都因?yàn)樾闹袧M是懷疑?!?似乎是某種隱藏很深的自卑和怨恨,導(dǎo)致了他們?nèi)绱说膱?jiān)定和自負(fù)。一定要搞出個(gè)超越所有人的機(jī)器才善罷甘休,卻沒發(fā)現(xiàn)人類智能的博大精深已經(jīng)從日常生活的各種不起眼的小事透露出來。
他們似乎看不到世界上有各種各樣,五花八門的人類活動(dòng),每一種都顯示出奇跡般的智能。連端茶倒水這么簡(jiǎn)單的事情,都包含了機(jī)器望塵莫及的智能,更不要說各種體育運(yùn)動(dòng),音樂演奏,各種研究和創(chuàng)造活動(dòng)了。就連比人類“低級(jí)”一點(diǎn)的動(dòng)物,各種寵物,家畜家禽,飛鳥走獸,甚至昆蟲,全都顯示出足以讓人敬畏的智能。他們對(duì)所有這些奇跡般的事物視而不見,不是去欣賞他們的精巧設(shè)計(jì)和卓越表現(xiàn),而是坐井觀天,念叨著“機(jī)器一定會(huì)超越人類”。
他們似乎已經(jīng)像科幻電影似的把機(jī)器當(dāng)成了一個(gè)物種,像是保護(hù)“弱勢(shì)群體”一樣,要維護(hù)機(jī)器的“權(quán)益”和“尊嚴(yán)”。他們不允許其他人質(zhì)疑這些機(jī)器,不允許你說它們恐怕沒法實(shí)現(xiàn)人類一樣的智能??傊畽C(jī)器在他們心理已經(jīng)不再是工具,而是活的生命,甚至是比人還高級(jí)的生命。
對(duì)此你可以參考另一個(gè) Geoffrey Hinton 的采訪視頻,錄制于今年 5 月份的 Google 開發(fā)者大會(huì)(Google I/O ‘19)。
從這個(gè)視頻里面我看到了許多 AI 人士盲目信仰和各種沒有根據(jù)的說法的來源,因?yàn)檫@些說法全都集中而強(qiáng)烈的體現(xiàn)在了 Hinton 的談話中。他如此的堅(jiān)信一些沒有根據(jù)的說法,不容置疑地把它們像真理一樣說出來,卻沒有任何證據(jù)。有時(shí)候主持人都不得不采用了有點(diǎn)懷疑的語氣。
Hinton 在采訪中有以下說法:
“神經(jīng)網(wǎng)絡(luò)被設(shè)計(jì)為像人腦的工作原理?!?/p>
“等神經(jīng)網(wǎng)絡(luò)能夠跟人對(duì)話,我們就能用它來進(jìn)行教育工作了?!?/p>
“神經(jīng)網(wǎng)絡(luò)終究會(huì)在所有事情上戰(zhàn)勝人類?!?/p>
“我們不都是神經(jīng)網(wǎng)絡(luò)嗎?” (先后強(qiáng)調(diào)了兩次)
“…… 所以神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)人類智能的一切功能。這包括感情,意識(shí)等?!?/p>
“人們?cè)?jīng)認(rèn)為生命是一種特殊的力量,現(xiàn)在生物學(xué)解釋了生命的一切。人們現(xiàn)在仍然認(rèn)為意識(shí)是特殊的,可是神經(jīng)網(wǎng)絡(luò)將會(huì)說明,意識(shí)并沒有什么特別。”
他的這些說法都是不準(zhǔn)確,不科學(xué),沒有根據(jù)的。
我發(fā)現(xiàn)每當(dāng)主持人用稍微懷疑的語氣問:“這真的可以實(shí)現(xiàn)嗎?” Hinton 就會(huì)回答:“當(dāng)然能。我們不都是神經(jīng)網(wǎng)絡(luò)嗎?” 這里有一個(gè)嚴(yán)重的問題,那就是他所謂的“神經(jīng)網(wǎng)絡(luò)”,其實(shí)并不是人腦里面的神經(jīng)元連成的網(wǎng)絡(luò)。AI 領(lǐng)域的“神經(jīng)網(wǎng)絡(luò)”只是他們自己的數(shù)學(xué)模型,是他們自己給它起名叫“神經(jīng)網(wǎng)絡(luò)”而已。所以他的這種“證明”其實(shí)是在玩文字游戲:“因?yàn)槲覀兌际巧窠?jīng)網(wǎng)絡(luò),所以神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)一切人類智能,感情,甚至意識(shí)本身!”
前面的“神經(jīng)網(wǎng)絡(luò)”和后面的“神經(jīng)網(wǎng)絡(luò)”完全是兩回事。我們是“神經(jīng)網(wǎng)絡(luò)”嗎?我們的腦子里是有神經(jīng)元,神經(jīng)元貌似連成了一個(gè)網(wǎng)絡(luò),可是它的結(jié)構(gòu)卻跟 AI 領(lǐng)域所謂的“神經(jīng)網(wǎng)絡(luò)”是兩回事,工作原理也非常不一樣。Hinton 面對(duì)問題作出這樣的回答,是非常不科學(xué),不負(fù)責(zé)任的。
最后關(guān)于生命,感情和意識(shí)的說法,我也很不認(rèn)同。雖然生物學(xué)解釋了生命體的各種構(gòu)造和原理,可是人們?yōu)槭裁慈匀粵]能從無生命的物質(zhì)制造出有生命的事物呢?雖然人們懂得那么多生物學(xué),生物化學(xué),有機(jī)化學(xué),甚至能合成出各種蛋白質(zhì),可是為什么沒能把這些東西組裝在一起,讓它“活”起來呢?這就像你能造出一些機(jī)器零件,可是組裝起來之后,發(fā)現(xiàn)這機(jī)器不轉(zhuǎn)。你不覺得是因?yàn)樯倭它c(diǎn)什么嗎?生物學(xué)發(fā)展了這么久,我們連一個(gè)最簡(jiǎn)單的,可以說是“活”的東西都沒造出來過,你還能說“生命沒什么特別的”嗎?
這說明生物學(xué)家們雖然知道生命體的一些工作原理,卻沒有從根本上搞明白生命到底是什么。也就是說人們解決了一部分“how”問題(生命體如何工作),卻不理解“what”和“why”(生命是什么,為什么會(huì)出現(xiàn)生命)。
實(shí)際上生物學(xué)對(duì)生命體如何工作(how)的理解都還遠(yuǎn)遠(yuǎn)不夠徹底,這就是為什么我們還有那么多病無法醫(yī)治,甚至連一些小毛病都無法準(zhǔn)確的根治,一直拖著,只是不會(huì)馬上致命而已。“生命是什么”的 what 問題仍然是一個(gè)未解之謎,而不像 Hinton 說的,全都搞明白了,沒什么特別的。
也許生命就是一種特別的東西呢?也許只有從有生命的事物,才能產(chǎn)生有生命的事物呢?也許生命就是從外星球來的,也許就是由某種更高級(jí)的智慧設(shè)計(jì)出來的呢?這些都是有可能的。真正的科學(xué)家應(yīng)該保持開放的心態(tài),不應(yīng)該有類似“人定勝天”這樣的信仰。我們的一切結(jié)論都應(yīng)該有證據(jù),如果沒有我們就不應(yīng)該說“一定”或者“必然”,說得好像所有秘密全都解開了一樣。
對(duì)于智能和意識(shí),我也是一樣的態(tài)度。在我們沒有從普通的物質(zhì)制造出真正的智能和意識(shí)之前,不應(yīng)該妄言理解了關(guān)于它們的一切。生命,智能和意識(shí),比有些人想象的要奇妙得多。想要“人造”出這些東西,比 AI 人士的說法要困難許多。
有心人仔細(xì)觀察一下身邊的小孩子,小動(dòng)物,甚至觀察一下自己,就會(huì)發(fā)現(xiàn)它們的“設(shè)計(jì)”是如此的精巧,簡(jiǎn)直不像是隨機(jī)進(jìn)化出來的,而是由某個(gè)偉大的設(shè)計(jì)者創(chuàng)造的。46 億年的時(shí)間,真的夠進(jìn)化和自然選擇出這樣聰明的事物嗎?
別誤會(huì)了,我是不信宗教的。我覺得宗教的圣經(jīng)都是小人書,都是某些人嚇編的??墒侨绻銏?jiān)定的相信人類和動(dòng)物的這些精巧的結(jié)構(gòu)都是“進(jìn)化”來的,你堅(jiān)定的相信它們不是什么更高級(jí)的智慧創(chuàng)造出來的,那不也是另外一種宗教嗎?你沒有證據(jù)。沒有證據(jù)的東西都只是猜想,而不能堅(jiān)信。
好像扯遠(yuǎn)了……
總之,深度學(xué)習(xí)的鼻祖級(jí)人物說出這樣多信念性質(zhì)的,沒有根據(jù)的話,由此可見這個(gè)領(lǐng)域有多么混沌。另外你還可以從他的談話中看出,他所謂的“AI”都是各種相對(duì)容易的識(shí)別問題(語音識(shí)別,圖像識(shí)別)。他并沒有看清楚機(jī)器要想達(dá)成“理解”有多困難。而“識(shí)別”與“理解”的區(qū)別,就是我的這篇文章想澄清的問題。
設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的“算法工程師”,“數(shù)據(jù)科學(xué)家”,他們工作性質(zhì)其實(shí)很像“煉丹師”(alchemist)。拿個(gè)模型這改改那改改,拿海量的圖片來訓(xùn)練,“準(zhǔn)確率”提高了,就發(fā) paper。至于為什么效果會(huì)好一些,其中揭示了什么原理,模型里的某個(gè)節(jié)點(diǎn)是用來達(dá)到什么效果的,如果沒有它會(huì)不會(huì)其實(shí)也行?不知道,不理解。甚至很多 paper 里的結(jié)果無法被別的研究者復(fù)現(xiàn),存在作假的可能性。
我很懷疑這樣的研究方式能夠帶來什么質(zhì)的突破,這不是科學(xué)的方法。如果你跟我一樣,把神經(jīng)網(wǎng)絡(luò)看成是用“可求導(dǎo)編程語言”寫出來的代碼,那么現(xiàn)在這種設(shè)計(jì)模型的方法就很像“一百萬只猴子敲鍵盤”,總有一只能敲出“Hello World!”
許多數(shù)學(xué)家和統(tǒng)計(jì)學(xué)家都不認(rèn)同 AI 領(lǐng)域的研究方式,對(duì)里面的很多做法表示不解和懷疑。為此斯坦福大學(xué)的統(tǒng)計(jì)學(xué)系還專門開了一堂課 Stats 385,專門討論這個(gè)問題。課堂上請(qǐng)來了一些老一輩的數(shù)學(xué)家,一起來分析深度學(xué)習(xí)模型里面的各種操作是用來達(dá)到什么目的。有一些操作很容易理解,可是另外一些沒人知道是怎么回事,這些數(shù)學(xué)家都看不明白,連設(shè)計(jì)這些模型的煉丹師們自己都不明白。
所以你也許看到了,AI 研究者并沒能理解人類視覺系統(tǒng)的工作原理,許多的機(jī)器視覺研究都是在瞎猜。在接下來的續(xù)集中,我們會(huì)看到他們所謂的“超人類識(shí)別率”是如何來的。
聯(lián)系客服