AlphaGo與李世乭人機(jī)大戰(zhàn)余波未平,卡耐基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院教授邢波便為理解未來(lái)系列講座帶來(lái)了《為人工智能裝上引擎》。
邢波的演講從另一場(chǎng)人機(jī)對(duì)決開始。1930年8月28日,在美國(guó)巴爾的摩,火車和馬車站在了同一起跑線上。隨著蒸汽機(jī)的勝利,民眾陷入對(duì)這個(gè)鋼鐵怪物的恐慌——雖然現(xiàn)在我們已經(jīng)把坐火車當(dāng)成很平常的事了。
在前不久的圍棋世紀(jì)之戰(zhàn)中,機(jī)器同樣以大比分戰(zhàn)勝了人類。針對(duì)輿論界形成的“驚恐甚至是瘋狂”,邢波針對(duì)人工智能與人類的關(guān)系及人工智能的未來(lái)闡述了自己的觀點(diǎn)。在演講過(guò)程中,邢波多次以登山和音樂(lè)來(lái)比喻自己的研究過(guò)程和人工智能的發(fā)展歷程。而這次演講本身也正如同他摯愛(ài)的梅紐因演奏的帕格尼尼小提琴協(xié)奏曲,曲終而余韻繞梁,為我們留下了深深的思考。
人工智能起源于人們對(duì)于智能機(jī)器的夢(mèng)想。人工智能成為一門顯性的、嚴(yán)格的、系統(tǒng)的、可實(shí)現(xiàn)的科學(xué)和工程領(lǐng)域,得益于上個(gè)世紀(jì)邏輯科學(xué)、計(jì)算機(jī)科學(xué)、信息論、控制論及很多學(xué)科的發(fā)展的交匯。它基于一個(gè)很基本的假設(shè),即認(rèn)為人的思維活動(dòng)可以用機(jī)械的方式替代和完成。上世紀(jì)初,英國(guó)哲學(xué)家羅素寫了一本很有名的著作——《數(shù)學(xué)原理》,對(duì)數(shù)學(xué)的基本原則做了形式化的描述。后期哥德爾、圖靈等人的工作都是向人們展示,可以用一種簡(jiǎn)單的、只會(huì)做二元運(yùn)算的機(jī)器來(lái)模擬所有的數(shù)學(xué)邏輯。圖靈當(dāng)時(shí)提出一個(gè)大膽的見解,即“圖靈機(jī)”的概念。“他認(rèn)為有可能制造這么一臺(tái)機(jī)器,通過(guò)某一種電子媒介或其他的媒介跟人進(jìn)行交流。如果人在跟這臺(tái)機(jī)器交流過(guò)程中并不能判斷它到底是不是人,我們也許就可以下結(jié)論說(shuō)這個(gè)機(jī)器獲得了跟人一樣的智能。這個(gè)概念極大影響了人工智能對(duì)于功能的定義?!?/span>
60年前,在美國(guó)達(dá)特茅斯大學(xué)召開了一次會(huì)議,希望通過(guò)交流來(lái)確定人工智能作為一門科學(xué)的任務(wù)和整個(gè)路徑。同時(shí)他們也宣稱,學(xué)習(xí)以及人類智能的任何一個(gè)其他特征都可以被精準(zhǔn)地描述。一旦精準(zhǔn)描述成立以后,我們就可以用機(jī)器來(lái)模擬和實(shí)現(xiàn)它。此次會(huì)議被普遍認(rèn)為標(biāo)志著人工智能正式誕生。
在人工智能誕生后的幾年里,整個(gè)學(xué)界彌漫著樂(lè)觀的氣氛,認(rèn)為也許人工智能在不久的將來(lái)真的可以代替人類。然而,前途并非如此順利。人們發(fā)現(xiàn)邏輯證明器、感知器、增強(qiáng)學(xué)習(xí)、證應(yīng)用題的各種各樣的東西只不過(guò)是玩具而已,它們只能做很簡(jiǎn)單的、非常專門的任務(wù),稍微超出它們所預(yù)期的范圍就沒(méi)有辦法對(duì)付。
這體現(xiàn)了兩個(gè)方面的局限——一方面是當(dāng)時(shí)人工智能所運(yùn)用的數(shù)學(xué)模型和數(shù)學(xué)手段被發(fā)現(xiàn)是有理論缺陷的,另一個(gè)局限出現(xiàn)在算法上。這些缺陷,使得人工智能在很早期發(fā)展過(guò)程中遇到難以克服的瓶頸,不可能去實(shí)現(xiàn)一開始所保證的目標(biāo),比如接近人類甚至超過(guò)人類?!叭斯ぶ悄艿牡谝粋€(gè)冬天”來(lái)臨了。
天才的科學(xué)家們沒(méi)有泄氣,仍繼續(xù)向前行進(jìn)。一個(gè)標(biāo)志性事件是80年代卡耐基梅隆大學(xué)為DEC公司制造了一個(gè)叫“專家系統(tǒng)”的東西。這個(gè)“專家系統(tǒng)”可幫助這個(gè)公司每年節(jié)約4000萬(wàn)美元左右的費(fèi)用,還可以在決策方面提供更有價(jià)值的內(nèi)容。受到這種成功的鼓勵(lì),很多國(guó)家包括日本、美國(guó)都再次投入了很多資金,開發(fā)被稱作“人工智能計(jì)算機(jī)”的第五代計(jì)算機(jī)。多層神經(jīng)網(wǎng)絡(luò)、霍普菲爾德網(wǎng)絡(luò)都是在那個(gè)時(shí)候產(chǎn)生的。
同時(shí)也有一批人員從事算法研究,比如現(xiàn)在常聽到的反向傳播算法也是那個(gè)時(shí)候發(fā)明的。通過(guò)艱苦嘗試,涌現(xiàn)出了不少令人印象深刻的成果。比如自動(dòng)識(shí)別信封上的郵政編碼就是通過(guò)很精妙的人工神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)的,精度達(dá)到99%以上,已經(jīng)超過(guò)普通人可以達(dá)到的水平。樂(lè)觀形勢(shì)又一次產(chǎn)生。
不幸的是,寒冬又一次來(lái)了。這次是由于公眾和政府興趣的轉(zhuǎn)移,甚至包括一些競(jìng)爭(zhēng)對(duì)手的出現(xiàn)。大眾的熱情開始冷卻,政府經(jīng)費(fèi)開始下降。這些嚴(yán)重的困境使人們開始思考人工智能到底往何處走。此時(shí),研究者面臨著嚴(yán)肅的問(wèn)題:我們要實(shí)現(xiàn)什么樣的人工智能?什么叫智能?對(duì)此,邢波的回答是:“有兩種可能性:一種是向人學(xué)習(xí)、向生物學(xué)習(xí)、向自然學(xué)習(xí),用一種仿生的反向工程的手段制造跟人腦結(jié)構(gòu)原理盡可能相像的機(jī)器。這個(gè)途徑是非常困難的。另一種方法是從人和動(dòng)物界獲得一些啟發(fā),做足夠的簡(jiǎn)化,使得我們能夠部署簡(jiǎn)單明確的數(shù)學(xué)模型和強(qiáng)大的計(jì)算引擎,使得優(yōu)化的途徑變得比較容易。另一方面,也可以直接利用人類工程領(lǐng)域的很多成果,比如電子計(jì)算機(jī),使用一種類似暴力堆砌、資源堆砌的手段,實(shí)現(xiàn)彎道超車式的效果,使機(jī)器在一種不同路徑上超過(guò)人?!?/p>
大約在同一年代,人工智能整個(gè)研究也開始重新確定自己的方向。邢波評(píng)價(jià)道:
對(duì)人工智能任務(wù)的明確和簡(jiǎn)化帶來(lái)了一次新的繁榮。數(shù)學(xué)工具上找到很多新的方法,包括原來(lái)已經(jīng)存在于數(shù)學(xué)或者其他學(xué)科文獻(xiàn)中的方法被重新發(fā)掘出來(lái),用到計(jì)算機(jī)或者人工智能研究中。另一方面,由于這些數(shù)學(xué)模型對(duì)自然世界的簡(jiǎn)化,使理論分析和證明變得可能。研究者開始分析到底需要多少數(shù)據(jù)、計(jì)算量才能夠獲得預(yù)期的結(jié)果,這樣的理論洞見對(duì)開發(fā)系統(tǒng)大有裨益。第三方面,邢波認(rèn)為更重要的,是人們終于把人工智能跟人類其他工程技術(shù)方面上的成就做了緊密連接。摩爾定律的實(shí)現(xiàn)使得計(jì)算能力越來(lái)越強(qiáng)大。人工智能被定義為數(shù)學(xué)上的解題過(guò)程,這樣就可以把很多計(jì)算能力轉(zhuǎn)移過(guò)來(lái)提高人工智能的效果。
這么一系列突破將人工智能引入一個(gè)新的繁榮期,產(chǎn)生了很多驚人的突破。早期的結(jié)果包括1997年的時(shí)候IBM深藍(lán)和卡斯帕羅夫的象棋大賽,最終結(jié)果是機(jī)器人獲勝。在更加通用的功能比如回答智力競(jìng)賽或是識(shí)別圖片的比賽中,機(jī)器也可以達(dá)到或者超過(guò)人類的標(biāo)準(zhǔn)。機(jī)器人也因此有了很大的進(jìn)步。
邢波解釋道。
在這樣的背景下,我們似乎有理由對(duì)今后的前景重拾樂(lè)觀情緒。人工智能真的有希望接近人類了嗎?事實(shí)上人工智能領(lǐng)域又遇到了困難。
2011年,邢波迎來(lái)了做教授以來(lái)的第一次學(xué)術(shù)休假。當(dāng)時(shí)他選擇去了一個(gè)很年輕的公司,就是Facebook?!爱?dāng)時(shí)我是Facebook第一個(gè)訪問(wèn)教授,就像今天的講座一樣,感覺(jué)壓力還是特別大的。其中一個(gè)任務(wù)就是通過(guò)社交網(wǎng)絡(luò)里用戶跟別人連接的方式,把他們投射到一個(gè)社交空間中,這樣可以做一個(gè)社群的檢測(cè)。把他們來(lái)分組、特征化。這個(gè)任務(wù)實(shí)際上在統(tǒng)計(jì)學(xué)和人工智能里并不是很陌生的任務(wù)。但這個(gè)工作有一個(gè)問(wèn)題:它的計(jì)算復(fù)雜度是平方型的,也就是當(dāng)你的人從10個(gè)人增加到100個(gè)人的時(shí)候,你的計(jì)算量就會(huì)增加到1萬(wàn);再平方一次,那這樣的話就會(huì)產(chǎn)生瓶頸。當(dāng)你網(wǎng)絡(luò)特別大的時(shí)候,我們就沒(méi)有辦法去克服計(jì)算的障礙。這是當(dāng)時(shí)讓我們頭大的問(wèn)題?!?/span>
但是同時(shí),這讓作為人工智能學(xué)者的邢波很興奮。“我們不怕這個(gè)東西,我們很擅長(zhǎng)研究算法、模型、特征,看看能不能做加速。實(shí)際上我們也的確做了很好的工作,比如我們把社交網(wǎng)絡(luò)抽取比‘邊’更強(qiáng)大的特征叫做‘三角特征’,我們把模型也做了升級(jí),從混合區(qū)塊模型到混合三角模型。在算法上也做了一兩次非常顯著的革新。從蒙特卡羅算法和隨機(jī)變分算法,每一次突破都產(chǎn)生良好的效果,以致于我們可以在比較大的網(wǎng)絡(luò)里面,產(chǎn)生了實(shí)際上的結(jié)果,而且比原來(lái)結(jié)果在速度上提升兩到三個(gè)數(shù)量級(jí)?!?/p>
盡管有了一定的突破,實(shí)際上的任務(wù)卻遠(yuǎn)不止如此?!拔覀兊娜蝿?wù)不是100萬(wàn)個(gè)用戶,而是1億個(gè)用戶或者是大于1億個(gè)用戶,這里還是差了兩個(gè)數(shù)量級(jí)。當(dāng)然我們也有理由說(shuō)我們的確還有潛力,因?yàn)槲覀冎挥靡慌_(tái)筆記本電腦。但是在Facebook機(jī)房里躺著1000臺(tái)Hadoop機(jī)器,可以運(yùn)轉(zhuǎn)分布式程序;所以我們做了一個(gè)簡(jiǎn)單的計(jì)算,任務(wù)大了100倍,但是資源大了1000倍。也許我可以在原來(lái)6分鐘基礎(chǔ)上繼續(xù)減,可以在0.6分鐘把這個(gè)問(wèn)題搞定。這是當(dāng)時(shí)的愿景,我們寫了Hadoop程序,把我們的算法做了并行化??上ё詈蟮慕Y(jié)果非常不理想,我們等了一個(gè)多星期還是沒(méi)有得到結(jié)果,而不是0.6分鐘?!?/p>
這里就產(chǎn)生了本質(zhì)性的問(wèn)題,并行運(yùn)算并不是人們理想中這樣簡(jiǎn)單倍增的結(jié)果,而是有其內(nèi)在的復(fù)雜性?!爱?dāng)你把大任務(wù)分割在不同機(jī)器上讓它們分開跑,又同時(shí)在共同執(zhí)行同一個(gè)全局任務(wù)的時(shí)候,它們是需要做這樣一件事情的:首先,它們各自得做自己局部的運(yùn)算,但因?yàn)槭窃谕瓿梢粋€(gè)共同的任務(wù),它們需要做一個(gè)握手,能夠達(dá)成一致性,所以需要來(lái)一次通訊,那么這個(gè)通訊是必須發(fā)生在每臺(tái)機(jī)器把它們的子任務(wù)完成以后才能通訊。所以每次我們都可以想象需要有一個(gè)等待的時(shí)間,讓所有機(jī)器都完成它們的任務(wù)。在一個(gè)大的集群里面,總有拖后腿的。因?yàn)樵趯?shí)際的計(jì)算機(jī)環(huán)境里,總還有其他用戶,別人也在跑程序,或者是機(jī)房里的溫度不均勻。反正機(jī)器搞得不一樣,而且每次還是隨機(jī)性的不一樣。所以,最后每一次迭代循環(huán)的時(shí)間都是由最慢機(jī)器決定的,這就產(chǎn)生了Hadoop這種模式下并行計(jì)算機(jī)的瓶頸,你很難實(shí)現(xiàn)把它加速。這個(gè)困難相當(dāng)嚴(yán)重,以致于我當(dāng)時(shí)做訪問(wèn)教授結(jié)束的時(shí)候還是沒(méi)有解決,所以我當(dāng)時(shí)覺(jué)得非常的尷尬,卡耐基梅隆大學(xué)人工智能教授搞不定1000臺(tái)機(jī)器,也沒(méi)有產(chǎn)生什么功能,當(dāng)時(shí)走的時(shí)候還是比較沮喪的?!?/p>
正如爬山時(shí)遇到暴風(fēng)雪甚至雪崩,各種各樣的挫折使得研究者們離他們的目標(biāo)似乎越來(lái)越遠(yuǎn)了。
邢波在這個(gè)時(shí)候重新陷入了思考:我們的目標(biāo)究竟是什么?我們到底需要什么來(lái)達(dá)成這樣一個(gè)目標(biāo)?“從人工智能角度來(lái)講,我們需要完成大型的任務(wù),而且我們需要用一個(gè)嚴(yán)格的數(shù)學(xué)上圓滿的或者嚴(yán)格的方法來(lái)實(shí)現(xiàn)這么一個(gè)目標(biāo)。很顯然,光是有一個(gè)好的模型或者好的算法顯然是不夠的,我們還需要對(duì)于人工智能計(jì)算部分的強(qiáng)力的引擎支持,而且這個(gè)引擎支持有可能跟原來(lái)不一樣。因?yàn)槿斯ぶ悄苡?jì)算有它的獨(dú)特性,它是用迭代的、反復(fù)讀取數(shù)據(jù)和刷新模型的方法來(lái)實(shí)現(xiàn)解決方案的。好的模型設(shè)計(jì)其實(shí)是不夠的,必須要有助推器把它驅(qū)動(dòng)起來(lái),我想這就是當(dāng)時(shí)人工智能發(fā)展中遇到的一個(gè)瓶頸?!?/p>
那么,到底要如何從失敗的經(jīng)驗(yàn)中找到一個(gè)更加快速、但同時(shí)又?jǐn)?shù)學(xué)上正確的方法來(lái)運(yùn)行一個(gè)并行人工智能程序?帶著這樣的問(wèn)題,邢波離開Facebook,回到卡耐基梅隆大學(xué),進(jìn)行了一系列新的思考。
2012年,邢波和幾位同事設(shè)計(jì)了一種叫做參數(shù)服務(wù)器的新型系統(tǒng)模型。他們?yōu)樗O(shè)計(jì)了新的理論基礎(chǔ),給出了嚴(yán)格的數(shù)學(xué)證明,同時(shí)也搭出了框架原型。在這個(gè)框架下,核心概念就是把一個(gè)并行人工智能程序當(dāng)成是一個(gè)在執(zhí)行救火任務(wù)的機(jī)群,即小的錯(cuò)誤是可以容納的,但總體的目標(biāo)是不可改變的?;谶@樣的目標(biāo),邢波和同事們?cè)O(shè)計(jì)了一個(gè)新的橋接模型,稱為有限異步模型?!拔覀冇糜邢蕻惒讲⑿械臉蚪釉砣?gòu)架了參數(shù)服務(wù)器的編程界面,它擁有一個(gè)共享內(nèi)存大規(guī)模編程界面,使并行程序的編寫容易度,運(yùn)行速度和精度都有巨大的提高。這個(gè)系統(tǒng)并不是為某一個(gè)特定人工智能計(jì)算來(lái)設(shè)計(jì)的,它更像是平臺(tái)通用模型。它的設(shè)計(jì)考慮了整個(gè)人工智能程序家族的普遍共享的一些特征,給他們提供比較優(yōu)質(zhì)的通訊上的服務(wù)。所以在我們軟件包里包括不同其他的算法。這個(gè)系統(tǒng)也有非常靈活的容錯(cuò)或者通訊管理的機(jī)制,所以使得隨機(jī)的資源空檔或者小錯(cuò)誤也會(huì)獲得關(guān)注,最后的結(jié)果是整個(gè)系統(tǒng)的工效獲得巨大的提升?!?/p>
同時(shí),邢波和同事們還實(shí)現(xiàn)了另外一個(gè)突破。當(dāng)訓(xùn)練巨大模型時(shí),需要有一個(gè)協(xié)調(diào)裝置。為此,他們?cè)O(shè)計(jì)了名為動(dòng)態(tài)調(diào)度器的系統(tǒng),可以實(shí)時(shí)監(jiān)控子模型或者子任務(wù)之間的一致性,保證數(shù)學(xué)上是正確而不是衰減的。這樣就帶來(lái)了數(shù)學(xué)上和功效上的質(zhì)量保障。
“由于這一系列的成果,我們感覺(jué)是在一個(gè)正確的路上在走,我們的確跟這個(gè)目標(biāo)開始接近了。爬山也會(huì)經(jīng)歷這樣一個(gè)類似的過(guò)程,我們開始向峰頂接近?!闭劦綖楹螘?huì)以登山作為類比,邢波認(rèn)為,人工智能算法本身這個(gè)計(jì)算任務(wù)像登山,是有明確的目標(biāo)的,本身有彈性、容錯(cuò)性、隨機(jī)性。如果能夠很好使用這些特征和機(jī)會(huì)的話,就可以獲得事半功倍的結(jié)果。人工智能領(lǐng)域的發(fā)展也像登山,它有各種各樣的起伏,有各種各樣的思路的跳躍和重新的定位,一個(gè)好的解決方法,通常對(duì)于任務(wù)目標(biāo)、數(shù)學(xué)模型、計(jì)算引擎有比較全面精確掌控和實(shí)現(xiàn)才能達(dá)到目的。而如果對(duì)它設(shè)置一個(gè)類似科幻的、不切實(shí)際的目標(biāo),或者是一個(gè)模糊的路徑、錯(cuò)誤的定位,都會(huì)導(dǎo)致挫折,就會(huì)像人工智能的前幾次冬天一樣。
這里有一個(gè)小小的后記。邢波是這樣描述的:“我發(fā)覺(jué)人生很有意思,你做的每一件是好像最后的結(jié)果都有一個(gè)兩面的反映,有些人會(huì)喜歡,有些人會(huì)不喜歡。比如說(shuō)像人工智能,我們有很多人對(duì)它的結(jié)果很興奮,有些人又相當(dāng)恐懼?!?/span>
就此,邢波分享了他的觀點(diǎn)。他認(rèn)為人工智能和人類對(duì)決不是什么大得了不起的事,人類和機(jī)器對(duì)決自古就有,且還在發(fā)生。馬車被火車戰(zhàn)勝以后,固然有人驚呼,但是世界運(yùn)轉(zhuǎn)如故。大概在同一個(gè)時(shí)代有人發(fā)明了照相機(jī),當(dāng)時(shí)有人驚恐,以為照相機(jī)來(lái)了以后畫家就失業(yè)了,但是現(xiàn)在畫家還是活得好好的,甚至新的藝術(shù)形式也被創(chuàng)造出來(lái)了。人機(jī)大賽只不過(guò)是人類在技術(shù)上的里程碑,展示了人類智慧的力量和功能,我們可以以歡迎的心態(tài)接受它。
至于它到底會(huì)不會(huì)強(qiáng)到把我們干掉的地步?邢波認(rèn)為這也是不必?fù)?dān)心的。人工智能和自然智能或者是人類智能走的路其實(shí)是非常不一樣的。人類智能定義實(shí)際上不是單一的,它是一個(gè)泛化的、比較模糊、非常難以衡量的功能。而人工智能所集中的東西是單一的、明確的、可評(píng)測(cè)的功能。人工智能使用顯性、簡(jiǎn)化的數(shù)學(xué)模型,可以獲得理論、實(shí)際的邊界,而人類的潛能還沒(méi)有看到邊界。邢波的觀點(diǎn)是:只要是在有限、透明規(guī)則、特定任務(wù)下,機(jī)器超過(guò)人的水平只是時(shí)間問(wèn)題。這是好事,因?yàn)樗梢詭腿祟悓?shí)現(xiàn)很多有價(jià)值的功能,成為人類的好助手,降低我們生活的成本,提高我們的效率。
但人工智能可以代替人嗎?邢波笑言這是天方夜譚。人類現(xiàn)有的工程能力連造一個(gè)細(xì)菌都沒(méi)法造出來(lái),更不要說(shuō)去實(shí)現(xiàn)人的思維和頭腦。而且人的頭腦有很多獨(dú)特的功能,比如創(chuàng)造性思維、感情、常識(shí)、美感,這都是人工智能無(wú)法企及的。
我想我們已經(jīng)知道答案了。
聯(lián)系客服