新智元推薦1
發(fā)表于 《科技導(dǎo)報(bào)》2016,34(7)
2016年3月,在韓國(guó)首爾四季酒店舉行的谷歌 DeepMind圍棋挑戰(zhàn)賽,人工智能圍棋軟件AlphaGo以4∶1戰(zhàn)勝了韓國(guó)棋手李世乭九段。本次比賽后,關(guān)于人工智能和機(jī)器學(xué)習(xí)的話題迅速升溫,引起社會(huì)各界的關(guān)心。然而,除了在本領(lǐng)域工作的一線科研人員,其他人士對(duì)人工智能和機(jī)器學(xué)習(xí)的發(fā)展現(xiàn)狀和前景了解的卻不多,甚至存在不少誤解。在此,本文希望能跟讀者探討一下人工智能和機(jī)器學(xué)習(xí),談?wù)勂浒l(fā)展現(xiàn)狀與未來趨勢(shì)。
1 什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支學(xué)科,主要研究的是讓機(jī)器從過去的經(jīng)歷中學(xué)習(xí)經(jīng)驗(yàn),對(duì)數(shù)據(jù)的不確定性進(jìn)行建模,在未來進(jìn)行預(yù)測(cè)。
舉一個(gè)最簡(jiǎn)單的二分類例子(圖1),假設(shè)現(xiàn)在想用機(jī)器自動(dòng)把網(wǎng)頁(yè)分成2大類:體育和非體育類網(wǎng)頁(yè)。首先需要收集訓(xùn)練樣本,在這里,指得就是各種體育類和非體育類的網(wǎng)頁(yè)。接下來,需要對(duì)樣本進(jìn)行分析,通過一些抽象化的描述,定義特征。譬如,分析網(wǎng)頁(yè)里應(yīng)用的詞語(yǔ)以及每個(gè)詞語(yǔ)出現(xiàn)的次數(shù)。第三步為數(shù)據(jù)建模。通常,需要設(shè)計(jì)數(shù)學(xué)模型,來分析特征與標(biāo)簽的分布情況。具體來說,是通過優(yōu)化方法,學(xué)習(xí)一個(gè)映射函數(shù),其輸入是一個(gè)樣本的特征向量,其輸出是標(biāo)簽(體育類或非體育類)。在預(yù)測(cè)階段,當(dāng)用戶輸入一個(gè)新的網(wǎng)頁(yè)樣本時(shí),我們同樣做特征抽取,通過使用學(xué)習(xí)完畢獲得的映射函數(shù),自動(dòng)去預(yù)測(cè)這個(gè)樣本的標(biāo)簽類別。
上述例子僅是一個(gè)較常見的有監(jiān)督二分類問題。在機(jī)器學(xué)習(xí)領(lǐng)域,通常人們習(xí)慣把算法分為3類:有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。所謂有沒有“監(jiān)督”,指的是機(jī)器在學(xué)習(xí)階段, 能否看到樣本的標(biāo)簽(如上述例子中的體育及非體育類別)。半監(jiān)督學(xué)習(xí)通常也被稱為弱監(jiān)督學(xué)習(xí),目的是通過少量的例子,在無標(biāo)簽的樣本中自動(dòng)學(xué)習(xí)參數(shù)。至于無監(jiān)督學(xué)習(xí),通常人們接觸比較多的是聚類問題:通過分析數(shù)據(jù)樣本的相似性,來把相似的數(shù)據(jù)組合成集群。
2 機(jī)器學(xué)習(xí)的當(dāng)前研究重點(diǎn)和發(fā)展趨勢(shì)
除了上述3大類算法,機(jī)器學(xué)習(xí)還有很多有趣的子領(lǐng)域。 比如近些年興起的深度學(xué)習(xí)熱潮,指的是通過使用多層的神經(jīng)網(wǎng)絡(luò)模型在大數(shù)據(jù)上建模。比如谷歌的AlphaGo系 統(tǒng),就是通過在數(shù)十萬的人類對(duì)弈棋譜上學(xué)習(xí)策略網(wǎng)絡(luò)(Policy Network)和估值網(wǎng)絡(luò)(Value Network),再結(jié)合蒙特卡洛搜索樹算法來決定如何走棋的。所謂策略網(wǎng)絡(luò),其實(shí)是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),用來選擇如何落子。所謂估值網(wǎng)絡(luò),也是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),用來分析當(dāng)前的勝率。圍棋的棋盤相對(duì)較大,是一個(gè)19×19 的網(wǎng)格,每一步有上百種走法。對(duì)于李世乭這類頂級(jí)棋手來說,可以預(yù)測(cè)未來的局勢(shì)。對(duì)于計(jì)算機(jī)來說并非易事,因?yàn)榭梢月渥拥乃阉骺臻g太大。谷歌之所以取得成功,正是因?yàn)槠浜芎玫匕堰@2個(gè) 神經(jīng)網(wǎng)絡(luò)與蒙特卡洛搜索樹結(jié)合,精確地分析和預(yù)測(cè)了李世乭的棋路。
在大數(shù)據(jù)時(shí)代,機(jī)器學(xué)習(xí)領(lǐng)域還有 一個(gè)熱點(diǎn)是把系統(tǒng)與算法結(jié)合,設(shè)計(jì)大規(guī)模分布式的機(jī)器學(xué)習(xí)算法與系統(tǒng),使得機(jī)器學(xué)習(xí)算法可以在多處理器和多機(jī)器的集群環(huán)境下作業(yè),處理更大量級(jí)的數(shù)據(jù)。這方面較為知名的系統(tǒng)包括: 加州大學(xué)伯克利分校的Spark、谷歌的TensorFlow、華盛頓大學(xué)的Dato(原名 GraphLab)、卡內(nèi)基梅隴大學(xué)的Petuum、微軟的DMTK系統(tǒng)等。也許在 幾十年前,計(jì)算機(jī)科學(xué)的核心是操作系統(tǒng)、算法和編程語(yǔ)言。但是在今天,在大數(shù)據(jù)的背景下,計(jì)算機(jī)科學(xué)逐漸演變成一個(gè)越來越強(qiáng)調(diào)跨領(lǐng)域合作的學(xué) 科。如何有效地把系統(tǒng)和機(jī)器學(xué)習(xí)方法相結(jié)合來處理海量數(shù)據(jù),這將是未來人工智能和計(jì)算機(jī)科學(xué)發(fā)展的關(guān)鍵。 除了這2個(gè)最近5年比較熱門的領(lǐng)域,其實(shí)機(jī)器學(xué)習(xí)還有許多有意思的科研方法。譬如,優(yōu)化算法一直是機(jī)器學(xué)習(xí)領(lǐng)域的重點(diǎn),如何處理各種凸優(yōu)化和非凸優(yōu)化問題、如何處理分布式優(yōu)化,避免局部最優(yōu)解,一直是學(xué)者最關(guān)注的問題之一。其他值得關(guān)注的領(lǐng)域,還包括強(qiáng)化學(xué)習(xí)(reinforcement learning)、概率圖模型(probabilistic graphical models)、統(tǒng)計(jì)關(guān)系學(xué)習(xí)(statistical relational learning)等。
3 谷歌AlphaGo成功的啟示
在谷歌的AlphaGo系統(tǒng)戰(zhàn)勝李世乭后,由于對(duì)技術(shù)背景缺乏了解,加上部分公司和媒體為了達(dá)到商業(yè)目的而進(jìn)行的夸張宣傳,部分人對(duì)人工智能和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展表示擔(dān)憂。有人認(rèn)為,圍棋是人類最后的智力堡壘,計(jì)算機(jī)攻克了圍棋,那么人類是不是離滅亡也不遠(yuǎn)了?
在國(guó)內(nèi)外人工智能學(xué)者的討論中, 美國(guó)喬治亞理工大學(xué)機(jī)器學(xué)習(xí)助理教授Le Song認(rèn)為這種論斷具有基本的邏輯錯(cuò)誤,因?yàn)楣沤裰型?,?huì)下圍棋并不代表能統(tǒng)治世界,絕大多數(shù)的國(guó)家領(lǐng)導(dǎo)人也都不是圍棋棋手。從事實(shí)出發(fā),谷歌的AlphaGo系統(tǒng)僅僅是在人類棋譜上訓(xùn)練而成的計(jì)算機(jī)圍棋軟件系統(tǒng),其根本不具有理解人類語(yǔ)言、圖片和推理等其他機(jī)器智能。另外,需要強(qiáng)調(diào)的是,AlphaGo系統(tǒng)的背后,是幾十名谷歌科學(xué)家數(shù)年的辛苦工作,設(shè)計(jì)算法和調(diào)試程序的反復(fù)迭代,才取得的成果。 所以,AlphaGo的棋商,歸根到底也是谷歌科學(xué)家們集體智慧的結(jié)晶。
不久前,我通過微博對(duì)我的朋友們 (主要來自科技界)做了一項(xiàng)多項(xiàng)選擇調(diào)查:“你覺得 AlphaGo戰(zhàn)勝李世乭意味著什么?” 361位用戶參與了投票,其中44.5%的票投給了“一次對(duì)技術(shù)發(fā)展 有益的測(cè)試。”;29.5%的票投給了“AI 歷史上的里程碑事件?!保?3.8%的票給與了“無感,圍棋規(guī)則明確,機(jī)器善長(zhǎng)。”;另外有10%左右的票認(rèn)為李世乭不在巔峰,應(yīng)該給柯潔機(jī)會(huì)。然而,只有 0.6%的票認(rèn)為“機(jī)器即將滅亡人類”。由此可見,科技界總體相對(duì)還是比較理智的。
毫無疑問,我認(rèn)為AlphaGo是近年來機(jī)器學(xué)習(xí)、系統(tǒng)和高效搜索算法結(jié)合成功的典范,谷歌AlphaGo成功給我們的啟示是多方面的:
1)正確的選題。谷歌選擇了可以量化、規(guī)則明確的計(jì)算機(jī)圍棋領(lǐng)域,其主要負(fù)責(zé)人David Silver 和 Aja Huang的博士論文均是計(jì)算機(jī)圍棋,有著超過10年的經(jīng)驗(yàn)。
2)恰當(dāng)?shù)姆椒ㄅc時(shí)機(jī)。在計(jì)算機(jī)性能大幅度提升的大背景下,谷歌通過訓(xùn)練大規(guī)模深度學(xué)習(xí)網(wǎng)絡(luò),結(jié)合高效的傳統(tǒng)蒙特卡洛搜索樹,成功地控制了圍棋的復(fù)雜度。
3)精密的工程實(shí)現(xiàn)。在數(shù)十名谷歌工程師的努力下,AlphaGo有了單機(jī)和分布式 2個(gè)版本,針對(duì)時(shí)間限制,設(shè)計(jì)了快速落子和仔細(xì)斟酌的策略,對(duì)時(shí)間采取毫秒級(jí)別的估計(jì)。這些工程上的細(xì)節(jié),無疑是決定成敗的關(guān)鍵之一。
卡內(nèi)基梅隴大學(xué)博士、Facebook圍棋項(xiàng)目負(fù)責(zé)人田淵棟認(rèn)為:谷歌AlphaGo的成功,告訴我們結(jié)合機(jī)器學(xué) 習(xí)與傳統(tǒng)符號(hào)搜索方法可以解決人工 智能里相對(duì)復(fù)雜的推理問題。這點(diǎn)我 十分同意。David Silver 等 2016 年 1 月 在《Nature》發(fā)表的介紹AlphaGo的論文 中,也明確提到了,只有把機(jī)器學(xué)習(xí)與 高效的搜索方法集合,AlphaGo才能取 得最高的Elo棋力評(píng)價(jià)(圖2)。
4 理性看待人工智能和機(jī)器學(xué)習(xí)的未來
人工智能和機(jī)器學(xué)習(xí)的路還很長(zhǎng), 我們應(yīng)該正確認(rèn)識(shí)AI能夠在當(dāng)前取得的成就,才可以解決更加復(fù)雜的問題。 我們能看到上述 AlphaGo 對(duì)技術(shù)發(fā)展 的積極啟示,但是也不能忽略:對(duì)于自然語(yǔ)言理解,雖然經(jīng)過了數(shù)十年的發(fā)展,依然沒有人工智能系統(tǒng)可以做到完 全正確地理解人類的語(yǔ)言(包括語(yǔ)音識(shí)別和機(jī)器翻譯);在機(jī)器人領(lǐng)域,即使工業(yè)機(jī)器人發(fā)展迅速,我們依然沒有看到具有常識(shí)和推理能力的智能家庭機(jī)器人;在計(jì)算機(jī)視覺領(lǐng)域,即使我們?cè)谌四樧R(shí)別和圖片分類上取得了不小的成就,但是對(duì)于關(guān)系理解和完整的場(chǎng)景認(rèn)知,現(xiàn)在系統(tǒng)能做到的還很有限。
作為科學(xué)工作者,我們的本質(zhì)工作就是追尋事物發(fā)展的基本規(guī)律,尋找真理。所以在媒體出現(xiàn)與事實(shí)不符的報(bào)道時(shí),我們需要客觀地分析技術(shù)的發(fā)展,理性地看待科學(xué)技術(shù)的成長(zhǎng),澄清謠言。
歷史上,也曾出現(xiàn)過由于對(duì)人工智能的炒作而造成的技術(shù)發(fā)展停滯,這一時(shí)期被稱作是 AI 寒冬(AI winter)。在1970年代,由于較早前對(duì)人工智能技 術(shù)發(fā)展過于樂觀,但在由于實(shí)際實(shí)現(xiàn)中發(fā)現(xiàn)困難重重,美國(guó)國(guó)防部先進(jìn)研究項(xiàng)目局取消了大部分對(duì)人工智能研究項(xiàng)目的資助,導(dǎo)致人工智能技術(shù)在當(dāng)時(shí)發(fā)展停滯不前。
對(duì)于“人工智能威脅論”,大可不必?fù)?dān)心機(jī)器滅亡人類。至于人工智能技術(shù)發(fā)展對(duì)于社會(huì)的影響,我認(rèn)為是雙向的。首先,我同意卡內(nèi)基梅隴大學(xué)機(jī)器學(xué)習(xí)系A(chǔ)lex Smola教授的觀點(diǎn):AI技術(shù)在未來確實(shí)有可能對(duì)流水線工人、卡車司機(jī)、保潔員等相對(duì)低技能要求的工種造成沖擊,然而解決的辦法只能是提高整個(gè)社會(huì)的教育水平。其次,我認(rèn)為社會(huì)也在對(duì)人工智能技術(shù)的發(fā)展產(chǎn)生各種積極的約束:譬如,用戶對(duì)于技術(shù)的安全性和穩(wěn)定性的要求;用戶對(duì)于數(shù)據(jù)隱私的要求;用戶對(duì)于產(chǎn)品的道德約束??偠灾?dāng)前是人工智能發(fā)展的一個(gè)令人興奮的時(shí)期,機(jī)器學(xué)習(xí)技術(shù)對(duì)于整個(gè)人類的發(fā)展,也是具有不可估量的潛力。我們應(yīng)該正視科學(xué)技術(shù)發(fā)展的進(jìn)步,理性看待所取得的結(jié)果。
作者:王威廉 美國(guó)卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院 發(fā)表于 《科技導(dǎo)報(bào)》2016,34(7)
《科技導(dǎo)報(bào)》
中國(guó)科協(xié)學(xué)術(shù)會(huì)刊
聯(lián)系電話:010-62194182
長(zhǎng)按二維碼 即刻關(guān)注
聯(lián)系客服