中國(guó)工程院院士 高文車(chē)云按:本文是高文院士在第六屆車(chē)載信息服務(wù)產(chǎn)業(yè)應(yīng)用聯(lián)盟年會(huì)上發(fā)表的題為《人工智能的發(fā)展與未來(lái)挑戰(zhàn)》的演講。
高文,中國(guó)工程院院士,北京大學(xué)教授、博士生導(dǎo)師,國(guó)家自然基金委員會(huì)副主任,中國(guó)計(jì)算機(jī)協(xié)會(huì)理事長(zhǎng),第十屆、十一屆、十二屆全國(guó)政協(xié)委員。1988年在杭大獲計(jì)算機(jī)博士學(xué)位,1991年在日本東京大學(xué)獲電子學(xué)博士學(xué)位。研究領(lǐng)域?yàn)槿斯ぶ悄堋⒛J阶R(shí)別與多媒體計(jì)算,近年來(lái)主要研究領(lǐng)域包括視頻監(jiān)管等多個(gè)云項(xiàng)目,2003年因?qū)σ曨l技術(shù)的貢獻(xiàn)以及在中國(guó)發(fā)展的領(lǐng)導(dǎo)力,當(dāng)選為美國(guó)計(jì)算機(jī)學(xué)會(huì)的會(huì)員。
現(xiàn)在人工智能非常熱,講深度學(xué)習(xí)會(huì)講的比較多,講其他的比較少,但是我們有必要知道它的歷史、知道它的門(mén)派。人工智能到現(xiàn)在為止有60年的時(shí)間,有三大門(mén)派:
- 第一個(gè)門(mén)派,通常叫邏輯主義(符號(hào)主義),核心是符號(hào)推理與機(jī)器推理,用符號(hào)表達(dá)的方式來(lái)研究智能、研究推理。奠基人是西蒙(CMU)。
- 第二個(gè)門(mén)派,連接主義。核心是神經(jīng)元網(wǎng)絡(luò)與深度學(xué)習(xí),仿造人的神經(jīng)系統(tǒng),把人的神經(jīng)系統(tǒng)的模型用計(jì)算的方式呈現(xiàn),用它來(lái)仿造智能,目前人工智能的熱潮實(shí)際上是連接主義的勝利。奠基人是明斯基(MIT)。
- 第三個(gè)門(mén)派,行為主義。推崇控制、自適應(yīng)與進(jìn)化計(jì)算。這個(gè)流派最早期的時(shí)候大家對(duì)它的期望值是比較高,這些年行為主義沒(méi)有起來(lái),今后可能會(huì)有一個(gè)浪潮,這個(gè)行為主義其實(shí)和我們今后要做的車(chē)聯(lián)網(wǎng)非常密切。奠基人是維納(MIT)。
說(shuō)到人工智能,人工智能的定義到底是什么?現(xiàn)在沒(méi)有非常嚴(yán)格準(zhǔn)確或者所有人都接受的定義,但是有一些約定俗成的說(shuō)法。通常人工智能是指機(jī)器智能,讓機(jī)器達(dá)到人智能所實(shí)現(xiàn)的一些功能。人工智能既然是機(jī)器智能,就不是機(jī)械智能,那么這個(gè)機(jī)器是指什么呢?是指計(jì)算機(jī),用計(jì)算機(jī)仿真出來(lái)的人的智能行為叫作人工智能。
人工智能研究領(lǐng)域包括認(rèn)知建模、知識(shí)表示、推理及應(yīng)用、機(jī)器感知、機(jī)器思維、機(jī)器學(xué)習(xí)、機(jī)器行為和智能系統(tǒng)等。研究人工智能的動(dòng)力包括推理,知識(shí),規(guī)劃,學(xué)習(xí),交流,感知,移動(dòng)和操作物體的能力等。我們說(shuō)車(chē)聯(lián)網(wǎng)里面要有人工智能,這個(gè)人工智能主要是做什么呢?這里包括了很多東西,包括它需要對(duì)周邊環(huán)境的感知、對(duì)移動(dòng)操作的控制、對(duì)整個(gè)行為的學(xué)習(xí)以及交互交流,所以整個(gè)都需要人工智能才可以做得好。
現(xiàn)在人工智能用得最好的領(lǐng)域是在搜索,這一輪我們說(shuō)互聯(lián)網(wǎng)熱,現(xiàn)在叫“互聯(lián)網(wǎng)+”,最大的進(jìn)展其實(shí)就是搜索的進(jìn)展。我們知道谷歌和百度的成功其實(shí)都是搜索的成功,原來(lái)的搜索都是基于關(guān)健字的搜索,現(xiàn)在的搜索除了關(guān)健字以外,還有很多基于云的搜索,比如說(shuō)科大訊飛,這是語(yǔ)音的進(jìn)展。另外,現(xiàn)在的搜索越來(lái)越智能,以前的搜索你輸入幾個(gè)關(guān)健詞,現(xiàn)在的搜索可以理解整個(gè)句子,知道你想要問(wèn)什么,然后搜索出你最想要的答案。下一個(gè)是什么?可能會(huì)是駕駛,和車(chē)聯(lián)網(wǎng)的關(guān)系非常密切。
人工智能能不能繞開(kāi)人工智能的奠基人?人工智能的奠基人叫阿蘭·圖靈(Alan Turing),這是一個(gè)天才,他締造了兩個(gè)領(lǐng)域,是這兩個(gè)領(lǐng)域之父:一個(gè)是計(jì)算機(jī)科學(xué)之父,沒(méi)有圖靈機(jī)就沒(méi)有今天的計(jì)算機(jī),我們今天所有的計(jì)算機(jī)模型都是基于圖靈機(jī)的。圖靈也是人工智能之父。圖靈只活了四十幾歲,在他的晚期對(duì)人工智能特別著迷,提出了圖靈測(cè)試,這也是我們今天之所以能夠研究人工智能,是因?yàn)閳D靈前面為我們開(kāi)辟了一條道路。
圖靈測(cè)試實(shí)際上是現(xiàn)在人工智能來(lái)判斷一個(gè)機(jī)器是不是有智能的依據(jù):有一臺(tái)機(jī)器和一個(gè)人,都被放置在黑屋子里,測(cè)試員不知道哪個(gè)屋子是機(jī)器哪個(gè)屋子是人。然后由測(cè)試員就開(kāi)始問(wèn)問(wèn)題,一直問(wèn)到他能判斷哪個(gè)屋子里是機(jī)器,哪個(gè)屋子里是人,那這個(gè)測(cè)試就完成了。當(dāng)測(cè)試員把所有能夠想出來(lái)的問(wèn)題都問(wèn)完了,他還判斷不出來(lái)哪個(gè)是機(jī)器哪個(gè)是人,這個(gè)機(jī)器就具有智能了,這就叫圖靈測(cè)試。當(dāng)時(shí)在圖靈那個(gè)年代,這個(gè)測(cè)試通常用聲音提供,人和機(jī)器的聲音一聽(tīng)就能知道,所以他要求通過(guò)鍵盤(pán)進(jìn)行測(cè)試。
為了紀(jì)念圖靈,圖靈去世以后,后人有很多紀(jì)念圖靈的辦法,1966年由ACM學(xué)會(huì)設(shè)立圖靈獎(jiǎng),被成為計(jì)算機(jī)學(xué)科的諾貝爾獎(jiǎng)。這個(gè)獎(jiǎng)共有60余人獲獎(jiǎng),每年有1-3名,其中也有華人獲獎(jiǎng)?wù)咭ζ谥?。獲獎(jiǎng)人可以共享一個(gè)獎(jiǎng)勵(lì),這個(gè)獎(jiǎng)勵(lì)是由企業(yè)出錢(qián)來(lái)獎(jiǎng)勵(lì)計(jì)算機(jī)學(xué)會(huì)的人。這60多人中有8位是做人工智能的,大概1/8左右和人工智能有關(guān)。國(guó)內(nèi)在討論要不要把人工智能變成一級(jí)學(xué)科,從這個(gè)角度看人工智能是很重要的。
人工智能到去年剛好是60年,第一屆人工智能最主要的討論會(huì)發(fā)起是1956年,當(dāng)時(shí)是由幾個(gè)年輕人發(fā)起,有大概20多個(gè)人參加,在美國(guó)的達(dá)特茅斯開(kāi)了一個(gè)暑期研究班。這個(gè)研究班當(dāng)時(shí)有很多現(xiàn)在非常有名的人參加,但是當(dāng)時(shí)都非常年輕。這些人聚在一起討論了兩星期,最后就把人工智能的框架給闡述出來(lái)了。這些人當(dāng)中有很多都是今天耳熟能詳?shù)?,后?lái)大部分人都獲得了圖靈獎(jiǎng),很多都是人工智能的泰山鼻祖人物。這些人當(dāng)時(shí)雖然不在斯坦福,但是后來(lái)都到斯坦福教學(xué)了,成了斯坦福的教授。
人工智能從1956年開(kāi)始以后幾起幾落,出現(xiàn)了幾次浪潮,現(xiàn)在人工智能已經(jīng)是第三波浪潮了。第一波浪潮實(shí)際上是從1956年-1976年,最核心的是邏輯主義。就是上文提到的第一個(gè)學(xué)派。邏輯主義主要是用機(jī)器證明的辦法去證明和推理一些知識(shí),比如能不能用機(jī)器證明一個(gè)數(shù)學(xué)定理,這是機(jī)器證明的問(wèn)題。要想證明這些問(wèn)題,需要把原來(lái)的條件和定義從形式化變成邏輯表達(dá),然后用邏輯的方法去證明最后的結(jié)論是對(duì)的還是錯(cuò)的,叫做邏輯證明。
實(shí)際上早期的計(jì)算機(jī)人工智能都是沿著這條路在走,所以當(dāng)時(shí)我們有很多專(zhuān)家系統(tǒng),比如醫(yī)學(xué)專(zhuān)家系統(tǒng)。醫(yī)學(xué)專(zhuān)家系統(tǒng)輸入的是什么呢?是輸入一些癥狀。這些癥狀是用語(yǔ)言輸進(jìn)的,但機(jī)器里面可以變換成邏輯表達(dá),用符號(hào)演算的辦法推出來(lái)你大概是什么病或者肯定是什么病。所以當(dāng)時(shí)在邏輯的抽象、邏輯的運(yùn)算和邏輯表達(dá)方面,人們花了大量的工夫。
當(dāng)時(shí)在1958年這個(gè)領(lǐng)域剛開(kāi)了兩年之后,就有兩位計(jì)算機(jī)領(lǐng)域的大師,Herbert Simon和Allen Newell,他們的理論直接涉及到?jīng)Q策論,完全是一套邏輯主義的推理方法。他們對(duì)決策論經(jīng)濟(jì)學(xué)界很看好,很多人認(rèn)為做經(jīng)濟(jì)學(xué)的判斷是非常應(yīng)該的。當(dāng)時(shí)他們做了一個(gè)大膽的預(yù)言,十年之內(nèi)計(jì)算機(jī)就可以寫(xiě)出優(yōu)美的樂(lè)譜,十年之內(nèi)計(jì)算機(jī)就能夠?qū)崿F(xiàn)大多數(shù)的心理學(xué)行為。當(dāng)時(shí)他們判斷這些事都可以迎刃而解,并不是什么問(wèn)題,但事實(shí)證明這不是真的。包括國(guó)際象棋冠軍一直到一九九幾年才實(shí)現(xiàn),圍棋一直到去年才實(shí)現(xiàn)。
數(shù)學(xué)定理這件事是做通了,因?yàn)檫@件事是所有的事當(dāng)中最容易用邏輯的辦法解決的,所以學(xué)習(xí)推理證明是判斷的十個(gè)可能有四個(gè)可能最貼近目標(biāo)。計(jì)算機(jī)自動(dòng)譜曲這件事,當(dāng)然可以做很多,但是并不能達(dá)到隨心所欲的程度。最后這個(gè)心理學(xué)行為,到現(xiàn)在也還沒(méi)有完全做好,這是我們今后要做的事。
定理證明實(shí)際上是第一個(gè)浪潮當(dāng)中實(shí)現(xiàn)效果最好的,當(dāng)時(shí)有很多數(shù)學(xué)家用定理思路證明了數(shù)學(xué)定理。配合這些工作,當(dāng)時(shí)出了很多和邏輯證明相關(guān)的計(jì)算機(jī),我們把它叫做邏輯程序語(yǔ)言,比如很知名的Prolog。最關(guān)鍵的是要有一個(gè)很好的數(shù)據(jù)庫(kù),要有一個(gè)控制系統(tǒng),進(jìn)行邏輯推理和演算。
1976年前后,由于四大預(yù)言實(shí)現(xiàn)遙遙無(wú)期,關(guān)于人工智能方法論的爭(zhēng)論風(fēng)聲漸緊。1977年,曾是Simon研究生的Feigenbaum提出知識(shí)工程的概念。在一開(kāi)始邏輯主義和連接主義都在,第一個(gè)浪潮當(dāng)中邏輯主義是完全占上風(fēng)的,連接主義那時(shí)候不太吃香。然而邏輯主義最后沒(méi)有實(shí)現(xiàn)目標(biāo),引起了大家的反思,這時(shí)候神經(jīng)系統(tǒng)就慢慢占了上風(fēng)。
在70年代末,整個(gè)神經(jīng)元網(wǎng)絡(luò)、模型都有突飛猛進(jìn)的成績(jī),最重要的是有一個(gè)叫BP網(wǎng)絡(luò),這個(gè)模型能夠解決神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)。以前一個(gè)刺激對(duì)應(yīng)一個(gè)輸出,刺激和輸出是一對(duì),有什么樣的刺激就有什么樣的輸出。1986年BP網(wǎng)絡(luò)證明了神經(jīng)元網(wǎng)絡(luò),后來(lái)大家往更大的領(lǐng)域應(yīng)用,做出了比較大的貢獻(xiàn)。后來(lái)在很多模式識(shí)別的領(lǐng)域、手寫(xiě)漢字的識(shí)別、字符識(shí)別、簡(jiǎn)單的人臉識(shí)別才開(kāi)始慢慢用起來(lái),這個(gè)領(lǐng)域一下就熱起來(lái)。
第二個(gè)浪潮是連接主義。連接主義持續(xù)了十幾年,從1976年到80年代中期屬于低潮,大概到2006年又開(kāi)始走下坡了。1986年BP網(wǎng)絡(luò)剛出來(lái)的時(shí)候解決了不少問(wèn)題,大家都認(rèn)為人工智能是有希望的,后來(lái)十幾年以后發(fā)現(xiàn)神經(jīng)元網(wǎng)絡(luò)解決單一問(wèn)題可以,解決復(fù)雜問(wèn)題不行。訓(xùn)練學(xué)習(xí)的時(shí)候,數(shù)據(jù)量太大,有很多結(jié)果到一定程度就不再往上升了。這時(shí)候就出現(xiàn)了現(xiàn)在的第三次浪潮。
第三個(gè)浪潮,是把一些技術(shù)、神經(jīng)元網(wǎng)絡(luò)和統(tǒng)計(jì)的方法結(jié)合在一起。最初人們并不知道到底要怎么做,2006年有一篇文章,作者現(xiàn)在是人工智能圈子里的大咖,認(rèn)為現(xiàn)在的神經(jīng)元系統(tǒng)能做到幾千層都沒(méi)有問(wèn)題,有點(diǎn)類(lèi)似BP網(wǎng)絡(luò)。
人們可以認(rèn)為現(xiàn)在是第三次浪潮,但是這三次浪潮的區(qū)分是很籠統(tǒng)的。如果按照技術(shù)分類(lèi)來(lái)講,第二次、第三次其實(shí)是一件事,依然是神經(jīng)元網(wǎng)絡(luò),差別的是深度學(xué)習(xí)的成功。這里既有硬件的進(jìn)步,也有卷積神經(jīng)網(wǎng)絡(luò)模型與參數(shù)訓(xùn)練技巧的進(jìn)步。
它的弱點(diǎn)是整個(gè)網(wǎng)絡(luò)可以做得很深,也很容易去訓(xùn)練,但是訓(xùn)練得出的結(jié)果和人是完全不一樣的。因?yàn)槿四X里面是有非常明確的定義,很容易舉一反三推理,但是神經(jīng)元系統(tǒng)不行。神經(jīng)元網(wǎng)絡(luò)本身實(shí)際它的物理意義沒(méi)有了,怎么樣把神經(jīng)元網(wǎng)絡(luò)和真人的智能概念的理解舉一反三的能力運(yùn)用起來(lái),是它天然的障礙。這個(gè)障礙的解法在哪里,理論上是統(tǒng)計(jì)學(xué)的方法,現(xiàn)在神經(jīng)元網(wǎng)絡(luò)基本上更多的是靠連接來(lái)實(shí)現(xiàn)的這個(gè)功能,但不是靠統(tǒng)計(jì)來(lái)做。人們希望把連接和深層次的統(tǒng)計(jì)結(jié)合在一起,才有可能走出現(xiàn)在的環(huán)境。
目前為止,工程院將深度學(xué)習(xí)、邏輯推理稱(chēng)為AI 1.0,下一步希望從AI 1.0往AI 2.0發(fā)展,克服現(xiàn)在A(yíng)I 1.0的不足,使人工智能更順暢地發(fā)展,大概過(guò)幾個(gè)月就會(huì)在很多層面有一些具體的行為。
關(guān)于車(chē)聯(lián)網(wǎng)和人工智能,之前是在搜索方面有一個(gè)長(zhǎng)足的進(jìn)步,下一個(gè)進(jìn)步是在自動(dòng)駕駛,自動(dòng)駕駛這件事將會(huì)對(duì)今后汽車(chē)產(chǎn)業(yè)有非常大的變革。這種變革需要一個(gè)出發(fā)點(diǎn)。任何一個(gè)東西都是有生態(tài)鏈的,目前整個(gè)系統(tǒng)都是以人為中心的。如果要過(guò)渡到自動(dòng)的操作系統(tǒng)來(lái)駕駛車(chē)的話(huà),人就不再是中心,原來(lái)的駕駛技術(shù)就不需要了。如果人不需要介入,它對(duì)信息獲取的渠道已經(jīng)不是眼睛和耳朵,而是會(huì)有很多的渠道獲取信息。
比如現(xiàn)在我們說(shuō)的雷達(dá),還是在仿照人的眼睛,但如果不是人為中心,我們可以構(gòu)造一個(gè)中心,讓這個(gè)環(huán)境的信息通過(guò)車(chē)聯(lián)網(wǎng)送給汽車(chē),這時(shí)候汽車(chē)的判斷在大多數(shù)情況下就夠了。小部分情況下,車(chē)要有觀(guān)察人,人不能發(fā)信號(hào)。如果汽車(chē)本身在發(fā)信號(hào),你就知道這個(gè)汽車(chē)正在行駛、要變道、信號(hào)燈還有幾秒會(huì)變。當(dāng)這些信息都有的時(shí)候,整個(gè)系統(tǒng)和現(xiàn)在的無(wú)人車(chē)完全不是一個(gè)系統(tǒng)。我想自動(dòng)駕駛、車(chē)聯(lián)網(wǎng)會(huì)對(duì)整個(gè)汽車(chē)行業(yè)有非常大的改革沖擊,這個(gè)沖擊后面離不開(kāi)人工智能,所有東西都需要決策最后完成。非常希望看到未來(lái)AI和車(chē)聯(lián)網(wǎng)結(jié)合。
我就說(shuō)這些,謝謝大家。
聯(lián)系客服