盡管到了收獲的季節(jié),盡管中國(guó)AI產(chǎn)業(yè)的發(fā)展速度舉世矚目,但是我們?nèi)匀幻鎸?duì)AI基礎(chǔ)設(shè)施建設(shè)不足,以及AI創(chuàng)業(yè)公司難以做大做強(qiáng)的問題。對(duì)于這些問題,李國(guó)杰院士有以下思考:
(根據(jù)李國(guó)杰院士演講速記做了遵照原意的部分修改)
話題一:大數(shù)據(jù)、AI融入各產(chǎn)業(yè)將推動(dòng)經(jīng)濟(jì)邁入新的繁榮期
現(xiàn)在是人工智能2.0時(shí)代,過去二十年算一代。但是,國(guó)際上通用的說法是人工智能已經(jīng)經(jīng)過了兩波的發(fā)展。第一波是上個(gè)世紀(jì)50年代-80年代,是做編寫知識(shí)搞邏輯推理為主。第二波是從80年代開始,以統(tǒng)計(jì)學(xué)習(xí)、概率推理為主,也就是人工神經(jīng)網(wǎng)絡(luò)為主,這里面的感知和學(xué)習(xí)能力比較強(qiáng),但是抽象的能力比較弱,推理的能力也比較弱。從2010年開始做的是第三波,從2就是加強(qiáng)抽象的能力和推理能力,保持感知和學(xué)習(xí)能力,對(duì)環(huán)境有著更強(qiáng)的自適應(yīng)性,與過去六十年相比,更加通用化,在各個(gè)行業(yè)里面引領(lǐng)著經(jīng)濟(jì)下一波大的浪潮。
我自己畫了一個(gè)示意圖,經(jīng)濟(jì)發(fā)展變化是有周期性的,比如從二戰(zhàn)以后進(jìn)入到第四波,就是以電子計(jì)算機(jī)、石化為主驅(qū)動(dòng)的發(fā)展;到了第五波就進(jìn)入了互聯(lián)網(wǎng),九十年代開始,移動(dòng)通信,軟件驅(qū)動(dòng)經(jīng)濟(jì)發(fā)展。
大家注意,從九十年代開始那波到2008年金融危機(jī)的時(shí)候,經(jīng)濟(jì)形勢(shì)已經(jīng)開始走下坡路了,現(xiàn)在是經(jīng)濟(jì)的低潮期,整個(gè)增速是在2%左右,發(fā)展中國(guó)家也是平均5%左右。所以,過去十年正好是經(jīng)濟(jì)低潮的時(shí)候,也是研究最活躍的時(shí)間,所以今后的二十年,正好是人工智能技術(shù)基本創(chuàng)新爆發(fā)期,在今后的一、二十年會(huì)產(chǎn)生觸發(fā)2030年開始的第六波的繁榮期。
這里得出什么結(jié)論呢?在未來10-15年,對(duì)經(jīng)濟(jì)貢獻(xiàn)最大的可能不是大數(shù)據(jù)和人工智能的新技術(shù),而是信息技術(shù)包括大數(shù)據(jù)和人工智能融入各個(gè)產(chǎn)業(yè)的新產(chǎn)品,提供個(gè)性化產(chǎn)品和服務(wù)的新業(yè)態(tài),產(chǎn)業(yè)跨接融合的新模式,這些創(chuàng)新主要是和已知技術(shù)的新組合。任何新技術(shù)的推廣需要10-20年的時(shí)間。在經(jīng)濟(jì)衰退的復(fù)蘇期要特別重視基礎(chǔ)性技術(shù)的發(fā)明,未來10-15年應(yīng)力爭(zhēng)在大數(shù)據(jù)和人工智能領(lǐng)域做出像電子計(jì)算機(jī)、集成電路、互聯(lián)網(wǎng)一樣的重大發(fā)明,但是重大發(fā)明是自己冒出來的,不是規(guī)劃出來的。
歷史上重大基礎(chǔ)發(fā)明都是經(jīng)過較長(zhǎng)時(shí)間的技術(shù)改進(jìn)和擴(kuò)散之后才產(chǎn)生巨大經(jīng)濟(jì)效益,人工智能也不應(yīng)例外。很多公司都預(yù)測(cè),從2016年到2025年的10年內(nèi),關(guān)注汽車、消費(fèi)品、電力、物流等行業(yè)的數(shù)字化轉(zhuǎn)型有望帶來100萬(wàn)億美金。
話題二:人工智能和大數(shù)據(jù)基本是一回事 要重視AI的剛性需求
大家流行的說法,是人工智能=A B C。我個(gè)人的看法,人工智能和大數(shù)據(jù)基本一回事,A B C D E。A是算法,B是基本理論和基礎(chǔ)設(shè)施,C是計(jì)算能力,D是領(lǐng)域知識(shí),E是生態(tài)環(huán)境。
發(fā)展人工智能和大數(shù)據(jù)要重視大眾的剛性需求,2011年我跟徐志偉寫了一篇文章在CACM上發(fā)表了,與“Computing for the Masses”的追求一樣,我們要努力實(shí)現(xiàn)“Big Data for Masses,AI for the Masses”,不能只關(guān)注高端消費(fèi)人群。發(fā)展大數(shù)據(jù)與人工智能要重視大眾的剛性需求(如健康、出行、安全等)。要滿足大眾剛性需求要有基礎(chǔ)設(shè)施,過去工業(yè)化時(shí)代就是所謂 “鐵公機(jī)”,鐵路、公路、機(jī)場(chǎng)。信息時(shí)代的基礎(chǔ)設(shè)施是互聯(lián)網(wǎng)、云計(jì)算中心。到了智能化階段的基礎(chǔ)設(shè)施是大數(shù)據(jù)中心、機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái)等。大數(shù)據(jù)的存儲(chǔ)分析和機(jī)器學(xué)習(xí)能力已成為新的基礎(chǔ)設(shè)施需求,計(jì)算機(jī)能力的高低將決定人工智能產(chǎn)業(yè)和智能服務(wù)的水平。
話題三:公用的大數(shù)據(jù)分析平臺(tái)和機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái)
目前,網(wǎng)絡(luò)服務(wù)的龍頭企業(yè)(BAT、滴滴打車等)都有自己的大數(shù)據(jù)平臺(tái),但智能軟件和服務(wù)行業(yè)每個(gè)中小型創(chuàng)業(yè)公司都建立自己的機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái),既無必要也不可能。各地雙創(chuàng)園區(qū)要建立共享的大數(shù)據(jù)分析平臺(tái)和機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái),這是新時(shí)代的重要基礎(chǔ)設(shè)施。
我國(guó)一半以上的HPC用于大數(shù)據(jù)和AI,過去HPC主要用于科學(xué)計(jì)算,現(xiàn)在HPC主要用于大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。2015年,鐘一HPC在數(shù)據(jù)分析與機(jī)器學(xué)習(xí)領(lǐng)域的應(yīng)用只有27%,2016年達(dá)到了48%,今年有進(jìn)一步提升。另外每個(gè)行業(yè)都需要AI,每個(gè)行業(yè)分別做是很累人的,有些東西是又有區(qū)別又有共性,我的想法是將來要有生產(chǎn)每個(gè)行業(yè)的AI引擎生產(chǎn)線,前面有公共的東西做局部化調(diào)整,有局部的參數(shù)調(diào)整,調(diào)完了以后出一個(gè)行業(yè)的AI引進(jìn)來。
話題四:擺脫人工智能創(chuàng)業(yè)公司被收購(gòu)的命運(yùn)
人工智能創(chuàng)業(yè)公司只有兩個(gè)命運(yùn):一個(gè)是被大公司收購(gòu),一個(gè)是倒閉。即使像科大訊飛這樣的大企業(yè),科大訊飛市值約700億元,凈利潤(rùn)不到1.7億元,市盈率已經(jīng)超過300倍,所以如何提高凈利潤(rùn)是AI公司的一大困擾。
人工智能企業(yè)史說明,算法固然很重要,但是光有算法決定不了公司的命運(yùn)。AI公司要在賣產(chǎn)品、授權(quán)、廣告、服務(wù)模式中找到新的賺錢末路,或者另外開辟技術(shù)變成錢的商業(yè)模式。AI公司要做大做強(qiáng),不但要有一技之長(zhǎng),而且要有自己的平臺(tái)和特有的數(shù)據(jù),軟件和硬件都要有過人的實(shí)力。
現(xiàn)在的問題,我國(guó)人工智能應(yīng)用技術(shù)與國(guó)外差距不大,有些應(yīng)用領(lǐng)域已經(jīng)超過美國(guó)。但是基礎(chǔ)軟硬件與國(guó)外還有較大差距。在全球企業(yè)2000強(qiáng)名單中,美國(guó)有14家芯片公司和14家軟件公司,中國(guó)尚未沒有一家,我講的是以軟件作為主要產(chǎn)業(yè)的公司。全球集成電路企業(yè)前20名沒有一家中國(guó)企業(yè)。我國(guó)集成電路與國(guó)外仍有兩代差距。
話題五:發(fā)展AI要打造完整的生態(tài)系統(tǒng)
所以人工智能產(chǎn)業(yè)要像一棵大樹,必須扎根在系統(tǒng)結(jié)構(gòu)和軟件理論的深土中,發(fā)展人工智能不能停留在算法層面,要關(guān)注從算法、軟件、人機(jī)截面到系統(tǒng)結(jié)構(gòu)和芯片這一完整的產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)。
發(fā)展人工智能和大數(shù)據(jù),還是要特別重視基礎(chǔ)的東西。中國(guó)人很重“名”,“名不正則言不順”,信息領(lǐng)域不斷創(chuàng)造新名詞,一旦新名詞(新學(xué)科)上升為國(guó)家意志,原來的基礎(chǔ)學(xué)科就被邊緣化,現(xiàn)在以“系統(tǒng)結(jié)構(gòu)”和“基礎(chǔ)軟件”申請(qǐng)國(guó)家項(xiàng)目,已經(jīng)很難拿到經(jīng)費(fèi)。去年國(guó)家自然科學(xué)基金計(jì)算機(jī)學(xué)科的4863項(xiàng)申請(qǐng)項(xiàng)目中,計(jì)算機(jī)科學(xué)的基礎(chǔ)理論只有16項(xiàng),計(jì)算機(jī)體系結(jié)構(gòu)22項(xiàng),程序設(shè)計(jì)語(yǔ)言及支撐環(huán)境13項(xiàng),高速數(shù)據(jù)傳輸技術(shù)2項(xiàng)。但是,計(jì)算機(jī)圖像與視頻處理有439項(xiàng),模式識(shí)別理論及應(yīng)用357項(xiàng),人工智能應(yīng)用258項(xiàng),這是巨大的反差。沒有基礎(chǔ)的話,將來還是難以扳回局面。
話題六:人工智能本質(zhì)還是計(jì)算機(jī)科學(xué)
什么是人工智能?人工智能從科學(xué)上講,它是計(jì)算機(jī)科學(xué)的前沿研究,從應(yīng)用來講,它是計(jì)算機(jī)技術(shù)的的非平凡應(yīng)用。人工智能本就是計(jì)算機(jī)技術(shù),現(xiàn)在很多人講人工智能是新的科學(xué),內(nèi)容涉及腦科學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、社會(huì)科學(xué)等。但是迄今為止,腦科學(xué)(神經(jīng)科學(xué))對(duì)人工智能的貢獻(xiàn)很小,統(tǒng)計(jì)學(xué)對(duì)推動(dòng)機(jī)器學(xué)習(xí)的崛起起了較大作用,但是沒有人把人工智能看成統(tǒng)計(jì)學(xué)的分支。
所以目前來講,人工智能本質(zhì)上是計(jì)算機(jī)學(xué)科的一個(gè)分支,。所以智能化的前提是計(jì)算機(jī)化,目前不存在脫離計(jì)算機(jī)的人工智能。所以說,沒有計(jì)算就沒有智能。
有人說信息化時(shí)代已經(jīng)過去了,現(xiàn)在是智能化的時(shí)代,這恐怕不夠全面,智能時(shí)代不是后信息時(shí)代,真正的后信息時(shí)代可能是生物時(shí)代。與其過分強(qiáng)調(diào)智能與數(shù)字化、網(wǎng)絡(luò)化的區(qū)別,不如多強(qiáng)調(diào)智能化與信息化的聯(lián)系,數(shù)字化和網(wǎng)絡(luò)化沒有做好,智能化就是空話。
我們吸取歷史上的教訓(xùn),既要重視智能應(yīng)用的特殊要求,但是也不能忽視通用的計(jì)算機(jī)主流技術(shù)的巨大包容能力。
話題七:產(chǎn)學(xué)研的結(jié)合
中科曙光公司與人工智能的淵源已久,曙光公司是國(guó)家智能計(jì)算機(jī)研究開發(fā)中心創(chuàng)辦的企業(yè),是國(guó)家863計(jì)劃智能計(jì)算機(jī)主題長(zhǎng)期支持下成長(zhǎng)起來的高技術(shù)公司,智能應(yīng)用一直是國(guó)家智能計(jì)算機(jī)研究開發(fā)中心和曙光公司關(guān)注的重點(diǎn)之一。
上世紀(jì)九十年代在建立了國(guó)家智能計(jì)算機(jī)研究開發(fā)中心的中國(guó)科大分中心,專門從事語(yǔ)音識(shí)別/合成的評(píng)測(cè),后來這個(gè)中心孵化出科大訊飛公司。
中科曙光和現(xiàn)在比較熱門的芯片公司寒武紀(jì)是同根生的兄弟公司,寒武紀(jì)研究芯片不但用在華為的手機(jī)上,也用在了曙光服務(wù)器上。(即此次發(fā)布的“全球首款基于寒武紀(jì)芯片的AI推理專用服務(wù)器”。)
我們要特別注重知識(shí)的融合,錢老(編輯注:錢學(xué)森)說過“必集大成,才能得智慧”,人工智能是對(duì)付復(fù)雜性的科學(xué),發(fā)展人工智能不能追求“另立山頭,分道揚(yáng)鑣”,要跟其它學(xué)科密切融合。
如何看待領(lǐng)域知識(shí)呢?10月19日,谷歌DeepMind團(tuán)隊(duì)新成果,名為阿爾法元的機(jī)器完全靠增強(qiáng)型自我學(xué)習(xí),訓(xùn)練3天就戰(zhàn)勝了阿爾法狗,比分100:0。這表明在某些領(lǐng)域,AI不再需要人類知識(shí)。過去我們相信知識(shí)就是力量,現(xiàn)在有些領(lǐng)域數(shù)據(jù)和機(jī)器學(xué)習(xí)比知識(shí)和人類經(jīng)驗(yàn)更有力量。
最后引用一段話,是美國(guó)曼哈頓負(fù)責(zé)人澳本海默在二戰(zhàn)勝利以后說的一段話“我們得到了一棵碩果累累的大樹,并拼命地?fù)u晃,結(jié)果得到了雷達(dá)和原子彈……其全部精神實(shí)質(zhì)在于對(duì)已知的瘋狂而粗暴掠奪,而毫無對(duì)未知的認(rèn)真而謙恭地探索”。
人工智能已經(jīng)六十年了,我們是拼命搖晃這棵大樹不變,還是懷抱對(duì)未知的認(rèn)真和謙恭,自己新種幾棵樹苗?深度學(xué)習(xí)為什么這么有效,沒有人講得清楚。最近以色列科學(xué)家提出“信息瓶頸”理論,發(fā)現(xiàn)深度學(xué)習(xí)與量子物理的相似之處。
人工智能與大數(shù)據(jù)任重而道遠(yuǎn),最后以一首詩(shī)結(jié)束這次報(bào)告:
莫言下嶺便無難,
賺得行人空歡喜。
正入萬(wàn)山圈子里,
一山放過一山攔。
——宋·楊萬(wàn)里《過松原晨炊漆公店》
以下是專訪問答
雷克世界:您特別強(qiáng)調(diào)了AI基礎(chǔ)設(shè)施建設(shè),但是如何去做好AI基礎(chǔ)設(shè)施呢?和芯片還是有所不一樣,AI時(shí)代系統(tǒng)研究需要和應(yīng)用場(chǎng)景結(jié)合,可能是很難僅僅在象牙塔就能里面完成的,您怎么認(rèn)為呢?
李國(guó)杰院士:人工智能在早年我讀書的時(shí)候,流行的觀點(diǎn)就是要做一些跟現(xiàn)在主流的計(jì)算機(jī)不一樣的、所謂的智能的計(jì)算機(jī)。當(dāng)時(shí)有一種觀點(diǎn),人都是用自然語(yǔ)言對(duì)話,我們編的程序不是自然語(yǔ)言,是面向機(jī)器的,面向機(jī)器的這些語(yǔ)言效率高,但不方便,編程不好編,他們想將來編程用自然語(yǔ)言編,人怎么想的就像寫作文一樣編,這很簡(jiǎn)單,想的挺好,這就是智能計(jì)算機(jī)的方向。
但是想是一回事,實(shí)際發(fā)展是另外一回事,后來八十年代后期的時(shí)候,芯片出來了,芯片走的這條路恰好相反,是從底層做起,做芯片、集成電路等就一統(tǒng)天下了,所以是從芯片領(lǐng)域從底往上發(fā)展。
再回頭看,并不是我們這代人,比我們?cè)绲倪@批人,他們做計(jì)算機(jī)也是想模仿人的智能來做,上世紀(jì)五十年代也是假定人的思維可以精確的描述,用人工的方法做出來,但是后來馮·諾依曼發(fā)現(xiàn)模仿人腦做計(jì)算機(jī),這是太陽(yáng)底下最復(fù)雜的事情,所以就改了,從第一臺(tái)計(jì)算機(jī)做起,就和模仿人的智能和人腦思維的做法分道揚(yáng)鑣了。
后來的60年下來,都是靠二進(jìn)制等做法,和人腦沒有關(guān)系,計(jì)算機(jī)發(fā)展的非常快,包括現(xiàn)在做的語(yǔ)音、圖像識(shí)別,最重要的是識(shí)別快,芯片厲害了,我們統(tǒng)計(jì)過,我們現(xiàn)在做一款計(jì)算機(jī)芯片100多億的晶體管,一分錢可以買到1千個(gè)晶體管,比沙子還便宜,這么強(qiáng)大的能力,所以這套東西在計(jì)算機(jī)里面就有一個(gè)主流的技術(shù),這個(gè)主流技術(shù)不要的話,搞另外一套人工智能的辦法,要特別小心這個(gè)事情,不要輕易的談我不用這些方法完全搞一套新的東西,這個(gè)難度是極大的。
話說回來,人工智能和原來的技術(shù)處理是不是一樣的?其實(shí)也不是一樣的,人工智能里面有很多是動(dòng)態(tài)的,是一些非確定的,和原來固定的東西不一樣,原來是算法,和算法是固定的,人工智能的環(huán)境都是在變的,將來應(yīng)對(duì)的負(fù)載是不一樣的,我們現(xiàn)在遇到的問題,人工智能里面的一些很稀疏的圖和原來做矩陣是不一樣的,我們要考慮它的特殊性,這里面有一個(gè)難題,要做所謂的加速芯片,做的很特殊,就是你的市場(chǎng)是很窄的小市場(chǎng)。
而寒武紀(jì)他們的目標(biāo)并不僅僅是做一個(gè)加速某一個(gè)應(yīng)用的芯片,它是想做一個(gè)針對(duì)很多人工智能的比較普及的、比較通用的芯片,想做寒武紀(jì)的系統(tǒng),和x86系統(tǒng)一樣,他們也是想搞一套指令系統(tǒng)做的比較大的、比較廣的人工智能,這是一個(gè)方向,但是能不能做得到,這還有一個(gè)過程,還有一段的路要走,就是芯片的設(shè)計(jì)等都要從專用的體系變成通用的體系。
雷克世界:您在演講中提到人工智能的發(fā)展要注重剛性的需求,這有沒有輕重緩急?您認(rèn)為剛性需求主要是哪些方面?
李國(guó)杰:有一些人工智能是吸引眼球的需求,大家一樂就結(jié)束了。剛性需求比如涉及到人的健康、安全,都是剛性的,人工智能不完全把一個(gè)事情做的很快、效率高,更多的是帶來很多方便,早GDP里面不一定那么容易反映出來,因?yàn)檫@是老百姓所需要的。我覺得現(xiàn)在關(guān)心殘疾人、關(guān)心老人,這些弱勢(shì)群體都是屬于剛性需求。如果我們所有的努力都朝著高收入人群去做,必然導(dǎo)致兩極分化,政府應(yīng)該在這方面做一些導(dǎo)向。
雷克世界:您提到很多的人工智能的中國(guó)企業(yè)可能面臨的結(jié)局就是被收購(gòu)或者是倒閉的命運(yùn),為什么會(huì)這樣,技術(shù)公司如何成功的商業(yè)化?
李國(guó)杰:將來,是會(huì)出來一些像現(xiàn)在的BAT一樣的人工智能龍頭企業(yè),獨(dú)角獸企業(yè)是會(huì)逐步成長(zhǎng)的。但每個(gè)企業(yè)不是光靠一個(gè)算法就可以長(zhǎng)命百歲,無非開始是賣產(chǎn)品,后來是像微軟這樣賣版權(quán),后來賣服務(wù),都能找到掙錢的辦法,人工智能這些企業(yè)也要找到它靠什么掙錢,羊毛出在羊身上,但是也要找到這個(gè)羊,比如做廣告是別人嘗試過的,所以人工智能也要在這方面動(dòng)腦筋,錢、現(xiàn)金流從哪來?
人工智能公司里還是以搞技術(shù)的人為主,未必能擔(dān)當(dāng)真正的企業(yè)家角色,需要真正有市場(chǎng)經(jīng)驗(yàn)的人,幫助人工智能企業(yè)成長(zhǎng),這還是一個(gè)難題。
當(dāng)然,人工智能肯定還會(huì)冒出很多新技術(shù),任何新技術(shù),尤其是比較重要的技術(shù)都會(huì)產(chǎn)生很大的市場(chǎng),需要時(shí)間慢慢的成長(zhǎng),不是冒一個(gè)新技術(shù)馬上就能變成幾百億的市場(chǎng),這不太可能的。
我們看到國(guó)外的統(tǒng)計(jì)材料,一個(gè)新的技術(shù)出來轉(zhuǎn)化成十億的市場(chǎng)要二十年,變成一百億的市場(chǎng)可能要三四十年。所以現(xiàn)在看起來,真正變成市場(chǎng)的技術(shù),可能不是這幾年變出來的,肯定在應(yīng)有的技術(shù)方面能創(chuàng)新商業(yè)模式。人工智能公司要在這方面動(dòng)腦筋,不光是技術(shù)上有新的發(fā)明,在商業(yè)模式上還要有新的創(chuàng)新,結(jié)合起來才可以把新的技術(shù)用好。
聯(lián)系客服