【編者按】6月27—29日,2019年世界智能計算機大會在深圳舉行。在這次大會上,中國工程院院士、中科院計算所首席科學家、中科曙光董事長李國杰以《對智能超級計算機的幾點認識》為題,深入淺出地剖析了智能計算機的歷史、現(xiàn)在和未來。
歷史:超算是超算,智能是智能
“計算機之父”馮·諾依曼曾經(jīng)試圖模仿神經(jīng)網(wǎng)絡(luò)設(shè)計計算機,但并未成功。1946年11月,馮·諾依曼在給“控制論之父”諾伯特·維納的信中寫道:“我們選擇了太陽底下最復(fù)雜的一個對象……向世人展示了一種絕對的且無望的通用性?!?/p>
事實上,從第一臺電子計算機開始,計算機的發(fā)展就與模擬神經(jīng)網(wǎng)絡(luò)分道揚鑣。此后數(shù)字計算的飛速發(fā)展,使得用計算機實現(xiàn)人工智能的方式與人腦的思維機制幾乎不沾邊。
20世紀80年代末至90年代初,在日本第五代計算機項目帶動下,全球掀起一陣“智能計算機熱”。當時的熱點是面向智能語言和知識處理的計算機,研究重點是并行邏輯推理。
日本五代機走的是“定制化路線”。我國“智能計算機”研制走的則是一條比較通用的路線:從芯片、系統(tǒng)到軟件、應(yīng)用,都是“非定制化”。
1990年,國家科委(科技部的前身)批準成立“國家智能計算機研究開發(fā)中心”,不但開展了曙光系列并行計算機的研制,還從事了人工智能的基礎(chǔ)研究和應(yīng)用研究,為今天智能超算的發(fā)展打下了基礎(chǔ)。
錢學森先生曾發(fā)表《關(guān)于“第五代計算機”的問題》提議:“第五代計算機是什么?是第二代巨型計算機。我認為再把這個概念叫做五代計算機或者六代計算機,就不那么合適了……建議為了不要混淆起見,就干脆叫第一代智能機?!?/p>
以此為標志,所謂的第五代計算機就分成了兩個叉:一個是第二代巨型計算機,一個是第一代智能機——這是兩個不同的概念。
事實證明,歷史的發(fā)展與錢老的預(yù)測是相符的,從20世紀80年代以后的30年,計算機的發(fā)展之路確實符合錢學森的預(yù)測,超算是超算,智能是智能。
現(xiàn)在:智能與超算的歷史性會合
超級計算是“算得快”的計算機。但智能計算機和超算不一樣:智能的本意是“算得巧”,而不是“算得快”。這是兩股道上的車。
本世紀以來,深度神經(jīng)網(wǎng)絡(luò)的成功和大數(shù)據(jù)的興起,使得超級計算和計算智能(深度學習)走到一起,出現(xiàn)“歷史性的會合”。
過去高性能計算機主要用于科學計算,現(xiàn)在的高性能計算機已大量用于大數(shù)據(jù)和機器學習。一組數(shù)據(jù)可以說明這一點:2015年,中國HPC在數(shù)據(jù)分析與機器學習領(lǐng)域應(yīng)用只有27%,至2016年達到48%、2017年提升到56%。預(yù)計這個比例今后還將繼續(xù)提高。
但是也應(yīng)該看到,目前大量采用的智能計算實際上是基于GPU或GPU-Like加速器的“準智能計算”。比如,圖像和語音的信號處理計算還是數(shù)值計算。
智能算法可以加速傳統(tǒng)的科學計算。舉例來說,今年4月,200多名科研人員從四大洲8個觀測點“捕獲”了黑洞的視覺證據(jù)。此項研究歷時10余年,加州理工學院曾經(jīng)采用Blue Waters超級計算機進行近900個黑洞合并的模擬,花費了2萬小時的計算時間。后來采用新的機器學習程序和算法,從模擬中學習,幫助創(chuàng)建新的模型,在毫秒內(nèi)就能給出合并結(jié)束狀態(tài)的答案,大大促進了關(guān)于黑洞的研究。
如今,機器學習不僅是人工智能領(lǐng)域研究的重點,也正成為整個計算機科學研究的熱點。
未來:智能超算的十大關(guān)注方向
人類可能會發(fā)明新的智能計算機,但至少最近20年內(nèi),智能超算是要高度重視的研究方向。關(guān)于智能超算的未來研究方向,以下10個方面值得重視。
第一,未來十年是體系結(jié)構(gòu)的黃金時期。近幾十年計算機的飛速發(fā)展一半來自摩爾定律,另一半來自系統(tǒng)結(jié)構(gòu)的改進。摩爾定律即將走到盡頭,計算機未來的改進將主要從結(jié)構(gòu)改進入手。圖靈獎得主、計算機體系結(jié)構(gòu)宗師David Patterson與John Hennessy預(yù)言:“下一個十年將出現(xiàn)一個全新計算機架構(gòu)的‘寒武紀’大爆發(fā)。”
第二,“人腦級能效”將是未來智能計算機的核心特征。大腦以超低功耗實現(xiàn)了超級復(fù)雜的計算,從目前的發(fā)展來看,超級計算機現(xiàn)在的能效還滿足不了需求。“超算能效增長遠遠低于速度增長”,是計算機發(fā)展70年未有之大變局。這給我們提出挑戰(zhàn),未來超級計算機要達到像人腦一樣的能效層次。
第三,要研究具有“低熵”特征的未來架構(gòu)。智能計算機的本事主要體現(xiàn)在對付“不確定性”,而“熵”就是對不確定性的刻畫。要通過全棧的系統(tǒng)設(shè)計應(yīng)對不確定性挑戰(zhàn),在問題不確定、環(huán)境不確定、負載強度不確定的情況下,保障可預(yù)期的性能結(jié)果。
第四,要重視研究領(lǐng)域?qū)S孟到y(tǒng)結(jié)構(gòu)(DSA)以及可重塑處理器。近幾十年通用處理器一直勝過專用處理器,這一局面正在改變。未來大多數(shù)計算將在專用加速器上完成,而通用處理器只是配角。
第五,要重視智能超算的通用性。盡管專用化是趨勢,但作為一個智能中心和超算中心,還是要本著為大眾服務(wù)的目標盡量匹配更多用戶的需求。
第六,模擬計算值得重視。傳感器接收的都是模擬信息,人腦處理的也是模擬量,連續(xù)變量的模擬計算是非圖靈計算。模擬計算是離散數(shù)字計算的前輩,經(jīng)過60年的變遷,模擬計算可能有機會東山再起,連續(xù)變量與離散變量的混合計算將開啟計算新天地。
第七,計算存儲一體化。人類的大腦計算和存儲不是分開的,不需要數(shù)據(jù)搬移,所以未來的計算機體系結(jié)構(gòu)可能要改變傳統(tǒng)的把計算和存儲分開的馮·諾依曼結(jié)構(gòu)。
第八,推理驅(qū)動與數(shù)據(jù)驅(qū)動可能會交替發(fā)展。目前的智能應(yīng)用,主要是數(shù)據(jù)驅(qū)動。人工神經(jīng)網(wǎng)絡(luò)屬于開普勒研究模式,而人工智能研究中的推理驅(qū)動則是繼承牛頓的演繹推理模式。1956年的“達特茅斯會議”預(yù)設(shè)了實現(xiàn)人工智能要走牛頓模式:先精確描述智能。但數(shù)據(jù)驅(qū)動如何轉(zhuǎn)到推理驅(qū)動需要認真探索。
第九,要重視事件驅(qū)動計算。未來人工神經(jīng)網(wǎng)絡(luò)應(yīng)考慮“時間”因素,基于事件的信息流(事件驅(qū)動計算)可直接反映人腦工作的自然模式,這是一種新的“空間—時間模式”。
第十,要建立智能超算新的測試基準。長期以來,評測超級計算機的性能都采用Linpack測試程序。它可以測出幾乎滿負荷、滿功耗下的計算機浮點計算性能,是測試超級計算機可靠性和穩(wěn)定性的理想程序。但是,由于功耗的限制,當前發(fā)展通用超級計算機已遇到極大的困難,領(lǐng)域?qū)S贸売嬎銠C成為熱門研究方向,Linpack顯然不適合作為領(lǐng)域?qū)S糜嬎銠C的測試標準。
建立統(tǒng)一的基準評價標準,有助于行業(yè)內(nèi)的良性競爭。希望從過去的超算到大數(shù)據(jù)和人工智能有一套新的標準,有一把尺子衡量技術(shù),將影響力從學術(shù)界延伸至產(chǎn)業(yè)界。
來源:中國科學報
聯(lián)系客服