1新智元報道
【新智元導(dǎo)讀】GTC CHINA上,黃仁勛展示了英偉達強大的生態(tài)系統(tǒng)建構(gòu)能力,在圍繞GPU為中心的計算生態(tài)中:BAT已在云服務(wù)中使用GPU,華為、浪潮和聯(lián)想也都使用GPU服務(wù)器,此外還有海康威視、科大訊飛和京東也都在積極使用GPU產(chǎn)品。GPU的計算帝國已然呈現(xiàn)。另外,黃仁勛在北京現(xiàn)場重磅發(fā)布了可編程的AI 推理加速器TensorRT 3,從功能上看與TPU有眾多相似之處。演講中,黃仁勛特別提到了自動駕駛和自主機器,這將是英偉達接下來發(fā)力的重點。
2017年9月26日,北京,英偉達GPU技術(shù)峰會GTC CHINA 開幕。英偉達創(chuàng)始人兼CEO黃仁勛發(fā)表主旨演講。
“Welcome Beijing!”黃仁勛揮著手激動上臺,然后直奔主題。
首先,黃仁勛講了兩股力量推動計算領(lǐng)域發(fā)生改變。第一次是摩爾定律的結(jié)束,加快、加深管道,讓CPU設(shè)計者在片上放下越來越多的晶體管。但是,現(xiàn)在這樣做越來越來。45%,CPU性能卻只以10%的速度增長。
另一方面,新的計算模型,也即深度學(xué)習(xí),以暴風(fēng)般的速度和大數(shù)據(jù)一起席卷而來。
深度學(xué)習(xí)研究者發(fā)現(xiàn)了GPU的力量,
一方面發(fā)現(xiàn)新的計算模型,持續(xù)提升性能。每一代都能夠?qū)⒏嗑w管的數(shù)量轉(zhuǎn)換為計算力。讓有一個月的計算縮減為一天。
GPU的崛起,單從GTC的參會人數(shù)就能看出來。在短短5年間,GTC的參會人數(shù)就堪比大型會議,今年有22,000人參會。
黃仁勛在演講中提到,摩爾定律已經(jīng)是昨天的定律,是一種緩慢的定律,我們現(xiàn)在處于超級摩爾定律時代。
在展示了GPU的獨特性能和為深度學(xué)習(xí)而生的歷史使命之后,黃仁勛展示了英偉達更加強大的一面——生態(tài)系統(tǒng)。圍繞著英偉達而生的GPU帝國似乎已經(jīng)成型,他在現(xiàn)場宣布,中的阿里巴巴、百度和騰訊都已經(jīng)在云服務(wù)中使用GPU,另外華為、浪潮和聯(lián)想也都采用GPU服務(wù)器。
另外,他還介紹了面向全球開發(fā)人員的NVIDIA.AI。英偉達將會全力推進“統(tǒng)一架構(gòu)” CUDA GPU計算。通過Inception計劃,支持1900家初創(chuàng)企業(yè)。
從CUDA開始,英偉達其實一直做得最出色的便是打造生態(tài)系統(tǒng)的能力,在GPU性能不斷受到關(guān)注的今天,有人指出,英偉達的技術(shù)也許不是最強的,但是他們打造生態(tài)系統(tǒng)的能力和決心絕對不容忽視。未來,GPU帝國終會成型。
關(guān)于英偉達在中國打造的計算新紀(jì)元,下面這張圖是很好的說明:
在本次大會上,黃仁勛發(fā)布了本次發(fā)布會英偉達最重要的一個產(chǎn)品NVIDIA TENSORRT3——中是一款可編程的AI 推理加速器。支持所有的框架,比如Caffe,Pytorch和TensorFlow。
正是因為具備相對良好的編程環(huán)境,GPU成為目前最主流的深度學(xué)習(xí)硬件。英偉達公司發(fā)布的CUDA運算平臺,是專門針對開發(fā)者提供的一種并行計算平臺。開發(fā)者能通過CUDA平臺使用軟件語言很方便得開發(fā)英偉達GPU實現(xiàn)運算加速。由于CUDA平臺之前被廣泛認(rèn)可和普及,積累了良好的編程環(huán)境,目前應(yīng)用在人工智能領(lǐng)域、可進行通用計算的GPU市場基本被英偉達壟斷。
現(xiàn)在,英偉達推出加速推理的TensorRT 3,可編程,支持所有框架,所有機器,可以想見,又會擴大另一大片市場。
從黃仁勛現(xiàn)場的介紹來看,TensorRT 3主要的功能是推理和加速,這與谷歌的TPU功能類似。
黃仁勛在現(xiàn)場說,神經(jīng)網(wǎng)絡(luò)的響應(yīng)時間或處理延時會對服務(wù)質(zhì)量造成直接影響。運行在V100上的TensorRT在處理頭像時刻實現(xiàn)7ms的延時,在處理語音時延時報道200ms,這是標(biāo)準(zhǔn)云服務(wù)的理想目標(biāo)。單靠CPU是無法實現(xiàn)的。上圖,藍色是CPU運行TensorFlow。
接下來黃仁勛介紹了AI 推理在數(shù)據(jù)中心的應(yīng)用,最主要的是是降低成本,在這里依然是與CPU直接作比較,他說,V100相較CPU加速了40倍。
提到省錢,黃仁勛說:“你買越多的GPU,你節(jié)省的錢就越多?!?/span>
原來,4個機架,160CPU,65KW
現(xiàn)在,1個機架就行了,節(jié)省50萬美元
黃仁勛來來回回將4個機架和1個機架的圖像進行對比,他說自己可以玩上一整天?!案俚目臻g,更少的碳足跡,節(jié)省更多錢!”
How exciting is that!
Demo 圖像處理和聲音處理
為了展示TensorTR 3的性能,臺上做了挺多展示。其中有《權(quán)力的游戲》的展示,用語音搜索“冬天來了”,首先轉(zhuǎn)換成文字,然后直接跳到那一幀。語音到文字的轉(zhuǎn)換,龐大的視頻數(shù)據(jù),幾乎沒有延遲,達到可以商用的程度。
黃仁勛說,有了TensorTR 3,將來我們不需要龐大的數(shù)據(jù)中心,更多樣的應(yīng)用,“節(jié)省更多的錢”!
然后他宣布,中國AI五巨頭——阿里巴巴、騰訊、百度、京東、訊飛,都已經(jīng)采用了英偉達的推理平臺。
不僅如此,英偉達還與??低暵?lián)手,利用TensorRT,發(fā)布端到端的智能視頻解決方案,目標(biāo)是直接從視頻中尋找答案。
??低暤暮献鲗儆谥腔鄢鞘校ˋI CITY)的議題。在這方面,英偉達與大華、華為和阿里巴巴也有合作。
所有這些,都是希望用一個推理平臺,解決不同類型的數(shù)據(jù)和應(yīng)用案例的問題。
黃仁勛展示了圖中是英偉達與空客正在實際進行的項目。分為三部分,車架、車廂和自動飛行的機翼——將來,你能自動駕駛到一個地方,然后讓機翼來接你,自動飛行到另一個地點。
英偉達的自動駕駛平臺,支持L3、L4、L5。
感知(用雷達、激光雷達和其他傳感器感知周圍環(huán)境),推理(定位),規(guī)劃(比如如何行車變換軌道)是自動駕駛?cè)蠛诵囊?,會議現(xiàn)場展示了英偉達自動駕駛平臺的效果。
145家初創(chuàng)公司基于NV Drive開發(fā)自動駕駛平臺,包括Pony.ai、圖森和景馳等。
黃仁勛說,自動駕駛汽車的根本的目標(biāo)是“避免碰撞”,因此即使起影響巨大,但技術(shù)上卻是自動機器當(dāng)中最簡單、最容易實現(xiàn)的。
黃仁勛說,下一個AI時代,是AI離開云端,走入與人類交互的機器中來。
接著,黃仁勛發(fā)布了全球首款自主機器處理器 Xavier,將在2018年第四季度推出。
Xavier實時運行并行算法,推理周圍世界,最后進行規(guī)劃。這是世界上最復(fù)雜的SoC——將超級計算機變?yōu)橐粡埿酒?/span>
黃仁勛介紹,這款芯片是世界第一,英偉達幾年前開始做這個項目,代號Project Xavier。
接著,他宣布京東X與英偉達合作,使用Xavier芯片,實現(xiàn)自主機器。
還沒有完!
英偉達還發(fā)布了一個能夠?qū)崟r訓(xùn)練機器人的模擬環(huán)境 Isaac Lab。Nvidia虛擬現(xiàn)實模擬器實驗室來構(gòu)建機器人 isac lab 演示了如何玩曲棍球和高爾夫。
Tesla V100 GPU、可編程推理平臺TensorRT 3,自動駕駛平臺、自助機器超級Soc Xviare,還有虛擬機器人訓(xùn)練環(huán)境,可以說,英偉達的AI布局全線鋪開,沒有放過任何一塊。
除了深度學(xué)習(xí),黃仁勛在這次GTC上還頻頻提到遷移學(xué)習(xí)、VR。其中,最顯眼的無疑是TensorRT 3。推理是一個巨大的市場,潛力無限,而英偉達已經(jīng)用TensorRT 3搶占先機,并且已經(jīng)占據(jù)了中國AI五巨頭。
聯(lián)系客服