| 時間:2023年03月23日 10:54:05 中財網(wǎng) | |
全球AI行業(yè)計算技術盛會如期而至。當?shù)貢r間周二,在英偉達2023年春季GTC大會上,該公司CEO黃仁勛穿著標志性皮夾克,向開發(fā)者披露最新的硬件和AI應用軟件進展。
簡而言之,本次演講具有其“亮點”、“重點”和多個“看點”。其中“亮點”是英偉達秘密研發(fā)并向芯片制造業(yè)甩出的一枚技術“核彈”——光刻計算庫cuLitho,可以用500套DGX H100,取代4萬個用來驅動計算光刻的CPU服務器?!爸攸c”是圍繞生成式AI發(fā)布的系列加速模型訓練和推理軟硬件產(chǎn)品及服務,而“看點”則是展示針對量子計算、云服務、元宇宙、汽車等領域的新進展。
值得注意,為了出口至中國市場,英偉達基于旗艦芯片H100開發(fā)出了H800芯片,并稱800系列產(chǎn)品完全符合出口管制法規(guī),而且已被多家國內(nèi)科技企業(yè)采用。但業(yè)內(nèi)人士指出,H800的數(shù)據(jù)傳輸速率已被降低到旗艦H100速率的一半左右。
計算光刻提速40倍 獲半導體巨頭力挺
在黃仁勛本次主題演講中,最大的亮點莫過于英偉達秘密研發(fā)四年、向業(yè)界甩出的一枚技術“核彈”——通過突破性的光刻計算庫cuLitho,將計算光刻加速40倍以上??梢哉f,計算光刻是提高光刻分辨率、推動芯片制造達到尖端工藝的關鍵手段。
據(jù)了解,作為芯片制造過程中最復雜、昂貴、關鍵的環(huán)節(jié)之一,光刻成本約占硅片加工成本的1/3以上。配合光刻計算EDA工具使用,其可以幫助晶圓廠縮短原型周期時間、提高產(chǎn)量,為2nm及以上先進工藝奠定基礎,并使得曲線掩模、High NA EUV、亞原子級光刻膠模型等新技術節(jié)點所需的新型解決方案和
創(chuàng)新技術成為可能。
“計算光刻是芯片設計和制造領域中最大的計算工作負載,每年消耗數(shù)百億CPU小時。”黃仁勛稱,“大型數(shù)據(jù)中心24x7全天候運行,以便創(chuàng)建用于光刻系統(tǒng)的掩膜板。這些數(shù)據(jù)中心是芯片制造商每年投資近2000億美元資本支出的一部分?!?br>
另據(jù)其介紹,英偉達H100 GPU需要89塊掩膜板,在CPU上運行時處理單個掩膜板需要兩周時間,而在GPU上運行cuLitho只需8小時。通過這項應用,臺積電可以把4萬個用來驅動計算光刻的CPU服務器,換成500套DGX H100,能耗將從35兆瓦降至5兆瓦。此外,使用cuLitho的晶圓廠,每天可以生產(chǎn)3-5倍多的光掩膜,僅使用當前配置電力的1/9。
實際上,在計算光刻庫研發(fā)過程中,英偉達已經(jīng)與三家全球頂頂尖芯片廠商開展了長達4年的合作,包括晶圓制造巨頭臺積電、光刻機制造商ASML,以及EDA巨頭新思科技。目前,這三家廠商均已開始將cuLitho技術引入芯片設計和制造流程。
對于這一“四年磨一劍”的技術,臺積電CEO魏哲家表示,cuLitho為臺積電在芯片制造中廣泛地部署光刻解決方案開辟了新的可能性;阿斯麥CEO彼得·溫寧克(Peter Wennink)稱ASML計劃將對GPU的支持集成到其所有的計算光刻軟件產(chǎn)品中;新思科技則表示,在cuLitho平臺上運行公司的光學鄰近校正(OPC)軟件將性能從幾周加速到幾天。
發(fā)布ChatGPT專用GPU可提速達10倍 本次GTC開發(fā)者大會上另一大重點,無疑是當前大熱的生成式AI。在演講中,英偉達發(fā)布了一系列相關加速模型訓練和推理的軟硬件新品及服務。訓練方面,英偉達H100 GPU基于Hopper架構及其內(nèi)置Transformer Engine,針對生成式AI、大型語言模型和推薦系統(tǒng)的開發(fā)、訓練和部署進行了優(yōu)化。
在DGX AI基建領域,自從英偉達向OpenAI交付首臺DGX超級計算機后,目前《財富》100強企業(yè)中已經(jīng)有一半用上這類產(chǎn)品。黃仁勛表示,“DGX(AI超級計算機)是大型語言模型實現(xiàn)突破背后的引擎,已成為AI領域的必備工具。”目前,NVIDIA DGX H100 AI超級計算機已全面投入生產(chǎn),很快將面向全球企業(yè)。
值得注意,英偉達已基于H100芯片開發(fā)了H800版本出口到中國。英偉達發(fā)言人表示,“我們的800 系列產(chǎn)品完全符合出口管制法規(guī)”,阿里巴巴、百度和騰訊控股等中國科技公司的云計算部門正在使用這款新芯片。對于兩款芯片的不同之處,據(jù)業(yè)內(nèi)人士透露,H800主要將芯片到芯片的數(shù)據(jù)傳輸速率降低到H100速率的一半左右。
在推理硬件方面,英偉達也推出了全新GPU推理平臺,包括針對不同工作負載進行優(yōu)化的4種配置,分別用于AI視頻、圖像生成、大型語言模型(LLM)部署以及推薦系統(tǒng),即L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超級芯片。
其中,H100 NVL是專門為LLM設計的GPU,采用Transformer加速解決方案,可用于ChatGPT等大型語言模型的大規(guī)模部署。黃仁勛稱,目前在云上唯一可以實際處理ChatGPT的GPU是HGX A100。與適用于GPT-3處理的HGX A100相比,一臺搭載4對H100及雙GPU NVLink的標準服務器的速度要快10倍。
此外,L4是針對AI生成視頻的通用GPU,用于加速AI視頻,可以提供比CPU高120倍的性能,能效提升約99%;可以優(yōu)化視頻解碼與轉碼、視頻內(nèi)容審核、視頻通話等性能。因此,一臺8-GPU L4服務器將取代100多臺用于處理AI視頻的雙插槽CPU服務器。
L40則用于圖像生成,針對2D、3D圖像生成進行優(yōu)化,并可以結合Omniverse直接生成3D內(nèi)容、元宇宙等,推理性能是英偉達最受歡迎的云推理GPU T4的10倍。而Grace Hopper超級芯片是為推薦系統(tǒng)和大型語言模型AI數(shù)據(jù)庫設計,可以通過900GB/s的高速一致性芯片到芯片接口連接英偉達Grace CPU和Hopper GPU。
BlueField-3 DPU已投產(chǎn) 加碼量子計算布局 除了計算光刻和生成式AI,英偉達GTC大會上也公布了該公司多款最新升級的技術產(chǎn)品及服務。在DPU方面,黃仁勛宣布英偉達BlueField-3 DPU已投入生產(chǎn),并被騰訊、百度、京東、微軟和甲骨文等多家領先的云服務提供商所采用,以加速其云計算平臺。而在算力生態(tài)以中,英偉達還想要通過云服務,把制造大模型的能力交給更多用戶。
在大會上,英偉達發(fā)布的DGX Cloud云服務,提供了專用的NVIDIA DGX AI超級計算集群。搭配NVIDIA AI軟件,其可使每個企業(yè)都可以使用簡單的網(wǎng)絡瀏覽器訪問AI超算,消除了獲取、部署和管理本地基礎設施的復雜性,進而為生成式AI和其他開創(chuàng)性應用訓練先進的模型。
緊接著,黃仁勛帶來的另一項關于云的重磅發(fā)布是NVIDIA AI Foundations,包括語言模型NEMO、視覺模型PICASSO和生物學模型BIONEMO,以為用戶提供定制化LLM和生成式AI解決方案。其中,NEMO可提供80億、430億、5300億參數(shù)模型;PICASSO可用于訓練圖像、視頻和3D應用等生成式AI模型;PICASSO可以通過高文本提示和元數(shù)據(jù)用DGX Cloud上的模型創(chuàng)造AI模型。
值得注意,英偉達還在量子計算等前沿科技領域取得了突破。在演講中,黃仁勛宣布的第一個全新產(chǎn)品就是與Quantum Machines合作的NVIDIA DGX Quantum。該產(chǎn)品結合了通用量子控制系統(tǒng)Quantum Machines OPX+和NVIDIA Grace Hopper超級芯片,可為高性能和低延遲量子經(jīng)典計算的研究人員提供革命性的新架構。
據(jù)他介紹,“NVIDIA DGX Quantum是全球首個GPU加速的量子計算系統(tǒng),可以實現(xiàn)GPU和量子處理單元(QPU)之間的亞微秒級延遲?!边@種組合使研究人員能夠建立強大的應用,實現(xiàn)校準、控制、量子糾錯和混合算法,將量子計算與最先進的經(jīng)典計算相結合。
另外,英偉達也發(fā)布了一系列面向元宇宙、汽車和工業(yè)等領域的新進展,包括推出第三代OVX計算系統(tǒng)和新一代工作站,PaaS服務NVIDIA Omniverse Cloud現(xiàn)已向特定企業(yè)開放,與寶馬集團擴大合作建設虛擬工廠、
比亞迪更多車型將采用NVIDIA DRIVE Orin平臺等。在GTC發(fā)布會上,最后登場的是“數(shù)字孿生”工業(yè)模擬應用Omniverse,主要的用處是讓企業(yè)在實際建設工廠、生產(chǎn)產(chǎn)品前,通過數(shù)字化模擬“預覽”實際的成品。
結語 “生成式AI正在推動AI的快速應用,并將重塑幾乎所有行業(yè)?!秉S仁勛數(shù)次表示,如今整個AI產(chǎn)業(yè)正處于“iPhone時刻”——創(chuàng)業(yè)公司正在競相建立顛覆式的商業(yè)模型,而業(yè)界巨頭也在尋找應對之道。由此,AIGC已在全球商業(yè)界掀起了開發(fā)AI策略的緊迫性。
可以看出,圍繞AI、計算光刻、量子計算、芯片等前沿科技發(fā)布一系列前沿技術和產(chǎn)品,英偉達已構建了一套圍繞產(chǎn)業(yè)上下游運轉的應用開發(fā)生態(tài),覆蓋從GPU、DPU等硬件到幫助企業(yè)加速構建定制生成式AI模型的云服務以及升級數(shù)據(jù)中心、芯片制造工藝等等,因而在自然科學、視覺解析、數(shù)據(jù)處理、機器學習和AI等領域成為不可或缺的一環(huán)。
顯而易見,黃仁勛正在帶領英偉達走向一個新階段,乃至進一步推動產(chǎn)業(yè)界釋放新的創(chuàng)造力。近十年來,人工智能的飛速發(fā)展背后其實都離不開英偉達的軟硬件支持。而如今,在生成式AI幾乎激勵著每個行業(yè)重新設想其商業(yè)戰(zhàn)略和技術路線的發(fā)展前景下,英偉達正在讓行業(yè)伙伴受益AI等前沿應用的變革性力量過程中變得越發(fā)強大,甚至不可替代。
(校對/張軼群)
□ .陳.興.華 .愛.集.微.A.P.P