去年底,生成式AI(AIGC)開始席卷全球,吸引社會各界的廣泛關注。
正所謂AI黃金時代的到來,將重新定義各行各業(yè)。AIGC熱浪來襲,標志著在數(shù)實融合的大趨勢下,人工智能大范圍應用的奇點已經(jīng)來臨,將對未來整個社會經(jīng)濟發(fā)展產(chǎn)生深遠影響。
事實上,隨著AIGC的興起,除了像自動駕駛、智慧金融、智能客服等智慧應用大量涌現(xiàn)之外,越來越多行業(yè)用戶今年將目光瞄準了AI大模型,寄希望通過AI大模型、AIGC強大的能力來改變自身,真正讓業(yè)務走向智能化。
但強大的AIGC背后是基礎設施、大模型和模型應用等一系列復雜工程化的結果,絕非簡單搭建即可實現(xiàn)。尤其是在基礎設施領域,AIGC帶來的算法復雜度、數(shù)據(jù)量指數(shù)級增長,以及模型層數(shù)、參數(shù)規(guī)??焖倥蛎?,對算力、存儲、網(wǎng)絡等基礎設施提出了前所未有的挑戰(zhàn)。
正如新華三集團副總裁、計算存儲產(chǎn)品線總裁徐潤安在今年新華三領航者峰會上所言:計算、存儲等基礎設施正在加速走向變革,成為“數(shù)字中國”建設的重要基石以及各行業(yè)加速業(yè)務創(chuàng)新的源動力。新華三將以“內(nèi)生智能 成就智慧”IT技術戰(zhàn)略,為AI時代構建堅實的基礎設施底座。
Gartner預測,到2025年,人工智能將成為推動基礎架構決策的最主要因素之一,這將導致基礎設施需求增長10倍。
除了基礎設施需求增長之外,AIGC、AI大模型等人工智能相關技術的快速發(fā)展,正在對包括算力、存儲、網(wǎng)絡等在內(nèi)的基礎設施產(chǎn)生不可低估的影響。
首先,大量智慧應用的涌現(xiàn)帶來了算力革命,過去通用算力一統(tǒng)天下的局面正在打破,多元異構算力成為大勢所趨。根據(jù)《中國算力發(fā)展指數(shù)白皮書》的預測,預計2025年全球算力規(guī)模將達到3300 EFlops,2021-2025年年均復合增長率達到52.2%,其中AI算力占比將持續(xù)提升。
隨著越來越多用戶瞄準的AI大模型,帶來了對于多元算力管理、異構內(nèi)存高效利用等一系列挑戰(zhàn)。比如,當前諸多大模型每進行一次訓練迭代需要消耗4.5ExaFLOPS算力,而主流GPU卡單卡算力只能達到TFLOPS級別,這意味著在大集群下如何高效調(diào)度、管理和發(fā)揮算力潛能至關重要。
其次,AI大模型正在加速走向多模態(tài)大模型,標志著將進一步接入音視頻數(shù)據(jù),PB級海量數(shù)據(jù)的訓練將會對存儲的性能、容量等帶來巨大的挑戰(zhàn)。而隨著AIGC應用的深入,隨之而來的推理需求也會對數(shù)據(jù)處理性能提出更高要求。例如,OpenAI GPT-5開始就是多模態(tài)大模型,國內(nèi)多款大模型也在走向多模態(tài),一旦這些大模型接入到像車路協(xié)同、智能制造、智慧醫(yī)療等場景,對數(shù)據(jù)處理效率提出全新要求。
第三,AIGC對于基礎設施自身的智能化和綠色化正在產(chǎn)生關鍵性影響。智慧應用需要大量算力、存儲資源做支撐,但并不意味著僅僅是簡單的基礎設施堆砌,如何高效使用基礎設施,將會成為越來越用戶關注的焦點。比如,智慧應用的規(guī)?;蛨鼍盎瑢O大提升數(shù)據(jù)處理的復雜度,需要采集、訓練、推理等環(huán)節(jié)的數(shù)據(jù)互通性提升,減少不必要的協(xié)議轉(zhuǎn)換,提升數(shù)據(jù)處理的智能化程度;又如,大量算力的消耗帶來了顯著的能耗問題,如何讓基礎設施更加綠色節(jié)能也是關鍵。
因此,AI時代的到來,極大的推動基礎設施變革。最新《數(shù)字中國規(guī)劃》的“2522”的整體框架也明確提出夯實數(shù)字基礎設施和數(shù)據(jù)資源體系“兩大基礎”。像新華三也在本次領航者峰會上推出了“AIGC開放戰(zhàn)略”,ICT基礎設施架構是核心之一。
徐潤安認為,AIGC正在數(shù)字化時代掀起新一輪的智能革命,智能技術與行業(yè)場景的深度融合,將推動算力、數(shù)據(jù)、管理和節(jié)能等產(chǎn)品重構和升級,而新華三也將引領基礎設施的變革,幫助百行百業(yè)用戶應對AI時代的到來。
進入到AI時代,算力的進化至關重要。
眾所周知,智慧應用的大量涌現(xiàn)帶來了對于算力需求的顛覆性變化,直接推動了數(shù)據(jù)中心算力基礎設施的需求變化:隨著AI應用的大幅增加,數(shù)據(jù)中心和單位設備的算力密度在持續(xù)提升;多核技術、GPU、NPU等普及,讓異構算力設備的種類大幅增加;多元的算力需求推動算力基礎設施走向細分化、專用化,算力走向調(diào)度管理的高效化和智能化……
新華三集團計算存儲產(chǎn)品線副總裁劉宏程認為,大量智慧應用推動數(shù)實融合走向深化,也對底層算力形態(tài)和架構帶來直接影響。過去通用計算時代,計算類型單一,以集中式架構為主,在應用場景存在著復雜、低效和僵化等顯著問題,算力架構、產(chǎn)品等面臨著重塑,采用分布式架構的可進化、高效、綠色的智慧計算將是算力基礎設施未來方向。
事實上,算力基礎設施架構的加速變化并非無跡可循。像CXL協(xié)議近年來獲得產(chǎn)業(yè)界上下游的高度認可就是一個縮影。CXL協(xié)議真正開始打破傳統(tǒng)的馮諾依曼計算體系架構,以內(nèi)存為中心重塑整個計算體系,迎合了AI時代的算力發(fā)展需求。
劉宏程直言:“CXL協(xié)議發(fā)展到3.0階段,未來2-3年會對整個計算架構產(chǎn)生直接且重要的影響。當前最重要的就是,包括新華三在內(nèi)的產(chǎn)業(yè)鏈上下游做好標準、產(chǎn)品預研,為未來做好準備。”
針對算力基礎設施的變革,新華三著重打造了“一體·兩中樞”智慧計算體系。所謂“一體”是以CPU、GPU和xPU為核心,新華三構建起覆蓋通用計算、異構計算等全場景的多元計算體系,并融入液冷等低碳技術,構建起高效、低碳數(shù)據(jù)中心的算力基石;而“兩中樞”則是智能算力中樞和智能管理中樞,聚焦數(shù)據(jù)中心提供全生命周期的智能管理,以全流程的算力智能調(diào)度賦能AI開發(fā)核心能力,加速AI創(chuàng)新。
明顯能夠看出,算力需要體系化進行重塑和持續(xù)進化,在場景覆蓋、管理調(diào)度和綠色節(jié)能等方面滿足AI時代的全新需求。而新華三的“一體·兩中樞”智慧計算體系,無疑率先從算力體系化的視角思考算力的演進發(fā)展,并在產(chǎn)品、解決方案等層面全面發(fā)力,為AI時代的算力需求做好充足的準備。
比如,全新的H3C UniServer G6和HPE Gen11系列產(chǎn)品覆蓋通用、異構和負載優(yōu)化三大場景需求,并且踐行異構計算設計理念,兼容NVIDIA Hopper架構和OAI架構,同時支持各種DPU,AI算力提升高達10倍,通用算力性能提升53%,數(shù)據(jù)分析效率提升3倍,為不同的應用場景提供了澎湃算力。
又如,算力基礎設施的功耗在未來會成為一大挑戰(zhàn)。像當前最先進的GPU卡功率達到400W,加上服務器的耗電,換算到單機柜則功耗最少達到50KW,未來隨著AIGC應用的深入,算力密度的提升一定會帶來能耗的提升,需要更加綠色、高效的算力供給。為此,新華三在本次峰會上還宣布了“ALL in GREEN”理念,新華三液冷解決方案實現(xiàn)交換機、服務器、微模塊等不同產(chǎn)品的改造,并將液冷技術全面融入到全新的UniServer G6系列服務器中,加上統(tǒng)一的管理和智能運維,讓數(shù)據(jù)中心真正全面走向綠色節(jié)能。
再如,新華三傲飛算力平臺已經(jīng)實現(xiàn)了8000個節(jié)點規(guī)模的調(diào)度,針對AI和科學計算場景,可以讓在算力規(guī)模越來越大情況下,精準匹配算力需求、智能部署和智能調(diào)度?!鞍溜w算力平臺能夠讓AI訓練時間等大幅降低,并且具有裸機、容器化和虛擬化三種部署方式,靈活滿足用戶的需求。”劉宏程補充道。
眾所周知,數(shù)據(jù)是AI應用的關鍵所在。
隨著AIGC的興起,AI大模型在加速走向多模態(tài)和復雜化,除了帶來PB級甚至EB級的海量數(shù)據(jù)之外,也讓混合工作負載迅速增多,大幅提升了實時性極強的數(shù)據(jù)處理需求。因此,一個好的存儲平臺就是AI時代的基石,為AI大模型源源不斷輸入數(shù)據(jù)要素,真正讓AI大模型的通用性變強,加速走向百行百業(yè)。
當前,傳統(tǒng)存儲從數(shù)據(jù)類型、數(shù)據(jù)處理流程和效率來看,都已經(jīng)很難勝任AI時代的數(shù)據(jù)處理任務。比如,傳統(tǒng)存儲很難在一個系統(tǒng)中滿足不同數(shù)據(jù)類型或者工作負載對于性能的不同需求。比如,隨著AIGC的能力將深入到各個垂直領域進行發(fā)展,會吸收更多行業(yè)相關的數(shù)據(jù)進行訓練,AI訓練的性能瓶頸可能很快就出現(xiàn)。
當前,存儲正朝著數(shù)據(jù)非結構化、數(shù)據(jù)應用多樣化、全閃存場景、AI賦能、綠色節(jié)能等五個方向,智慧存儲被業(yè)界視為是存儲發(fā)展的大勢所趨。所謂智慧存儲,核心主要有兩個方面:其一、在性能、擴展性等方面很好地支撐起各類AI應用,滿足AI時代復雜的數(shù)據(jù)存儲和管理需求;其二、存儲系統(tǒng)自身需要走向智能,無論是工作負載的調(diào)優(yōu)、存儲系統(tǒng)的運維還是數(shù)據(jù)管理、節(jié)能減排等均會走向智能化,大幅降低存儲使用的復雜性。
“未來十年,以服務為導向的智慧存儲將帶來巨大的技術變革。新華三認為智慧存儲的演進方向?qū)⒓性谥悄芑\維、云化式體驗、追溯碳足跡三個方面。”新華三集團存儲產(chǎn)品線副總經(jīng)理兼首席產(chǎn)品經(jīng)理關天舒介紹道。
在智慧存儲領域,新華三是當之無愧的引領者,其以AI存儲智慧中樞為核心的發(fā)展路線在近年來的市場中被證明極具前瞻性且非常成功。AI存儲智慧中樞平臺可協(xié)助用戶將焦點從底層的存儲布局轉(zhuǎn)變到上層的應用維度,幫助用戶無縫調(diào)配數(shù)據(jù),自動資源分配與任務分發(fā),提前風險預測和主動故障處理,并實現(xiàn)按使用計費的公有云式體驗。
在本次領航者峰會上,新華三將AI存儲智慧中樞升級到3.0版本,進一步實現(xiàn)了系統(tǒng)資源的凈空預測,了解工作負載的壓力與變化,理解和掌握業(yè)務規(guī)律,并能進行正確分析和判斷,進一步提升了智慧存儲的智能化程度。
針對AI應用的全面支撐,分布式存儲被認為將堪當大任?!斗植际饺诤洗鎯Πl(fā)展白皮書》預測,分布式融合存儲在云、大數(shù)據(jù)分析、AI等應用場景有著廣泛的部署需求。為此,新華三正式發(fā)布了新一代分布式存儲X18000 G6,具備極致可靠極簡運維、極致性能極低時延、一框交付極致敏捷、整體優(yōu)化極致節(jié)能等多重優(yōu)勢,可以很好地支撐起自動駕駛、海量數(shù)據(jù)智能實時分析等場景。
“AI應用帶來大量的非結構化數(shù)據(jù),會進一步推動高性能文件存儲和對象存儲的需求。并且,隨著RDMA、RoCE、NVMe、CXL等相關技術的不斷發(fā)展,存儲產(chǎn)品的形態(tài)未來還會持續(xù)創(chuàng)新與演進。新華三智慧存儲會持續(xù)聚焦新智能和新協(xié)議的演進?!标P天舒補充道。
綜合觀察,以AIGC為代表人工智能浪潮,正在開啟AI新時代,百行百業(yè)的生產(chǎn)力有望實現(xiàn)又一次飛躍。與此同時,基礎設施的變革大幕也在加速開啟,CXL、GPU、NPU、AI等多種技術推動著服務器、存儲等基礎設施產(chǎn)品走向重塑。新華三作為ICT領域的佼佼者,在服務器、存儲等基礎設施領域耕耘多年,深刻洞察和理解AI時代的各種挑戰(zhàn)與需求變化,通過布局智慧計算和智慧存儲,為百行百業(yè)構建起AI時代的數(shù)字底座,按下數(shù)實融合的快進鍵,真正讓百行百業(yè)用戶在數(shù)字化浪潮中揚帆遠行。
聯(lián)系客服