大模型與云計(jì)算,正在成為新時(shí)代的淘金者和賣(mài)鏟人。
自ChatGPT刷屏之后的數(shù)月時(shí)間,微軟Azure與OpenAI的示范效應(yīng)傳導(dǎo)至全球,基本所有能做大模型的廠(chǎng)商都嘗試“淘金”,其中,云廠(chǎng)商是一股重要力量,云計(jì)算天然適合大規(guī)模的AI任務(wù),同時(shí)云廠(chǎng)商也有人才、資源等優(yōu)勢(shì),匹配大模型這類(lèi)技術(shù)密集型工作。
淘金熱最開(kāi)始的階段總是最混亂,淘金者一窩蜂涌向理想之地,競(jìng)爭(zhēng)很快變得激烈起來(lái),成功的淘金者是少數(shù),這和如今的大模型產(chǎn)業(yè)相似。而云廠(chǎng)商同時(shí)具備淘金者與賣(mài)鏟人的兩種身份,如何平衡兩者的關(guān)系,考驗(yàn)著云廠(chǎng)商的戰(zhàn)略意識(shí)。
2023年云棲大會(huì)上,阿里云CTO周靖人表示:“面向智能時(shí)代,阿里云將通過(guò)從底層算力到AI平臺(tái)再到模型服務(wù)的全棧技術(shù)創(chuàng)新,升級(jí)云計(jì)算體系,打造一朵AI時(shí)代最開(kāi)放的云?!?/span>
在現(xiàn)場(chǎng),周靖人發(fā)布了千億級(jí)參數(shù)的通義千問(wèn)2.0,但更多的時(shí)間花在公布云計(jì)算基礎(chǔ)能力的進(jìn)展上:包括AI基礎(chǔ)設(shè)施的全面升級(jí)、模型應(yīng)用開(kāi)發(fā)平臺(tái)阿里云百煉以及更加自動(dòng)化的云等,他宣布阿里云已初步建成AI時(shí)代全棧的云計(jì)算體系。
通義千問(wèn)2.0正式發(fā)布
國(guó)外如AWS、微軟Azure等,國(guó)內(nèi)如阿里云、百度等,看起來(lái)似乎都沒(méi)什么兩樣,從基礎(chǔ)設(shè)施到大模型應(yīng)用,云廠(chǎng)商能夠包攬大模型鏈條上的大部分環(huán)節(jié)。實(shí)則不然,出發(fā)點(diǎn)不同,決定了云廠(chǎng)商不同的動(dòng)作。
仔細(xì)觀(guān)察國(guó)內(nèi)外云廠(chǎng)商的布局就會(huì)發(fā)現(xiàn),所有云廠(chǎng)商都面臨云還是大模型的選擇,國(guó)外頭部云廠(chǎng)商更務(wù)實(shí),以云為先,國(guó)內(nèi)云廠(chǎng)商還在觀(guān)望。
ChatGPT火爆之后,AWS的主打產(chǎn)品不是自研的大模型,而是Amazon Bedrock,Amazon Bedrock 是一項(xiàng)完全托管的服務(wù),用戶(hù)可調(diào)用亞馬遜自己的基礎(chǔ)模型Amazon Titan,也可以使用其他第三方基礎(chǔ)模型,并且提供構(gòu)建生成式人工智能應(yīng)用程序所需的一系列工具鏈,強(qiáng)調(diào)隱私和安全。
如果說(shuō)AWS的選擇還可以理解為,錯(cuò)失大模型的先發(fā)機(jī)會(huì)不得不優(yōu)先做云,那么,微軟就更有代表性。
2020年,微軟就發(fā)布了基于Transformer架構(gòu)的語(yǔ)言生成模型Turing NLG,170億參數(shù)是當(dāng)時(shí)OpenAI的GPT-2的十倍。值得關(guān)注的是,當(dāng)ChatGPT取得了現(xiàn)象級(jí)熱度,微軟并沒(méi)有再著重強(qiáng)調(diào)自研大模型,而是選擇了深度綁定的方式,直接基于GPT對(duì)外提供服務(wù)。
在最新一季財(cái)報(bào)中,微軟收入同比增長(zhǎng)了13%至565億美元,凈利潤(rùn)同比增長(zhǎng)了27%,至222億美元,微軟表示,主要得益于對(duì)消費(fèi)者和商業(yè)產(chǎn)品中大型AI模型的不斷增長(zhǎng)需求,推動(dòng)了云消費(fèi)的增加。
微軟并不是放棄做大模型,微軟Azure云是基礎(chǔ)設(shè)施,Copilot作為AI 助手?jǐn)U展到Windows、Office、Bing等軟件,云-AI-軟件的鏈條構(gòu)成了商業(yè)閉環(huán),微軟要是再把持大模型,可能會(huì)得不償失。
結(jié)合產(chǎn)業(yè)現(xiàn)實(shí)來(lái)看,站在云計(jì)算的出發(fā)點(diǎn)做大模型,有足以讓人信服的理由。
大模型是技術(shù)驅(qū)動(dòng)型創(chuàng)新,而非場(chǎng)景驅(qū)動(dòng)型創(chuàng)新,這就意味著大模型沒(méi)有現(xiàn)成的應(yīng)用場(chǎng)景,說(shuō)得好聽(tīng)點(diǎn)是無(wú)限可能,說(shuō)得難聽(tīng)點(diǎn)是從零開(kāi)始,畢竟ChatGPT很難復(fù)制,大模型還是需要找到客戶(hù)為之買(mǎi)單的場(chǎng)景,尤其是B端有更高付費(fèi)能力和意愿的客戶(hù)。
拿著錘子找釘子,是大模型廠(chǎng)商當(dāng)下的常態(tài),而云計(jì)算是一條確定且廣闊的賽道,商業(yè)模式清晰,賽道規(guī)模足夠大,僅就算力資源來(lái)看,未來(lái)AI算力取代通用算力充滿(mǎn)確定性,不止是目前的訓(xùn)練需求,未來(lái)推理需求將遠(yuǎn)超訓(xùn)練需求,以大模型算力為云的基本盤(pán),是云廠(chǎng)商必須抓住的大生意。
除了算力之外,大模型能夠提高云計(jì)算的附加值,直接提升毛利。IaaS是低毛利生意,但大模型的訓(xùn)練任務(wù),是囊括了算力底座、網(wǎng)絡(luò)、存儲(chǔ)、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程,對(duì)性能、成本提出了嚴(yán)酷挑戰(zhàn),傳統(tǒng)數(shù)據(jù)中心難堪重任。
經(jīng)歷了大規(guī)模任務(wù)考驗(yàn)的云平臺(tái),更適合承載大模型。周靖人表示,云計(jì)算是做大模型的最佳選擇。更適合跑大模型的云,本質(zhì)上就是更好的鏟子,能夠讓大模型廠(chǎng)商挖掘到更高的價(jià)值,自然云廠(chǎng)商的價(jià)值也會(huì)水漲船高。
某種意義上,阿里云自己下場(chǎng)做大模型,更像是“打樣”——自己把坑都蹚過(guò)了,知道該往哪里走,才能更好地說(shuō)服客戶(hù)上云來(lái)做大模型。
不過(guò),從產(chǎn)業(yè)生態(tài)的角度考量,一家云廠(chǎng)商同時(shí)做大模型和云平臺(tái),容易被理解為和客戶(hù)競(jìng)爭(zhēng)。云廠(chǎng)商做大模型應(yīng)該把握好度,既要錘煉出大模型廠(chǎng)商所需要的基礎(chǔ)設(shè)施,又不至于與客戶(hù)爭(zhēng)利。
相比于國(guó)外云廠(chǎng)商的堅(jiān)定做云,國(guó)內(nèi)云廠(chǎng)商還在搖擺之中,不過(guò),作為中國(guó)最大的云計(jì)算廠(chǎng)商,阿里云的表態(tài)可能引起連鎖反應(yīng)。
本屆云棲大會(huì),阿里云發(fā)布了諸多產(chǎn)品和服務(wù),除了國(guó)內(nèi)千億級(jí)參數(shù)通義千問(wèn)2.0,還一次性放出了8個(gè)可以直接2C體驗(yàn)的行業(yè)大模型,還有玲瑯滿(mǎn)目的AI相關(guān)云產(chǎn)品全面升級(jí)。
通義大模型家族
在令人眼花繚亂的發(fā)布背后,阿里云面向AI時(shí)代其實(shí)已經(jīng)做出了堅(jiān)定選擇——做AI時(shí)代的基礎(chǔ)設(shè)施、開(kāi)源路線(xiàn)、開(kāi)放平臺(tái)。
首先是AI基礎(chǔ)設(shè)施,大模型是AI基礎(chǔ)設(shè)施呈現(xiàn)的結(jié)果,實(shí)際上,阿里云內(nèi)部的迭代早已開(kāi)始,每一次模型的發(fā)展都離不開(kāi)云,表面上看是模型的發(fā)布,背后代表的是阿里云整個(gè)AI基礎(chǔ)設(shè)施的升級(jí),高帶寬網(wǎng)絡(luò)的連接,大規(guī)模資源的管理,高效彈性的多種算力,數(shù)以萬(wàn)計(jì)的服務(wù)器構(gòu)成了開(kāi)發(fā)者界面的一臺(tái)計(jì)算機(jī)。
以阿里云本次云棲大會(huì)發(fā)布為例,全新升級(jí)的阿里云人工智能平臺(tái)PAI,底層采用HPN7.0新一代AI集群網(wǎng)絡(luò)架構(gòu),可高效協(xié)同調(diào)度各類(lèi)芯片,支持高達(dá)10萬(wàn)卡量級(jí)的集群可擴(kuò)展規(guī)模,讓超大集群像一臺(tái)計(jì)算機(jī)般高效運(yùn)轉(zhuǎn)。
阿里云PAI可支撐多個(gè)萬(wàn)億參數(shù)大模型同時(shí)訓(xùn)練,超大規(guī)模分布式訓(xùn)練加速比高達(dá)96%,遠(yuǎn)超行業(yè)水平;在大模型訓(xùn)練任務(wù)中,更可節(jié)省超過(guò)50%算力資源,性能全球領(lǐng)先。
要知道,大模型訓(xùn)練大部分時(shí)間都在等待,一個(gè)錯(cuò)誤可能導(dǎo)致有效訓(xùn)練時(shí)間少幾天甚至幾個(gè)禮拜,而且大模型規(guī)模越大、卡數(shù)越多,出故障的概率就越大,多數(shù)大模型的訓(xùn)練只使用數(shù)百?gòu)埧?,加速?6%意味著算力可以實(shí)現(xiàn)接近線(xiàn)性的增長(zhǎng),而不是絕大多數(shù)時(shí)間都在空轉(zhuǎn)浪費(fèi)資源,背后阿里云平臺(tái)做了復(fù)雜的系統(tǒng)優(yōu)化。
做云, 并不代表阿里云不做大模型,阿里云做大模型是為了更好的做云,因此阿里云也將大模型逐步開(kāi)源出來(lái),并且走開(kāi)放路線(xiàn)。
今年4月,阿里云推出自研大模型通義千問(wèn),并先后開(kāi)源70億及140億參數(shù)規(guī)模的大模型版本,成為國(guó)內(nèi)最早開(kāi)源自研大模型的科技公司。在2023云棲大會(huì)現(xiàn)場(chǎng),通義千問(wèn)2.0正式亮相,基于更大的參數(shù)規(guī)模和更先進(jìn)的對(duì)齊技術(shù),通義千問(wèn)2.0在復(fù)雜指令理解、文學(xué)創(chuàng)作能力、通用數(shù)學(xué)能力、知識(shí)記憶、幻覺(jué)抵御等能力維度上表現(xiàn)優(yōu)異,在多個(gè)主流測(cè)評(píng)集上,超越GPT-3.5,獲得接近GPT-4的得分。
阿里云還“打樣”了8大垂直領(lǐng)域模型——通義聽(tīng)悟、通義曉蜜、通義智文、通義星塵、通義靈碼、通義法睿、通義仁心、通義點(diǎn)金,讓大模型在金融、醫(yī)療、法律、編程、個(gè)性化創(chuàng)作等行業(yè)和場(chǎng)景中更易被集成。
通義靈碼等8大垂直領(lǐng)域模型,將通過(guò)網(wǎng)頁(yè)嵌入、API與SDK調(diào)用等方式集成進(jìn)各行各業(yè),還將通過(guò)全新發(fā)布的一站式大模型應(yīng)用開(kāi)發(fā)平臺(tái)——阿里云百煉,對(duì)外開(kāi)放。這也是阿里云降低大模型門(mén)檻的一大舉措。
阿里云百煉接入主流三方大模型
周靖人介紹稱(chēng),阿里云百煉集成了國(guó)內(nèi)外主流優(yōu)質(zhì)大模型,包括阿里云自研大模型及Llama2、Baichuan等三方大模型?;诎⒗镌瓢贌挘_(kāi)發(fā)者可在5分鐘內(nèi)開(kāi)發(fā)一款大模型應(yīng)用,幾小時(shí)“煉”出一個(gè)專(zhuān)屬模型,大模型門(mén)檻大幅降低。
在2023云棲大會(huì)現(xiàn)場(chǎng),周靖人透露,模型社區(qū)阿里云魔搭,已聚集2300多款A(yù)I模型,共吸引280萬(wàn)名AI開(kāi)發(fā)者,魔搭社區(qū)上線(xiàn)僅一年,AI模型下載量就已突破1億。
魔搭社區(qū)模型下載量突破1億
云棲大會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席蔡崇信致辭,他強(qiáng)調(diào)最多的詞是“開(kāi)放”。蔡崇信說(shuō):“我們堅(jiān)信,不開(kāi)放就沒(méi)有生態(tài),沒(méi)有生態(tài)就沒(méi)有未來(lái)。同時(shí),我們要始終攀登技術(shù)高峰,只有站在更先進(jìn)、更穩(wěn)定的技術(shù)能力之上,才有更大的開(kāi)放底氣?!?/span>
技術(shù)從來(lái)不是護(hù)城河,與其說(shuō)阿里云在做AI時(shí)代的云,不如說(shuō)阿里云在做大模型時(shí)代的云生態(tài)。2022年底,周靖人首次提出MaaS(Model as a Service,模型即服務(wù))理念,阿里云已經(jīng)設(shè)想好了未來(lái)的藍(lán)圖。
即阿里云通過(guò)提供工具與服務(wù),降低使用門(mén)檻,為大模型創(chuàng)業(yè)公司提供全方位服務(wù),越多元的模型、越繁榮的應(yīng)用,中國(guó)大模型生態(tài)意義上就更繁榮,阿里云的機(jī)會(huì)也就越大。
如此梳理,便能將阿里云的動(dòng)作串聯(lián)起來(lái),AI基礎(chǔ)設(shè)施包括IaaS和PaaS一系列能力,朝著更適合跑大模型的方向演進(jìn),應(yīng)用層面樹(shù)立標(biāo)桿先一步為客戶(hù)趟路,開(kāi)源、開(kāi)放是為了讓客戶(hù)、開(kāi)發(fā)者、創(chuàng)業(yè)公司、ISV等角色聚攏在一起,降低溝通成本,快速推出面向市場(chǎng)的創(chuàng)新。
以開(kāi)源為例,國(guó)外廠(chǎng)商開(kāi)源大模型不少,阿里巴巴是唯一一個(gè)開(kāi)源大模型的國(guó)內(nèi)頭部云廠(chǎng)商,這是阿里云與其他廠(chǎng)商的根本區(qū)別,所以在云廠(chǎng)商紛紛喊著做大模型生態(tài)時(shí),魔搭社區(qū)早已經(jīng)種下了種子,并且逐漸生長(zhǎng)為中國(guó)大模型生態(tài)的森林。
生態(tài)開(kāi)放策略為阿里云直接贏得了客戶(hù)信任,周靖人介紹,中國(guó)一半大模型公司跑在阿里云上,百川智能、智譜AI、零一萬(wàn)物、昆侖萬(wàn)維、vivo、復(fù)旦大學(xué)等大批頭部企業(yè)及機(jī)構(gòu)均在阿里云上訓(xùn)練大模型。
截至目前,中國(guó)眾多頭部主流大模型都已通過(guò)阿里云對(duì)外提供API服務(wù),包括通義系列、Baichuan系列、智譜AIChatGLM系列、姜子牙通用大模型等,大模型廠(chǎng)商與阿里云一同面向客戶(hù)。
百川智能是中國(guó)最頭部大模型創(chuàng)業(yè)公司之一,曾創(chuàng)下平均28天迭代一版大模型的紀(jì)錄。王小川介紹,百川大模型快速的快速迭代和部署離不開(kāi)云計(jì)算的支撐,百川智能和阿里云作為緊密的合作伙伴進(jìn)行了深入合作。在雙方的共同努力下,百川很好地完成了千卡大模型訓(xùn)練任務(wù)。
大模型也在反哺阿里云,阿里云成為一朵走向“自動(dòng)駕駛”的云。周靖人表示,“基于阿里云通義大模型,我們對(duì)云上產(chǎn)品也進(jìn)行了AI化改造,超過(guò)30款云產(chǎn)品具備了大模型的能力,帶來(lái)了開(kāi)發(fā)效率的大幅提升?!?/span>
例如,阿里云大數(shù)據(jù)治理平臺(tái)DataWorks新增了全新的交互形態(tài)——Copilot,用戶(hù)只需用自然語(yǔ)言輸入即可生成SQL,整體開(kāi)發(fā)與分析可提效30%以上。阿里云容器、數(shù)據(jù)庫(kù)等產(chǎn)品上也提供了類(lèi)似的開(kāi)發(fā)體驗(yàn),未來(lái)這些能力還將集成到阿里云其他產(chǎn)品上。
阿里云用大模型驅(qū)動(dòng)云計(jì)算進(jìn)化,云平臺(tái)加持大模型,并不依靠大模型本身賺錢(qián),更重要的是找到自己的生態(tài)角色,開(kāi)源開(kāi)放的大模型與AI基礎(chǔ)設(shè)施不斷迭代,為其提供了循環(huán)往復(fù)的動(dòng)力。
在全新的大模型時(shí)代,阿里云又踏上一個(gè)新的開(kāi)始。
聯(lián)系客服