文:Apple
編:亦可
大模型的風(fēng)在吹了半年后,終于有了新方向。7月7日,在2023世界人工智能大會(huì)(WAIC 2023)上,由國(guó)家標(biāo)準(zhǔn)委指導(dǎo)的人工智能標(biāo)準(zhǔn)化總體組宣布,我國(guó)首個(gè)大模型標(biāo)準(zhǔn)化專題組組長(zhǎng)由上海人工智能實(shí)驗(yàn)室與百度、華為、阿里等企業(yè)聯(lián)合擔(dān)任。對(duì)于首批入選的“國(guó)家隊(duì)”陣容,外界并不意外,畢竟大模型的發(fā)展,需要靠技術(shù)實(shí)力格外雄厚的玩家引領(lǐng)。而在國(guó)家明確他們的地位及任務(wù)后,國(guó)內(nèi)大模型市場(chǎng)的風(fēng)向,開始有了新變化。01
狂飆半年,行業(yè)迎來“國(guó)家隊(duì)”
今年以來,大模型一路狂飆,速度超過了以往任何一項(xiàng)技術(shù)的發(fā)展進(jìn)程。如果說在今年一季度,各個(gè)玩家蜂擁至大模型的入口,還在討論“要不要做”的問題,到了二季度時(shí),各家已經(jīng)進(jìn)化到具體“怎么做”的問題上來。而這樣的熱鬧場(chǎng)景,在WAIC 2023上迎來了高潮。這屆大會(huì)超400家企業(yè)參展、30多個(gè)大模型集中亮點(diǎn),展區(qū)面積達(dá)到了5萬(wàn)平方米,創(chuàng)下了歷屆之最。這場(chǎng)熱鬧的大會(huì),不少人因?yàn)闆]有提前預(yù)約而無(wú)法進(jìn)入大會(huì)現(xiàn)場(chǎng)。在被行業(yè)人士稱為“規(guī)格”很高的大會(huì)上,網(wǎng)紅馬斯克、圖靈獎(jiǎng)三巨頭之一的楊立昆、華為輪值董事長(zhǎng)胡厚昆、香港中文大學(xué)教授湯曉鴿,以及學(xué)界、創(chuàng)業(yè)界的大佬們紛紛到場(chǎng)。展廳內(nèi),大模型時(shí)代、生成式AI、通用人工智能,這些在半年前還很陌生的詞匯,如今成為展廳里隨處可見的標(biāo)志。當(dāng)然,大會(huì)現(xiàn)場(chǎng)的30余家大模型的玩家們,也并沒有讓外界失望,紛紛給出了自己對(duì)于大模型的解答。尤其是“國(guó)家隊(duì)”成員的動(dòng)作,更是令外界矚目。比如百度,作為國(guó)內(nèi)首家宣布All in人工智能的廠商,其在大會(huì)現(xiàn)場(chǎng)的展廳格外吸引人。當(dāng)然,在這個(gè)重要的場(chǎng)合,百度自然會(huì)展出讓更多人能體驗(yàn)到的“鎮(zhèn)館之寶”,這個(gè)被稱為文心一格的產(chǎn)品,可以讓進(jìn)入展廳的觀眾實(shí)現(xiàn)P圖自由。華為則將其“全球最快AI訓(xùn)練集群”Atlas 900 PoD A2搬到了現(xiàn)場(chǎng)。華為副董事長(zhǎng)胡厚崑稱,使用 Atlas 900,人們只需 59.8 秒就可以完成典型神經(jīng)網(wǎng)絡(luò) ResNet-50 在 ImageNet 數(shù)據(jù)集上的訓(xùn)練,在同等精度下比第 2 名快 15%?!斑@相當(dāng)于在短跑賽場(chǎng)上頭名撞線,然后喝完一瓶水才看到第二名跑到終點(diǎn)?!睙o(wú)疑,華為這場(chǎng)硬件端基礎(chǔ)算力的實(shí)力大秀,使得行業(yè)人士和觀眾將視線從大模型的繁雜移至硬件端的比拼。在阿里云論壇,阿里云“通義家族”再添AI繪畫模型“通義萬(wàn)相”,據(jù)稱,該模型可輔助人類進(jìn)行圖文創(chuàng)作,未來可應(yīng)用于藝術(shù)設(shè)計(jì)、電商、游戲和文創(chuàng)等應(yīng)用場(chǎng)景。阿里云智能集團(tuán)CTO周靖人在現(xiàn)場(chǎng)表示,這是阿里云大模型全面掌握多模態(tài)能力的關(guān)鍵一步,未來這一能力還將逐步向行業(yè)客戶開放。“有錢、有人、有技術(shù)、有場(chǎng)景”,這是大廠做大模型先天具備的優(yōu)勢(shì),同時(shí)也是不少初創(chuàng)企業(yè)很難填平的鴻溝,甚至有人在現(xiàn)場(chǎng)直接指出,中國(guó)的大模型落地,只會(huì)在五家大廠之中,即BAT+華為+騰訊。但巨頭們要怎么做?下一步會(huì)走向何方,這是一個(gè)很大的命題。02
拋棄概念與情懷,巨頭紛紛專注于場(chǎng)景落地
今年的人工智能大會(huì),大模型成為當(dāng)之無(wú)愧的頂流。阿里通義、百度文心、華為盤古等國(guó)家隊(duì)紛紛亮出自己的硬實(shí)力,同時(shí),訊飛星火、商湯日日新、網(wǎng)易伏羲等30多個(gè)垂類大模型也沒有輸?shù)魵鈩?shì),在各自的領(lǐng)域里埋頭苦干。但從現(xiàn)場(chǎng)的情況來看,他們似乎已經(jīng)摒棄了大而空、講故事、講情懷的做法,轉(zhuǎn)而開始專注于講落地場(chǎng)景和案例。這是大模型前進(jìn)的必由之路,同時(shí)也極有可能成為下一階段的重頭戲。在大會(huì)上,華為云盤古大模型3.0正式發(fā)布,引來不少行業(yè)人士圍觀。更令行業(yè)印象深刻的在于,華為常務(wù)董事、華為云CEO張平安所言——盤古大模型很忙,忙著做事,沒有時(shí)間作詩(shī)。而作詩(shī),正是此前半年發(fā)布大模型的玩家們最愛干的事。在張平安看來,華為希望盤古大模型可以幫助各行各業(yè),如金融、政務(wù)、礦山、氣象等,而非專注在語(yǔ)言大模型層面。據(jù)其透露,截至目前,盤古大模型已經(jīng)在氣象、醫(yī)藥研發(fā)、電力等領(lǐng)域落地,并交付了多個(gè)千億參數(shù)大模型。同樣把場(chǎng)景落到實(shí)處的還有百度。百度作為較早入局的玩家,早在四年前即發(fā)布文心大模型,只是當(dāng)時(shí)行業(yè)對(duì)于大模型的關(guān)注度不夠,以至于沒有激起太多水花。但對(duì)于百度而言,文心大模型是先行業(yè)一步的超前布局。如今,這個(gè)前瞻的產(chǎn)品也收獲頗豐。在WAIC 2023現(xiàn)場(chǎng),百度首席技術(shù)官王海峰稱,現(xiàn)在百度已經(jīng)升級(jí)到文心大模型3.5版本,較之此前的版本,效果提升50%、訓(xùn)練速度提升2倍,推理速度提升了30倍。在成本上,更是降到過去的10%。“把促進(jìn)中國(guó)大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供全方面的服務(wù)”。阿里云CTO周靖人如此說道。很明顯,這延續(xù)了阿里云提出的MaaS(模型即服務(wù))概念。在大模型領(lǐng)域最晚入局的騰訊,最近20天內(nèi)動(dòng)作不斷。6月19日,騰訊首次公開透露對(duì)大模型的思考;6月26日,首次披露自研星脈高性能計(jì)算網(wǎng)絡(luò);在7月7日WAIC 2023上,騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲對(duì)外公開了騰訊在大模型應(yīng)用創(chuàng)新的成果,并稱,騰訊云行業(yè)大模型能力已應(yīng)用到金融風(fēng)控、交互翻譯、數(shù)智人客服等場(chǎng)景中,提升了智能應(yīng)用效率。當(dāng)然,細(xì)分領(lǐng)域的大模型也展現(xiàn)出旺盛的生命力。曠視科技聯(lián)合創(chuàng)始人、CTO唐文斌在接受媒體采訪時(shí)說道:“應(yīng)用落地是衡量大模型價(jià)值的唯一標(biāo)準(zhǔn),曠視科技會(huì)從視覺大模型向通用多模態(tài)大模型進(jìn)軍?!?/span>專注場(chǎng)景落地,切實(shí)為企業(yè)用戶提供降本增效的方案,成為當(dāng)下大模型玩家集中發(fā)力的點(diǎn)。而未來,大模型早已從“做與不做”,真正邁進(jìn)了“做得怎么樣”的問題。而這正是大模型之爭(zhēng)的下一步。03
參與未來之爭(zhēng),先回答這四個(gè)問題
雖然大模型很火,但從開局到推向市場(chǎng),中間還有很遠(yuǎn)的一段路要走。在此過程中,很多難點(diǎn)已然暴露出來。不過,在壹DU財(cái)經(jīng)看來,大模型的未來之爭(zhēng),多半會(huì)在四個(gè)緯度展開。即:技術(shù)、人才、資金以及商業(yè)化落地。首先看技術(shù)層面。毫無(wú)疑問,人工智能是當(dāng)前最為先進(jìn)的技術(shù)之一,在技術(shù)層面,其所需要的積淀不可能在短時(shí)間內(nèi)補(bǔ)齊?!按蟆彼懔Αⅰ按蟆睌?shù)據(jù)、“大”模型是目前大模型的基本特征,同時(shí)也是大模型的產(chǎn)業(yè)化落地面臨的挑戰(zhàn),目前來看,數(shù)據(jù)規(guī)模雖大,但數(shù)據(jù)質(zhì)量參差不齊。其次,模型的體積大,訓(xùn)練難度更高,第三是算力規(guī)模大,對(duì)硬件性能要求會(huì)更高。這也意味著,沒有足夠的資金作為支撐,很難組建這樣一個(gè)超強(qiáng)的戰(zhàn)隊(duì)。一位營(yíng)銷云創(chuàng)始人與壹DU財(cái)經(jīng)溝通時(shí)曾提到:“從3月份投入做行業(yè)大模型以來,整體資金投入非常大,甚至超過了公司成立到做大模型之前的總和?!辈贿^,他也提到,如果做成了,對(duì)于公司的未來十年發(fā)展,絕對(duì)是定心丸。在此之前,不少行業(yè)人士就曾提出“大模型是大廠燒錢的游戲”。這種說法并非毫無(wú)道理。雖然大模型很火,但全球范圍來看,資本卻未跟上技術(shù)復(fù)蘇的節(jié)奏。研究公司PitchBook的數(shù)據(jù)稱,今年前六個(gè)月,全球風(fēng)險(xiǎn)投資資金幾乎減少了一半,下降48%至1739億美元,交易數(shù)量也下降了19%。在中國(guó),截至今年6月底,有十幾家大模型初創(chuàng)公司獲得融資,在已經(jīng)公布融資額的企業(yè)中,融資規(guī)模最大的是MiniMax,今年6月獲得騰訊公司超過2.5億美元A輪融資;光年之外在被美團(tuán)收購(gòu)前,也獲得了2.3億美元的天使+輪融資。再來看大廠的投入情況,此前,鈦媒體的統(tǒng)計(jì)數(shù)據(jù)頗能說明問題,2022年,華為在研發(fā)費(fèi)用上投入為1615億元,成為國(guó)內(nèi)研發(fā)投入最多的企業(yè);其次是騰訊,雖然低了不少,但也保持在614億元的水平,阿里排在第三,研發(fā)費(fèi)用為555億元。公開資料顯示,百度作為較早入局人工智能的玩家,過去十年,其在AI領(lǐng)域的投入超過1000億元。這樣的投入規(guī)范,顯然不是一般企業(yè)可以比擬的。有技術(shù)、有資金,大廠們對(duì)于人才的吸引力相對(duì)更強(qiáng)。今年年初,各家開始了瘋狂的人才搶奪戰(zhàn)。百度以25-40K的月薪招聘AI大模型算法工程師,更闊氣的阿里以40-70K的月薪招募大模型訓(xùn)練及算法工程師。在某招聘平臺(tái)上搜索關(guān)鍵詞“大模型”后,會(huì)發(fā)現(xiàn),一些企業(yè)愿意給到2023屆畢業(yè)生15-25K月薪的待遇。同時(shí),一些垂直賽道的企業(yè)也參與了這輪搶人大戰(zhàn)。比如某貿(mào)易公司招聘的醫(yī)療大模型產(chǎn)品經(jīng)理,薪資范圍為25-50K,某游戲公司招聘語(yǔ)言大模型的算法工程師,也給到了最高50K的薪資。甚至中國(guó)電信招聘的大模型平臺(tái)產(chǎn)品經(jīng)理年薪可以達(dá)到84萬(wàn)的水平。水漲船高的人才、技術(shù)以及資金,無(wú)不催促著大模型的玩家們盡快落地、盡快商業(yè)化,畢竟,按照商業(yè)規(guī)律,最終這些投入需要產(chǎn)出回報(bào),才有價(jià)值。但大模型的落地成本,同樣是各大玩家需要跨過的檻。曾有行業(yè)人士估算,大模型訓(xùn)練一次的成本極高,達(dá)到了200-12000萬(wàn)美元。這也意味著,AI大模型的商業(yè)化落地,可能還得回到成本核算這件事上。結(jié)語(yǔ)
站在當(dāng)下看大模型,整體很像1998年的互聯(lián)網(wǎng),初于起步階段,泡沫很大,機(jī)會(huì)也很大。在這種情況下,真正有實(shí)力的好公司,未來的成長(zhǎng)性會(huì)更好,價(jià)值也會(huì)越來越大。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。