7月份,微軟公布了Office 365 Copliot的企業(yè)版價(jià)格,30美元/月,我看完第一個(gè)感覺(jué)是有點(diǎn)吃驚:外界沒(méi)那么關(guān)心微軟的可能不太清楚,但懂To B業(yè)務(wù)基本都知道,微軟這些年B端定價(jià)慣常穩(wěn)如老狗,割起各大公司的肉來(lái)刀法堪稱精準(zhǔn),它說(shuō)敢賣30美元一個(gè)月,那就是確實(shí)能賣30美元一個(gè)月,而這已經(jīng)明顯高于了此前外界所預(yù)估的價(jià)格。
換言之,微軟對(duì)Copliot的定價(jià),從某種意義上說(shuō),就意味著AI應(yīng)用落地的時(shí)代確實(shí)是來(lái)了,而且已經(jīng)相當(dāng)賣得上價(jià)。
相比之下,國(guó)內(nèi)AI大模型的落地應(yīng)用,明顯還缺乏成熟的市場(chǎng)化產(chǎn)品,但也基本都已經(jīng)開(kāi)始進(jìn)入內(nèi)測(cè),只是因?yàn)橛脩袅?xí)慣不同而采取了不同的模式,走入收費(fèi)階段的速度相對(duì)慢了一些。
關(guān)于中美AI大模型之間的差距和優(yōu)劣,業(yè)界討論得很多,幾乎所有切入相關(guān)領(lǐng)域的人都會(huì)被問(wèn)到這個(gè)問(wèn)題,但大家的看法很難說(shuō)得上統(tǒng)一。比如李彥宏曾經(jīng)說(shuō)文心一言離OpenAI只有兩個(gè)月差距,王小川對(duì)此的評(píng)價(jià)是:那估計(jì)我們沒(méi)在同一個(gè)世界。
根據(jù)星海的不完全統(tǒng)計(jì),不到一年的時(shí)間,國(guó)內(nèi)的大模型已經(jīng)超過(guò)了120個(gè),中美兩國(guó)大模型公司占了全球80%。中美AI大模型到底有幾年的差距,中國(guó)大模型真的落后了嗎?中美AI競(jìng)爭(zhēng)的路線又有何不同?中國(guó)短短半年里涌現(xiàn)出的百家大模型企業(yè)混戰(zhàn),到底打到了什么程度?
百模大戰(zhàn)沒(méi)有硝煙
我上半年參加過(guò)幾次AI的會(huì),開(kāi)門的閉門的都有,大家提的最多的前些年AI是真的不賺錢,連融都未必能融得到錢,有一點(diǎn)全跑自動(dòng)駕駛那頭去了,其他的都已經(jīng)死了不知道第幾輪。
但自從ChatGPT橫空出世,情況就不一樣了。爆火的大半年里,AI大模型的技術(shù)水平未嘗就真的能有什么大爆炸,但商業(yè)上的環(huán)境確實(shí)是有點(diǎn)“病樹(shù)前頭萬(wàn)木春”的意思——活了。
但也沒(méi)想過(guò),這么快就能活得跟Copliot一樣賣出30美元一個(gè)月的價(jià)錢。
根據(jù)星海情報(bào)局不完全統(tǒng)計(jì),中國(guó)目前已經(jīng)有超過(guò)120家機(jī)構(gòu)或企業(yè)發(fā)布了自己的AI大模型,其中10億參數(shù)規(guī)模以上的大模型就已經(jīng)有79個(gè),有20個(gè)是通用領(lǐng)域的大模型,基本來(lái)自互聯(lián)網(wǎng)大廠和科研院所,其余均為垂直領(lǐng)域的產(chǎn)業(yè)應(yīng)用大模型。毫無(wú)疑問(wèn),中國(guó)的AI產(chǎn)業(yè)正在進(jìn)入一場(chǎng)名副其實(shí)的“百模大戰(zhàn)”,而且已經(jīng)有了逐漸開(kāi)始向垂直領(lǐng)域深入分化的趨勢(shì)。
上下滑動(dòng)查看更多
這里簡(jiǎn)單做個(gè)科普,我們目前所說(shuō)的大模型,通常來(lái)說(shuō)的分類是兩種,一種是通用大模型,模板就是ChatGPT,可以聊天,問(wèn)答、做題,特點(diǎn)是比較泛化,干什么都成,但相對(duì)來(lái)講不夠?qū)δ骋粋€(gè)產(chǎn)業(yè)深入精通。
所以有了第二種,行業(yè)大模型,也叫垂直類大模型。典型的比如華為的盤古,京東的言犀,都是直接面向產(chǎn)業(yè),更聚焦應(yīng)用,強(qiáng)調(diào)幫助企業(yè)進(jìn)行生產(chǎn)活動(dòng)和降本增效能力的工具。從定位和特點(diǎn)上講,行業(yè)大模型更類似于我們所熟悉的企業(yè)服務(wù)軟件或工業(yè)軟件,只不過(guò)現(xiàn)在升級(jí)成行業(yè)AI了。
目前,針對(duì)金融、醫(yī)療、政務(wù)及公共服務(wù)、科研、工業(yè)、客服等領(lǐng)域服務(wù)的大模型數(shù)量相對(duì)較多。地域分布上,北京占了半壁江山,其次是上海、廣深、杭州和江蘇。
毫無(wú)疑問(wèn),這一輪AI大模型的發(fā)展已經(jīng)形成了明確的產(chǎn)業(yè)趨勢(shì)。而根據(jù)這些大模型背后的研發(fā)團(tuán)隊(duì)來(lái)看,也可以分為三類:
一是大廠自研。百度的文心一言,阿里的通義千問(wèn),華為的盤古,騰訊的混元,京東的言犀,字節(jié)的火山方舟,螞蟻集團(tuán)的貞儀,小米的MiLM-6B等等……都可算作此列。
互聯(lián)網(wǎng)浪潮里成長(zhǎng)起來(lái)的科技大廠,包括軟硬件廠商,即便暫時(shí)還沒(méi)有,但也不可能永遠(yuǎn)都不在大模型領(lǐng)域進(jìn)行布局。還有通信業(yè)三巨頭,移動(dòng)、聯(lián)通、電信都有自研大模型。很多大廠和巨頭出于自身的數(shù)據(jù)安全需求,只能走自研路線,這些廠商一遍要根據(jù)自身業(yè)務(wù)協(xié)同出發(fā)進(jìn)行相關(guān)研發(fā),另一邊也可以選擇直接收購(gòu)。而收購(gòu)的標(biāo)的,則主要來(lái)源于下面的第二類。
二是獨(dú)立創(chuàng)業(yè)團(tuán)隊(duì)。其中不乏頗具技術(shù)實(shí)力的明星創(chuàng)業(yè)者入局,還有一些是已經(jīng)功成名就過(guò)的大廠背景連續(xù)創(chuàng)業(yè)者。比如搜狗創(chuàng)始人王小川,就在五道口的搜狐大廈二層對(duì)外官宣了“百川智能”。官宣的時(shí)間是2023年4月10日,如果你同時(shí)有王小川和王慧文的微信,就會(huì)發(fā)現(xiàn)僅僅四天之前,王慧文也在搜狐網(wǎng)絡(luò)大廈,他創(chuàng)辦的AI企業(yè)光年之外的新辦公室就在這里,搬進(jìn)來(lái)的第一天他發(fā)了一條朋友圈:“新辦公室第一天,切個(gè)蛋糕?!?/span>
王小川的人工智能夢(mèng)想大約萌芽于成都七中,他16歲參與老師謝晉超和當(dāng)時(shí)中科院成都所的張景中一起組建的“幾何定理機(jī)器證明課題研究組”,做成了在計(jì)算機(jī)用吳文俊消元法實(shí)現(xiàn)初等幾何定理的全部機(jī)器證明,拿了“億利達(dá)青少年發(fā)明獎(jiǎng)”,獎(jiǎng)項(xiàng)發(fā)起人和最后給王小川頒獎(jiǎng)的人,都是楊振寧。而王小川做成的這個(gè)證明,所涉及的是中國(guó)人工智能領(lǐng)域最重要的基礎(chǔ)理論之一,他可能是如今功成名后再出發(fā)的企業(yè)家中,離人工智能學(xué)院派們幾乎最近的一個(gè)“技術(shù)流”了,百川智能的背后也有著清華一脈力度不小的支持。
三就是學(xué)院派,無(wú)論是科研院所還是各大高校,都不可能不做這方面的研究,但這些團(tuán)隊(duì)的組織構(gòu)成和戰(zhàn)略目標(biāo)大多更偏學(xué)術(shù)一些,偏向應(yīng)用層面的則大多還會(huì)找大廠或其他創(chuàng)業(yè)團(tuán)隊(duì)進(jìn)行合作。其中比較引人注目的,比如今年初復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院團(tuán)隊(duì)發(fā)布的MOSS大模型,清華的ChatGLM,還有中科院自動(dòng)化所的紫東·太初。
大模型爆火滿打滿算也就不到一年,但噼里啪啦出了一百多個(gè)團(tuán)隊(duì),百模大戰(zhàn)已經(jīng)擺在臺(tái)面上了,即使遠(yuǎn)沒(méi)有當(dāng)初“百團(tuán)大戰(zhàn)”那么搞得沸反盈天,但也已經(jīng)足夠讓有些人產(chǎn)生忐忑甚至不滿。
中國(guó)人這些年見(jiàn)了太多狂飆之后的落寞與一地雞毛,多少有點(diǎn)PTSD。但站在一個(gè)產(chǎn)業(yè)觀察者的角度來(lái)說(shuō),一個(gè)殘酷的事實(shí)是,任何國(guó)家的產(chǎn)業(yè)的競(jìng)爭(zhēng)力從來(lái)就是這么跑出來(lái)的,沒(méi)有這樣雨后春筍般冒出來(lái)的企業(yè)和密集的投資,哪里來(lái)的產(chǎn)業(yè)崛起和龍頭騰飛?
往近了說(shuō),中國(guó)新能源汽車產(chǎn)業(yè)能有今天的成就,不知道埋了多少當(dāng)年的“造車新勢(shì)力”,中國(guó)手機(jī)產(chǎn)業(yè)的騰飛也不知道一路死掉多少山寨機(jī)。而往遠(yuǎn)了說(shuō),美國(guó)半導(dǎo)體產(chǎn)業(yè)浮沉小一百年,也絕對(duì)算得上一將功成萬(wàn)骨枯。
任何產(chǎn)業(yè)想發(fā)展起來(lái),最初的起點(diǎn)都是拿錢與人去堆,才留得下技術(shù)、經(jīng)驗(yàn),和足以支撐起一個(gè)行業(yè)的人才。百模大戰(zhàn)能打起來(lái),本身就已經(jīng)是中國(guó)AI大模型競(jìng)爭(zhēng)力的一種體現(xiàn),如今中美兩國(guó)大模型公司加起來(lái)占了全球的80%還要多,絕大部分國(guó)家甚至已經(jīng)沒(méi)有資格坐上這個(gè)牌桌。
巨頭的游戲
AI大模型的創(chuàng)業(yè)團(tuán)隊(duì)很多,但大多數(shù)可能留不下來(lái)。
——絕大多數(shù)人做出這個(gè)判斷的原因在于成本。國(guó)盛證券曾經(jīng)估算,GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的LLM模型,訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。
按照今年1月的平均用戶訪問(wèn)量計(jì)算,每天約有1300萬(wàn)獨(dú)立訪客使用ChatGPT,對(duì)應(yīng)的芯片需求大約是3萬(wàn)多塊英偉達(dá)A100,僅這一項(xiàng)的初始投入成本就要8億美元,每天光電費(fèi)至少5萬(wàn)美元左右。而根據(jù)Analytics India Magazine的一份報(bào)告估算,ChatGPT的單日運(yùn)營(yíng)成本大約是70萬(wàn)美元。
意思就是小公司根本燒不起這個(gè)錢。
而另外一個(gè)障礙是,小公司在產(chǎn)業(yè)化落地上能走的路也更少。
大模型的商業(yè)化終點(diǎn)是產(chǎn)業(yè),這是已經(jīng)不必過(guò)多解釋的行業(yè)共識(shí)。但落入產(chǎn)業(yè)的條件是:
1、本身自己有產(chǎn)業(yè)資源;
第一種,本身自己有產(chǎn)業(yè)資源。主要是通過(guò)將AI能力融入自身業(yè)務(wù),進(jìn)而影響產(chǎn)業(yè)上下游。
比如京東做言犀,側(cè)重的就是零售、金融和供應(yīng)鏈物流,這些都是典型的京東自有業(yè)務(wù),做出來(lái)直接有測(cè)試場(chǎng)景和落地應(yīng)用的空間,根本不用假手于人,而且還能向上下游輻射拓展第一批種子用戶。螞蟻集團(tuán)的“貞儀”和百度金融旗下的“軒轅”,也是類似邏輯。(恒生電子的LightGPT,學(xué)而思的MathGPT)
同理的還有網(wǎng)易有道的子曰,直接落地落到教育口,甚至還能配套自有硬件,比如有道的詞典筆。攜程的問(wèn)道,閱文的妙筆,用友的YonGPT,這些在各自領(lǐng)域舉足輕重的垂類巨頭親自下場(chǎng)做閉源大模型,從戰(zhàn)略上來(lái)講進(jìn)可攻退可守,先期的獲客、訓(xùn)練成本,適配、調(diào)整效率,都有顯而易見(jiàn)的優(yōu)勢(shì)。
怎么都比小公司吭哧吭哧做出來(lái)個(gè)普適款的大模型,再吭哧吭哧追在產(chǎn)業(yè)后面玩命推銷,然后一點(diǎn)一點(diǎn)做產(chǎn)業(yè)接入和適配的模式,要省力氣得多。
第二種,掌握著可以觸達(dá)產(chǎn)業(yè)資源的平臺(tái)接口或渠道。這種模式基本上是將AI大模型接入自身平臺(tái),讓平臺(tái)獲取AI能力后,能夠更好地服務(wù)原有的產(chǎn)業(yè)端客戶。
這里最典型的,軟件層面比如阿里釘釘搭載的通義千問(wèn),字節(jié)跳動(dòng)未來(lái)要做的火山方舟;而硬件層面則比如華為要接入工業(yè)系統(tǒng)和整個(gè)鴻蒙的盤古系列,還有小米初具雛形的MiLM-6B等等。
阿里“通義千問(wèn)”目前推得最順利領(lǐng)域之一,就是在釘釘中的應(yīng)用。釘釘本身就是做企業(yè)服務(wù)的平臺(tái),產(chǎn)品架構(gòu)的底層邏輯就是建立在公司和組織層面上的,而且一直都在做深入產(chǎn)業(yè)的工作,安全性也已經(jīng)得到過(guò)驗(yàn)證。這意味著,通義千問(wèn)接入后,可以從最底層調(diào)動(dòng)原始數(shù)據(jù)幫助決策者進(jìn)行定制化的分析和總結(jié)。
這種本身就有企業(yè)服務(wù)平臺(tái)的公司,接入AI大模型之后,是最有可能幫助實(shí)現(xiàn)企業(yè)內(nèi)部AGI的。而目前國(guó)內(nèi)做這個(gè)且有平臺(tái)級(jí)能力的,除了阿里的釘釘,就是字節(jié)跳動(dòng)的飛書(shū),還有騰訊的系列套件,二級(jí)梯隊(duì)可能是以WPS為主要產(chǎn)品的金山辦公,或者筆記軟件有道云或印象筆記等。
當(dāng)然還有一個(gè)比較特殊的百度,這家公司雖然有很強(qiáng)的技術(shù)實(shí)力,但因?yàn)槿肟谠谒阉?,所以?jīng)常卡在To C和To B的中間,自身缺少殺手級(jí)別的企業(yè)應(yīng)用。這也就能理解為什么在ChatGPT爆火后,百度要那么著急發(fā)布文心系列——不是很多人以為的什么追趕進(jìn)度,而是極其現(xiàn)實(shí)的:為了搶市場(chǎng)。
百度沒(méi)有釘釘,沒(méi)有飛書(shū),也沒(méi)有微信或者WPS。但有意思的是,百度除了搜索之外,還會(huì)有車和智能交通配套系統(tǒng)。
這剛好就是我們要說(shuō)第二種模式:直接從硬件切入。
汽車領(lǐng)域,集度在2月份就已經(jīng)宣布接入百度文心一言,理想6月在常州發(fā)布了自家研發(fā)的認(rèn)知大模型'Mind GPT',問(wèn)界未來(lái)介入華為旗下的盤古,大體上也都是時(shí)間問(wèn)題。傳統(tǒng)各大廠商未必自己完全走自研的路,但不可能不做,這也是一個(gè)AI大模型廠商們的兵家必爭(zhēng)之地。
各大手機(jī)廠商也顯然都不會(huì)缺席。華為已經(jīng)接入了盤古,小米也已經(jīng)發(fā)布了MiLM-6B,OV和榮耀雖然目前還沒(méi)有落地的大模型,但也都已經(jīng)進(jìn)行了大量布局,將AI接入自身手機(jī)系統(tǒng)做智能化升級(jí),都只是時(shí)間問(wèn)題。
當(dāng)然,華為更特殊一點(diǎn),盤古系列是鴻蒙的最佳拍檔,但鴻蒙卻不只為了華為手機(jī)而生。華為在工業(yè)和基礎(chǔ)設(shè)施領(lǐng)域的布局,未來(lái)都將會(huì)成為鴻蒙+盤古的主場(chǎng)。
無(wú)論是從成本,還是從產(chǎn)業(yè)資源上看,AI大模型這個(gè)智能時(shí)代的底層支持領(lǐng)域,都已經(jīng)越來(lái)越趨向于巨頭們的游戲,留給小團(tuán)隊(duì)和獨(dú)立創(chuàng)業(yè)公司們的機(jī)會(huì)雖然不是沒(méi)有,但確實(shí)已經(jīng)越來(lái)越少,而抓住機(jī)會(huì)也正在變得越來(lái)越難。
中國(guó)人最擅長(zhǎng)的“應(yīng)用層戰(zhàn)爭(zhēng)”
固然牌桌上只剩下了中美兩國(guó),但中美之間依然存在著明顯的差距。星海一直以來(lái)經(jīng)常會(huì)被問(wèn)的一個(gè)問(wèn)題是:在這個(gè)領(lǐng)域,我們和全世界最先進(jìn)的水平差幾年?
在AI大模型上,這個(gè)問(wèn)題李彥宏和王小川都回答過(guò)。李彥宏說(shuō)文心一言和OpenAI差距大概是兩個(gè)月,王小川挺震驚,說(shuō)那你們問(wèn)的應(yīng)該是平行宇宙的李彥宏,不是我們這個(gè)世界的。
記者問(wèn)此話怎講,王小川:“那怎么可能只差兩個(gè)月???那一定是另一個(gè)宇宙嘛?!?/span>
在王小川概念里,如果要用時(shí)間衡量,OpenAI比國(guó)內(nèi)應(yīng)該領(lǐng)先三年的時(shí)間。之前業(yè)內(nèi)都說(shuō)追上GPT-3.5可能需要一年時(shí)間,但人家已經(jīng)到4了,還有5在訓(xùn)練,所以他覺(jué)得有三年。如果大家很努力,那可能會(huì)短一點(diǎn)。
但應(yīng)用層不一樣。
王小川六月去硅谷轉(zhuǎn)了一圈,去之前,他想的是,中國(guó)AI大模型已經(jīng)在追求“理想”的道路上比OpenAI慢了半步,但落地他想要比美國(guó)人快上半步。但交流完回來(lái),他的想法就變了:落地這事,王小川覺(jué)得能比對(duì)方快三步。
王小川去硅谷的時(shí)候發(fā)現(xiàn),那幫子不差錢的工程師已經(jīng)在研究怎么把1000萬(wàn)塊GPU聯(lián)在一塊做模型架構(gòu)了,但英偉達(dá)一年才生產(chǎn)100萬(wàn)塊GPU……
而反面是,雖然工程師文化濃厚,但美國(guó)有大量工程師沒(méi)有任何應(yīng)用的經(jīng)驗(yàn),一旦從做技術(shù)延展到做應(yīng)用,“能力實(shí)在不咋樣”。
大模型是一個(gè)必須落向應(yīng)用,但卻又沒(méi)有辦法做完服務(wù)用戶最后一步的綜合性工程,而在這個(gè)領(lǐng)域,落到應(yīng)用層之后的應(yīng)用反饋,常常會(huì)是比空中樓閣式干數(shù)據(jù)訓(xùn)練更好用的東西。在《TikTok大劫案:美國(guó)總統(tǒng)也搶不走的武功絕學(xué)到底是什么?》一文中,我們講Tiktok核心競(jìng)爭(zhēng)力的時(shí)候講過(guò)一個(gè)類似原理:當(dāng)有效數(shù)據(jù)量到達(dá)一定臨界值的時(shí)候,將會(huì)無(wú)限拉近不同算法帶來(lái)的準(zhǔn)確率差距。
也就是說(shuō),應(yīng)用層的反饋,某種程度上會(huì)決定模型訓(xùn)練的質(zhì)量。讓訓(xùn)練變得更加高效,同時(shí)大幅削減訓(xùn)練成本。我們可能起步晚,但應(yīng)用能做起來(lái),我們會(huì)跑得更快。
在《大國(guó)鎖鑰》一書(shū)中,我寫(xiě)過(guò)中國(guó)互聯(lián)網(wǎng)為什么能做到全球領(lǐng)先,其核心的動(dòng)能就是應(yīng)用過(guò)程中所爆發(fā)出來(lái)的大量創(chuàng)新和經(jīng)濟(jì)效益,反哺了基礎(chǔ)層研究所需要的資金和資源,一點(diǎn)點(diǎn)補(bǔ)全了很多我們?cè)?0年前,甚至100年前就已經(jīng)落下的功課。
AI是一個(gè)同樣適用的領(lǐng)域。
在美國(guó),微軟(OpenAI)、Google、Meta的巨頭之戰(zhàn),基本上已經(jīng)將通用模型層的格局固定了下來(lái),幾乎沒(méi)有創(chuàng)業(yè)公司會(huì)選擇“再造一個(gè)OpenAI”。轉(zhuǎn)而興起的是如火如荼的應(yīng)用層創(chuàng)業(yè),通用層、應(yīng)用層之間涇渭分明。
但在中國(guó),通用模型層的百模大戰(zhàn)還遠(yuǎn)沒(méi)有分出勝負(fù),從效果上誰(shuí)也沒(méi)有做出決定性的優(yōu)勢(shì),但隨之而來(lái)的是對(duì)應(yīng)用形式的大量創(chuàng)新探索。本身就在AI垂直領(lǐng)域做通用模型開(kāi)發(fā)的廠商,如科大訊飛,也在做出通用模型后很快就發(fā)布了訊飛星火app去切入學(xué)習(xí)和辦公場(chǎng)景。
這種通用層和應(yīng)用層相互哺育的模式,是中國(guó)獨(dú)特的發(fā)展模式,也是中國(guó)未來(lái)最大的機(jī)會(huì)所在。
結(jié)語(yǔ)
輿論場(chǎng)上面對(duì)中國(guó)如今打得不可開(kāi)交的百模大戰(zhàn),有過(guò)很多不好的聲音,其中一種是,OpenAI已經(jīng)做出ChatGPT-4了,中國(guó)公司現(xiàn)在還在通用層大模型上卷來(lái)卷去早就晚了??瓷先フf(shuō)了大實(shí)話,但其實(shí)很可笑:中國(guó)人什么時(shí)候怕過(guò)起步晚了人家?guī)撞侥??美?guó)人早就把核彈造出來(lái)了,中國(guó)就不造了嗎?
在AI這件事上,早或者晚其實(shí)已經(jīng)沒(méi)那么重要了,重要的是我們必須得做。自認(rèn)大模型技術(shù)水平存在差距的王小川被問(wèn)到:起步晚了的中國(guó)還有沒(méi)有彎道超車的機(jī)會(huì)?
他的回答是:“超車我們現(xiàn)在不敢提,可能過(guò)幾年后大家會(huì)找到路徑。就像互聯(lián)網(wǎng)剛開(kāi)始的時(shí)候,我們上來(lái)第一句話,就說(shuō)要彎道超車嗎?”
路要一步步走,中國(guó)廠商的AI之路,最重要的是先做自己能做到的事情。
活下來(lái),然后——
追上去。
聯(lián)系客服