騰訊云、騰訊廣告、騰訊會(huì)議、騰訊文檔等超過(guò)50個(gè)騰訊內(nèi)部業(yè)務(wù),已經(jīng)接入混元大模型。
文|鄧詠儀編輯|蘇建勛
封面來(lái)源|IC photo
國(guó)內(nèi)大模型混戰(zhàn)半年,大廠種子選手中的最后一位,終于出列。9月7日,騰訊每年一度的生態(tài)大會(huì)正式召開,大模型當(dāng)仁不讓地成為其中的主角:騰訊發(fā)布了自研的通用大模型“混元”,并且展示一系列應(yīng)用場(chǎng)景。相比其他大廠蜂擁而上,騰訊已經(jīng)讓市場(chǎng)等待得足夠久?!膀v訊到底什么時(shí)候發(fā)大模型?”是這半年來(lái)AI圈里的“天問(wèn)”。而今年5月,馬化騰就在股東會(huì)上表示:“AI是互聯(lián)網(wǎng)百年不遇的機(jī)會(huì)……我們也一樣在埋頭研發(fā),但是并不急于早早做完,把半成品拿出來(lái)展示?!蹦呐碌搅?月,騰訊甚至劍走偏鋒,先于通用大模型,直接拋出了10個(gè)行業(yè),超過(guò)50個(gè)解決方案。這樣的姿態(tài)也延續(xù)到混元的發(fā)布中。混元大模型顯然走實(shí)用派路線。發(fā)布會(huì)中,花哨的數(shù)據(jù)、吸引眼球的演示很少,應(yīng)用場(chǎng)景才是重頭戲——騰訊展示了騰訊云、騰訊廣告、騰訊會(huì)議、騰訊文檔接入混元之后的進(jìn)展。大模型為這些業(yè)務(wù)提升能力,降本增效,再輸出給企業(yè)客戶。企業(yè)還可以通過(guò)API調(diào)用混元,為不同產(chǎn)業(yè)場(chǎng)景構(gòu)建大模型應(yīng)用。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、騰訊云CEO湯道生
而最具代表性的,莫過(guò)于騰訊云CEO湯道生在介紹混元出場(chǎng)時(shí),喊的話是:“混元,正式面向產(chǎn)業(yè)亮相!”這也是此刻的騰訊找到的最好身位。大廠渡寒冬,騰訊是其中“去肥增瘦”執(zhí)行得最為堅(jiān)決的一家。自前年開始,騰訊云就開始調(diào)整業(yè)務(wù)戰(zhàn)略,不做總集,回歸產(chǎn)品,這些努力都頗有成效。去年,生態(tài)伙伴收入占到騰訊云整體收入的三分之一,收入增速是騰訊云的4倍——這也意味著,騰訊在產(chǎn)業(yè)中的落地規(guī)模實(shí)實(shí)在在地?cái)U(kuò)大。
降本增效,本質(zhì)上是要高質(zhì)量發(fā)展,騰訊大模型同樣也會(huì)遵循這一戰(zhàn)略。做To B、面向產(chǎn)業(yè),是目前比較務(wù)實(shí)的落地路徑。
“更成熟、更可靠”
混元大模型在參數(shù)的展示上可以說(shuō)——相當(dāng)樸實(shí)。沒(méi)有狂堆參數(shù)到萬(wàn)億,也沒(méi)有展示打了多少榜,騰訊云只披露了兩個(gè)數(shù)字:超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens。
千億參數(shù)是當(dāng)前做通用大模型廠商的標(biāo)配,而混元的預(yù)訓(xùn)練語(yǔ)料規(guī)模,則和目前最強(qiáng)的開源模型Llama 2持平。“懷胎半年”的騰訊,都做了些什么?“我們?cè)谶@幾個(gè)月之內(nèi),一直在讓大模型在騰訊內(nèi)部的應(yīng)用中磨練,把騰訊重要的、豐富的業(yè)務(wù)場(chǎng)景當(dāng)成'磨刀石’?!彬v訊集團(tuán)副總裁蔣杰表示。慢了半年的騰訊,能占一些做產(chǎn)品的后發(fā)優(yōu)勢(shì),但要吸引如今的企業(yè)客戶,必須從實(shí)用、靠譜上下功夫。因此,“更成熟、更可靠”,是騰訊講大模型時(shí)最強(qiáng)調(diào)的特點(diǎn)。當(dāng)前,業(yè)界大模型在場(chǎng)景中的應(yīng)用依然有限,這主要因?yàn)榇竽P瓦€在不少休閑場(chǎng)景里打轉(zhuǎn)——比如AI生成文字、AI畫畫等等。但要深入到更多產(chǎn)業(yè)的生產(chǎn)環(huán)節(jié),大模型“胡說(shuō)八道”這一點(diǎn),會(huì)成為桎梏。對(duì)此,騰訊在算法層面進(jìn)行了一系列自研創(chuàng)新,提高了模型可靠性和成熟度。比如,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,讓混元大模型的幻覺(jué)相比主流開源大模型降低30%至50%。騰訊自研的“思維鏈”,則讓大模型能夠像人一樣,結(jié)合實(shí)際的應(yīng)用場(chǎng)景進(jìn)行推理和決策。以往大模型因?yàn)閱未翁幚淼男畔⑸伲瑢?dǎo)致模型會(huì)出現(xiàn)“忘記上面討論的是什么問(wèn)題”的情況,但現(xiàn)在,由于騰訊混元編碼位置的優(yōu)化,如今混元也能夠處理更長(zhǎng)的超長(zhǎng)文。
來(lái)源:騰訊而現(xiàn)在站在風(fēng)口浪尖上的AI安全問(wèn)題,騰訊也在通過(guò)算法解決。通過(guò)強(qiáng)化學(xué)習(xí),如今混元已能學(xué)會(huì)識(shí)別很多“陷阱”——比如“如何才能超速駕駛”這類危險(xiǎn)問(wèn)題,混元會(huì)直接拒絕。而在底層支撐模型安全、可靠運(yùn)行的,是騰訊在這幾年間耕耘的一套技術(shù)棧。今年以來(lái),騰訊還發(fā)布了HCC高性能計(jì)算集群、向量數(shù)據(jù)庫(kù)Tencent Cloud VectorDB等大模型基礎(chǔ)設(shè)施,以及Ti平臺(tái)這樣的“AI工具箱”,面向開發(fā)者提供服務(wù)?!拔覀儚淖畹讓拥母咚倬W(wǎng)絡(luò)、服務(wù)器、網(wǎng)卡,到平臺(tái)、模型、算法,都是自研的,這讓后續(xù)迭代過(guò)程加快了?!笔Y杰表示。大廠做大模型,如今自研技術(shù)棧已經(jīng)是標(biāo)配。從百度、阿里、華為到騰訊,各家都會(huì)從最底層的芯片做起,覆蓋框架、模型甚至是開發(fā)運(yùn)維工具等。原因在于,大模型還是個(gè)相當(dāng)新的東西,與之匹配的基礎(chǔ)設(shè)施很稀缺。廠商們?nèi)慷家觯彩菫橐院笤诋a(chǎn)業(yè)落地,讓客戶用起來(lái)做好準(zhǔn)備。
場(chǎng)景為王
表面上看,騰訊混元和前段時(shí)間號(hào)稱“不做詩(shī)”“不聊天”的華為盤古其實(shí)很像。而不同在于,華為的“不聊天”,其實(shí)是因?yàn)橐郧胺e累的政企、產(chǎn)業(yè)客戶已經(jīng)夠華為深耕很久。
但騰訊是線上場(chǎng)景的王者,其主營(yíng)業(yè)務(wù)與C端用戶強(qiáng)相關(guān)——微信、QQ是國(guó)民通訊軟件,而騰訊會(huì)議、騰訊文檔等To B應(yīng)用都有數(shù)億用戶,其直接用戶其實(shí)也是C端。但騰訊暫時(shí)沒(méi)推類似文心一言、通義千問(wèn)之類的的To C聊天機(jī)器人,其實(shí)是因?yàn)樽吡肆硪粭l驗(yàn)證路徑。如今,騰訊內(nèi)部已經(jīng)有包括文檔、會(huì)議、游戲、金融、搜一搜等50個(gè)業(yè)務(wù)接入內(nèi)測(cè)——先從這些國(guó)民應(yīng)用開始驗(yàn)證,已經(jīng)足夠。
接入混元后的騰訊會(huì)議,可自動(dòng)生成會(huì)議摘要“對(duì)于通用大模型來(lái)說(shuō),ChatBot只是一種驗(yàn)證方式而已,可能我們選擇了另外一條?!笔Y杰表示。在做大模型這件事上,騰訊的邏輯和之前做To B的策略別無(wú)二致:先從自家的業(yè)務(wù)需求做起,在內(nèi)部打磨好了,再對(duì)外發(fā)布。騰訊原本有的C端社交應(yīng)用場(chǎng)景,未來(lái)會(huì)是大模型迭代的富礦。
來(lái)源:騰訊目前微信搜一搜正在接入混元進(jìn)行內(nèi)測(cè),To C的AI應(yīng)用也不會(huì)遙遠(yuǎn)了。值得注意的是,騰訊在大會(huì)上演示了”混元小助手”。小助手有著和微信相似的綠色聊天框,安放在小程序里,可以看作是移動(dòng)端AI應(yīng)用的前奏。可以預(yù)見的是,未來(lái)要做大模型落地,產(chǎn)品依然會(huì)是騰訊最重要的抓手。當(dāng)下“不著急”的騰訊,是國(guó)內(nèi)大模型領(lǐng)域主題變遷的切面:無(wú)論是大眾還是業(yè)內(nèi),都已擺脫“趕超ChatGPT”的心態(tài),而是走到更關(guān)心應(yīng)用落地,把大模型用起來(lái)的階段。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。