毫無疑問,AI大模型是真的火了。
自ChatGPT爆火出圈以來,AI大模型的熱度也持續(xù)升溫,不少企業(yè)紛紛迅速跟風入局,布局AI大模型領(lǐng)域,試圖抓住這一發(fā)展新機遇。國內(nèi)的AI大模型領(lǐng)域熱度同樣居高不下,各路玩家相繼下場,或是推出了自家的AI大模型產(chǎn)品,或是宣布了探索AI大模型領(lǐng)域的計劃和消息。在一眾布局AI大模型領(lǐng)域的玩家中,自是少不了互聯(lián)網(wǎng)大廠的參與。
AI大模型爆火
隨著AI大模型的火熱,國內(nèi)也掀起了一波AI熱潮,越來越多的企業(yè)都參與其中。各路玩家的爭相入場,更是為熱度本就很高的AI大模型添了一把火。而AI大模型之所以如此火熱,也并非毫無緣由。
一來,數(shù)據(jù)量的持續(xù)增多,為AI大模型的發(fā)展提供了可能性。隨著信息化、數(shù)字化轉(zhuǎn)型進程的加快,越來越多數(shù)據(jù)涌現(xiàn)出來。據(jù)IDC統(tǒng)計,中國數(shù)據(jù)規(guī)模將從2021年的18.51ZB增長至2026年的56.16ZB,年均增長速度CAGR為24.9%,增速位居全球第一。數(shù)據(jù)是人工智能發(fā)展的關(guān)鍵,并且AI大模型的訓(xùn)練也離不開海量的數(shù)據(jù)支撐。而數(shù)據(jù)量的持續(xù)擴大以及高速增長,為AI大模型的充分訓(xùn)練提供了豐富素材,助推了AI大模型的興起。
二來,AI大模型正在急速發(fā)展,企業(yè)入局能夠獲得更大的發(fā)展空間。最近一段時間,AI大模型不僅沒有降溫,反而是持續(xù)升溫。據(jù)了解,IDC對基于大模型的AI市場規(guī)模進行了預(yù)測,預(yù)計中國人工智能市場規(guī)模在2023年將超過147億美元,到2026年這一規(guī)模將超過263億美元。由數(shù)據(jù)可知,AI大模型擁有廣闊的發(fā)展前景,倘若企業(yè)入局的話,也有可能乘著這股風,尋找到新的增長機遇,故而企業(yè)會爭相入局也在意料之中。
三來,玩家間的AI大模型競賽,進一步促進了AI大模型賽道的發(fā)展。前文曾提到越來越多企業(yè)都加入了這場AI大模型的競賽中,而AI大模型具備內(nèi)容生成等諸多能力。倘若AI大模型逐漸應(yīng)用到具體場景中,有望為之帶來新的發(fā)展動能。因此,無論是出于提升自家業(yè)務(wù)想象空間的考量,還是為了達到防御目的,AI大模型正逐漸成為各路玩家競爭的對象,這也同樣反過來加快了AI大模型的發(fā)展。
百度先人一步
布局AI大模型領(lǐng)域的玩家類型各異,互聯(lián)網(wǎng)廠商的身影也是頻頻浮現(xiàn)。其中,百度應(yīng)該是國內(nèi)最先推出AI大模型產(chǎn)品的企業(yè)了。今年3月16日,百度正式推出了國內(nèi)首款新一代大語言模型、生成式AI產(chǎn)品——文心一言。而百度之所以能夠率先擠進AI大模型賽場,則與多方面因素有關(guān)。
首先,百度在AI相關(guān)領(lǐng)域深耕多年所積累下來的技術(shù)沉淀,為其推出AI大模型奠定了基礎(chǔ)。眾所周知,百度在很早的時候就喊出了All in AI的口號,并且長期圍繞著AI進行技術(shù)研發(fā)投入。得益于在人工智能領(lǐng)域的長期投入,百度在深度學習、自然語言處理等諸多領(lǐng)域積累了相當深厚的技術(shù)優(yōu)勢。據(jù)悉,目前百度是全球唯一一家在人工智能四層架構(gòu),也就是“芯片層、框架層、模型層、應(yīng)用層”有著全棧布局的公司。而百度AI全棧布局,使其能夠?qū)崿F(xiàn)端到端的優(yōu)化,提升AI大模型的訓(xùn)練效率。
另據(jù)《中國人工智能專利技術(shù)分析報告(2022)》報告顯示,百度AI專利申請量為16754件,AI專利授權(quán)量為5705件,AI專利申請和授予量連續(xù)五年全國第一。由此可見,百度的人工智能技術(shù)實力不容小覷,這多年來所積累的強大的AI技術(shù)實力,也成為了百度推出率先AI大模型產(chǎn)品的重要驅(qū)動器。
其次,百度擁有海量的數(shù)據(jù)資源,能夠支撐其AI大模型產(chǎn)品的訓(xùn)練與迭代。數(shù)據(jù)可以說是AI大模型的基礎(chǔ),重要性自是不言而喻。只有以充足的訓(xùn)練數(shù)據(jù)為支撐,才能不斷提升大模型的能力和準確性。百度作為互聯(lián)網(wǎng)大廠,構(gòu)建了包含百度APP、百度知道、百度地圖等在內(nèi)的完善的產(chǎn)品矩陣,積累下來了海量數(shù)據(jù)資源。
這些海量數(shù)據(jù)積累能夠讓百度對AI大模型進行訓(xùn)練,持續(xù)提升AI大模型的理解能力。據(jù)百度官方表示,文心一言大模型的訓(xùn)練數(shù)據(jù)就包括了萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等。
阿里極速前進
除了百度之外,阿里也加入了AI大模型的戰(zhàn)局之中。在今年4月11日的阿里云峰會上,阿里云智能首席技術(shù)官周靖人正式宣布推出大語言模型“通義千問”。不久后的6月1日,阿里云對外公布了通義大模型的最新進展,聚焦音視頻內(nèi)容的AI新品“通義聽悟”正式上線??梢哉f,阿里在AI大模型領(lǐng)域的進展絲毫不慢。而在阿里發(fā)力AI大模型領(lǐng)域、推出大模型應(yīng)用產(chǎn)品背后,則離不開其自身強大的實力。
一是,阿里很早就開始研究大模型,其推出AI大模型是水到渠成之事。事實上,早在ChatGPT產(chǎn)品火爆出圈之前,阿里就已經(jīng)在AI大模型領(lǐng)域有所布局了。據(jù)了解,阿里在2020年初就已經(jīng)啟動中文多模態(tài)預(yù)訓(xùn)練模型M6項目了,并在同年6月推出了3億參數(shù)的基礎(chǔ)模型;2021年5月,具有萬億參數(shù)規(guī)模的模型正式投入使用??梢?,阿里在AI大模型領(lǐng)域探索已久,而這些經(jīng)驗和數(shù)據(jù)對于阿里推出AI大模型起到了積極的助推作用。
二是,阿里的算力優(yōu)勢,為其AI大模型的研發(fā)提供了重要支持。除了數(shù)據(jù)資源之外,AI大模型的訓(xùn)練還需要巨大的算力。阿里則在云計算領(lǐng)域深耕多年,構(gòu)建了強大的算力體系。
三是,阿里的豐富的業(yè)務(wù)場景,能夠加速AI大模型的落地進程。對于所有技術(shù)產(chǎn)品來說,落地是相當重要的一環(huán)。在AI大模型熱潮來襲之后,AI大模型往何處落地也成為了各方關(guān)注的重點。而阿里則擁有涵蓋電商、辦公等諸多場景的產(chǎn)品及服務(wù),其中不少場景與AI大模型有著極高的匹配度。
以智能客服為例,AI大模型的應(yīng)用能夠升級智能客服的智能化程度,提升智能客服的響應(yīng)效率以及服務(wù)質(zhì)量,進一步優(yōu)化消費者體驗。據(jù)悉,阿里旗下的所有產(chǎn)品未來都將接入通義千問進行全面改造。隨著AI大模型逐步在產(chǎn)品中的應(yīng)用,在為產(chǎn)品帶來新的想象空間的同時,也將進一步促進AI大模型的迭代。
騰訊來勢洶洶
AI大模型之勢愈演愈烈,各路玩家紛至沓來,騰訊自然也不會缺席這場盛會。在AI大模型領(lǐng)域布局方面,騰訊也有著自己的規(guī)劃和策略。
一方面,騰訊通過外部投資的方式,持續(xù)擴大自身在AI大模型方面的影響力。不同于其他行業(yè),AI大模型可以說是十分燒錢,尤其是模型越大,需要投入的成本也就越高。而這就對AI大模型領(lǐng)域的參與者提出了較高的資金要求,倘若沒有充足的資金儲備,AI大模型的研發(fā)之路就很難走下去。
騰訊則擔綱了投資人的角色,在AI大模型領(lǐng)域頻頻出手。據(jù)了解,騰訊先后投資了深言科技、MiniMax、光年之外三家國內(nèi)AI大模型初創(chuàng)企業(yè)。騰訊投資AI大模型初創(chuàng)企業(yè),能夠為這些企業(yè)帶去更加充足的資金,使其能夠更好地進行AI大模型產(chǎn)品的研發(fā)。于騰訊自身而言,則能夠進一步擴大自身在AI大模型領(lǐng)域的影響力,同時為后續(xù)的合作埋下伏筆。
另一方面,騰訊也在加緊自研,不斷推進AI大模型業(yè)務(wù)的發(fā)展進程。和其他互聯(lián)網(wǎng)大廠一樣,騰訊在數(shù)據(jù)、算力、資金等諸多方面都有著積累,而這些積累也成為了其自研AI大模型的重要倚仗。事實上,騰訊在AI領(lǐng)域也早有布局。去年4月,騰訊首次對外披露了旗下混元AI大模型的研發(fā)進展。據(jù)悉,混元AI大模型覆蓋了自然語言處理、計算機視覺、多模態(tài)等基礎(chǔ)模型和眾多行業(yè)/領(lǐng)域模型。
不僅如此,騰訊還加大了大模型的基礎(chǔ)設(shè)施投入力度,以為AI大模型爭取更多的發(fā)展機會。前文曾提到算力對AI大模型的重要程度,在此背景下,騰訊也持續(xù)提升算力能力,為AI大模型的發(fā)展鋪路。比如,在今年4月,騰訊云正式發(fā)布了面向大模型訓(xùn)練設(shè)計的新一代HCC高性能計算集群。據(jù)騰訊介紹,實測顯示,該計算集群的整體性能比過去提升了3倍,是國內(nèi)目前性能最強的大模型計算集群。
就目前情況來看,AI大模型的熱度還將持續(xù)一段時間。在“千模大戰(zhàn)”中,百度、阿里、騰訊等互聯(lián)網(wǎng)大廠的一舉一動都可以說是備受關(guān)注。同時,BAT大廠們也在持續(xù)深入布局AI大模型領(lǐng)域,試圖在AI大模型領(lǐng)域率先卡位。總而言之,AI大模型這個風已經(jīng)刮起來了,BAT們也在這條路上加速奔跑。
聯(lián)系客服