沒有人能預見未來,但我們可以因循常識,去捕捉技術創(chuàng)新演進的節(jié)奏韻腳。
2023年最火的風口莫過于大模型。
2022年底,由美國初創(chuàng)企業(yè)OpenAI開發(fā)的聊天應用ChatGPT引爆市場,生成式AI成為科技市場熱點,ChatGPT背后是深度學習大模型,其理解和生成文字的能力超過以往AI產品。
全球主要云計算公司加入其中,爭奪算力、下場開發(fā)和銷售大模型,云計算市場迎來新一輪競爭熱潮,覆蓋AI計算所需的算力、算法、數(shù)據(jù)各層面。
如今,大模型這把火已經從自然語言燒到千行百業(yè)。相較于花力氣讓大模型更流暢地應對各種刁鉆問題,MaaS正成為AI大模型比拼的重點。
通常來說,一家企業(yè)想要搭建行業(yè)大模型,有幾個環(huán)節(jié)必不可少:挑選適合自己使用場景的模型,使用云廠商專業(yè)工具搭建一體化模型服務,梳理測試用例、建立服務質量評估流程,確保數(shù)據(jù)及模型應用安全、合規(guī)和可控。
而企業(yè)想要在實際業(yè)務場景中部署使用大模型服務,則面臨著成本、數(shù)據(jù)和安全等諸多落地難題。
首先,計算資源少。大模型需要比較高的計算資源和存儲資源。與一般服務器相比,GPU服務器的穩(wěn)定性比較低,大模型訓練需要的GPU經常達到上千張卡。
同時,在訓練集群里,連接幾百臺GPU服務器所需要的網絡速度極高,一旦網絡產生擁堵,就會影響訓練效率。所以很多算法團隊傾向于選擇專業(yè)的云服務廠商進行云服務運維支持。
其次,數(shù)據(jù)質量比較差。
搭建大模型本身就是一項成本極高的系統(tǒng)工程,需要大量的高質量數(shù)據(jù)進行訓練和優(yōu)化,還需要經過清洗和預處理,以消除噪聲、填補缺失值并確保數(shù)據(jù)質量。如果導入的數(shù)據(jù)質量低,那訓練出來的模型也會有問題。
第三,投入成本高,這也是大模型落地面臨的主要困難之一。大模型需要投入大量的數(shù)據(jù)、計算資源、專業(yè)技術和時間來訓練、調試、優(yōu)化并部署實施。
第四,專業(yè)經驗少。大模型的開發(fā)落地需要比較多的技術和人力資源,部署大模型需要考慮到計算資源、網絡帶寬和安全性等多方面問題,很多企業(yè)比較缺乏相關技術和人才,導致大模型無法順利落地應用。
從形式上看,MaaS是典型的云智一體。所謂“云智一體”,是三年前百度智能云在戰(zhàn)略發(fā)布中提出的理念,通過云計算和人工智能融合創(chuàng)新,把算力、框架、模型,場景應用打造成標準化產品,進而降低企業(yè)獲取和使用人工智能的門檻。
百度、阿里乃至更多云計算企業(yè),如今將目光投向“云智一體”,印證了AI應用能力是云計算產業(yè)基礎設施成熟后的核心能力。這種能力更在于“智”的水平,在智能基礎設施之上的通用型AI產品能力。
從云計算服務范式看,大模型的迭代升級也重塑了傳統(tǒng)的云計算服務。以往,云計算更專注算力能力,服務模型集中在IaaS、PaaS、SaaS三層;如今,云計算在大模型驅動下具備了更強的集成能力,在算力、算法和應用層中嵌入大模型,進而強化云計算的“智”,以智能底座集成應用并統(tǒng)一對外輸出,實現(xiàn)場景端的生產力解放。
雖然MaaS目前針對的場景還處在基于自然語言處理(NLP)的領域,但是隨著技術的迭代,遵循其核心思想進行延展,廣義的MaaS恰恰有可能針對上述的難點,發(fā)揮重要作用。
在數(shù)據(jù)清洗和整合方面,MaaS可以幫助企業(yè)將來自不同系統(tǒng)和部門的數(shù)據(jù)進行清洗、整合和轉換,形成完整、可靠的數(shù)據(jù)集。
通過將來自不同部門的數(shù)據(jù)整合到一個數(shù)據(jù)倉庫中,MaaS可以確保數(shù)據(jù)的完整性和一致性。此外,MaaS還可以對海量數(shù)據(jù)進行自動化處理和分析,快速發(fā)現(xiàn)業(yè)務的異常情況和趨勢變化。
在數(shù)據(jù)分析和挖掘方面,MaaS可以對業(yè)務數(shù)據(jù)進行分析和挖掘,從中發(fā)現(xiàn)業(yè)務之間的關聯(lián)和規(guī)律,為企業(yè)提供更全面、準確的財務數(shù)據(jù),并支持更好的決策和管理。
例如,當企業(yè)需要進行銷售訂單和庫存的分析時,MaaS需要輸入銷售訂單和庫存數(shù)據(jù),這些數(shù)據(jù)可以來自企業(yè)的不同部門,比如銷售部門、庫存管理部門等。之后,MaaS會使用NLP技術自動化處理和分析這些數(shù)據(jù),例如,識別和分類訂單的狀態(tài)、計算庫存周轉率等。
在數(shù)據(jù)處理的過程中,MaaS會快速發(fā)現(xiàn)業(yè)務的異常情況和趨勢變化,如訂單的滯銷和庫存的積壓等。
在智能化決策支持方面,MaaS可以為企業(yè)提供智能化的決策支持,通過機器學習模型預測未來的業(yè)務走勢和財務狀況,幫助企業(yè)做出更明智的決策。
MaaS會將分析結果轉化為易于理解和操作的報告和圖表,并提供定制化的業(yè)務解決方案。企業(yè)可以根據(jù)自身的業(yè)務需求和數(shù)據(jù)特點,選擇不同的機器學習模型和數(shù)據(jù)處理算法,以實現(xiàn)更智能化、個性化的業(yè)務流程。
阿里云CTO周靖人在今年5月的中關村會議上也提出,MaaS概念正在被廣泛接受,模型會作為業(yè)務和開發(fā)系統(tǒng)開發(fā)的重要生產元素。
這背后,AI一直背負著商業(yè)化這個難題。而B端市場近年來越發(fā)成為互聯(lián)網大廠的增量市場。
5月,騰訊發(fā)布的今年一季度財報顯示,當期其營收1500億元,同比增長11%;凈利潤258.4億元,同比增長10%。
凈利潤(Non-IFRS)325.38億元,同比增長27%。其中,身處B端市場的金融科技與企業(yè)服務板塊今年一季度營收同比增長14%達到487億元。據(jù)記者了解,該板塊已連續(xù)八個季度在騰訊總收入中占比超過30%。
而此前各家云業(yè)務紛紛下調價格,不僅體現(xiàn)了B端業(yè)務的激烈競爭,在某種程度上也提現(xiàn)了大模型的開發(fā)對B端業(yè)務成本的影響。
張勇曾表示,未來希望在阿里云上訓練一個模型的成本,能夠降低到現(xiàn)在的十分之一,甚至是百分之一。即使是中小企業(yè),也能通過云平臺獲得AI大模型的能力和服務。
目前,行業(yè)大模型的前景有賴于行業(yè)大模型的技術成熟度,大家的競爭點主要集中在行業(yè)數(shù)據(jù)源。行業(yè)不同,所形成的語料不同。廠商所在的優(yōu)勢行業(yè),能夠形成訓練AI所需要的語料庫,越完備的語料,意味著越有優(yōu)勢的AI產品。
同時,在大模型這一賽道上,從來就不是“后來者居上”。只有越豐富的供應,才能帶來越多的客戶;更多的客戶,才能在數(shù)據(jù)反饋中幫助精進和迭代,從而產生“飛輪效應”。
如長期在機器學習模型有積累的社區(qū)Hugging Face,就基于社區(qū)已有的開源模型推出了HuggingGPT,以一個大模型調用多個AI模型的方式,迅速將長期積累的模型生態(tài)轉變成更大的行業(yè)影響力。
這個階段開始,生態(tài)的作用就會顯現(xiàn)。而這也是為什么構建一個生態(tài),決定了MaaS的高度。但無論處在哪個階段,最核心的是,大模型依然是一個成本高昂的新事物。
不論在研發(fā)、迭代還是使用階段,大模型都是一個消耗資源巨大、使用成本也不低的“奢侈品”。
所以只有構建一個生態(tài),才能真正通過規(guī)模效應降低成本、幫助迭代精進,最后實現(xiàn)大模型和MaaS真正的商業(yè)可持續(xù),這更需要生態(tài)。所以真正重視大模型,真正重視MaaS的玩家,一定會不遺余力打造生態(tài)。
在MaaS新范式的游戲規(guī)則中,大模型決定了一開始走多快,生態(tài)決定了最后走多遠。
聯(lián)系客服