AI做金融風(fēng)險(xiǎn)評(píng)估,不是基于人的規(guī)則。
文|周鑫雨編輯|蘇建勛來(lái)源|智能涌現(xiàn)(ID:AIEmergence)
封面來(lái)源|PhotoIC
4月14日,千億量化私募巨頭幻方量化公告稱(chēng),將集中資源和力量,投身人工智能技術(shù),成立新的獨(dú)立研究組織,探索AGI(通用人工智能)。當(dāng)幻方量化的公告卷起“AI炒股說(shuō)”之時(shí),兩天天后,幻方量化董事總經(jīng)理陸政哲在朋友圈潑了盆冷水:“我用中文重申一下:AGI不是用來(lái)炒股的,有大得多的用處和大得多的價(jià)值?!弊愿拍钫Q生之初,量化投資就與AI掛了鉤。與人為管理基金產(chǎn)品不同,量化投資仰賴(lài)的是數(shù)學(xué)和統(tǒng)計(jì)模型進(jìn)行預(yù)測(cè)和風(fēng)控,并通過(guò)計(jì)算機(jī)技術(shù)實(shí)現(xiàn)下單交易。對(duì)于量化私募基金而言,準(zhǔn)確性和速度是核心競(jìng)爭(zhēng)力。這也意味著,一家量化私募基金需要在程序化技術(shù)上燒大量的錢(qián)——其一,需要專(zhuān)業(yè)人才搭建效果更優(yōu)的預(yù)測(cè)和風(fēng)控模型,其二,還需要使用處理速度更快的設(shè)備和與交易所服務(wù)器物理距離更近的服務(wù)器,以提升交易速度。當(dāng)“AGI不是用來(lái)炒股的”一句從幻方量化口中說(shuō)出,一方面,我們有理由相信,擁有萬(wàn)張英偉達(dá)A100顯卡儲(chǔ)備的幻方量化具有訓(xùn)練出AGI的資源儲(chǔ)備;但另一方面,在這一輪AI浪潮中,金融領(lǐng)域除了擁抱,別無(wú)選擇。
非AI領(lǐng)域出身的金融機(jī)構(gòu),也能用大模型打仗
翻閱公開(kāi)資料就能發(fā)現(xiàn),高算力是不少量化機(jī)構(gòu)宣傳的重點(diǎn)。比如2022年9月,頭部量化私募基金明汯投資合伙人、投資總監(jiān)解環(huán)宇就在世界人工智能大會(huì)上強(qiáng)調(diào):“2021年,我們自有的高性能計(jì)算集群已經(jīng)位居世界超算排名TOP500榜單前列。預(yù)計(jì)到今年(2022年)底,我們的計(jì)算集群將擁有1500張GPU卡,3萬(wàn)CPU核、1Pb內(nèi)存以及5Pb磁盤(pán)存儲(chǔ),在金融數(shù)據(jù)的應(yīng)用場(chǎng)景下AI算力達(dá)到400P Flops。”重算力的特性與長(zhǎng)期以來(lái)我國(guó)的算力資源較為分散不無(wú)關(guān)系,能夠靠高性能算力集群支撐起模型訓(xùn)練的金融機(jī)構(gòu)更是少之又少。據(jù)《財(cái)經(jīng)十一人》介紹,國(guó)內(nèi)GPU持有量超過(guò)1萬(wàn)張的企業(yè)不超過(guò)5家,即使規(guī)模最大的企業(yè)也不超過(guò)5萬(wàn)枚,而且這里面有不少都是英偉達(dá)中低端數(shù)據(jù)中心芯片。但幻方量化擔(dān)得起金融領(lǐng)域“卡王”之稱(chēng)。作為目前國(guó)內(nèi)唯一公開(kāi)宣稱(chēng)擁有萬(wàn)張英偉達(dá)A100顯卡的企業(yè),幻方量化即便出了金融圈,其算力儲(chǔ)備量在一眾科技公司中也豪不遜色。2019年,幻方量化就成立了AI公司幻方AI。從2020年官方披露的數(shù)據(jù)來(lái)看,幻方AI自研的深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”總投資近2億元,搭載了1100塊GPU。一年后,“螢火二號(hào)”的投入增加到10億元,算力約為“螢火一號(hào)”的18倍,搭載了約1萬(wàn)張英偉達(dá)A100顯卡。數(shù)據(jù)顯示,“螢火二號(hào)”2022年全年運(yùn)行任務(wù)135萬(wàn)個(gè),共計(jì)5674萬(wàn)GPU時(shí)。用于科研支持的閑時(shí)算力高達(dá)1533萬(wàn)GPU時(shí),占比27%。用大算力砸出來(lái)的模型表現(xiàn)也是亮眼的。私募排排網(wǎng)數(shù)據(jù)顯示,幻方量化自成立以來(lái)的累計(jì)收益率為181.63%,年化收益率達(dá)18.02%。截至2023年3月24日,幻方量化旗下管理的具有歷史數(shù)據(jù)的100只基金中,94只均為正收益。大算力固然重要,但多個(gè)案例證明,比起算力,大量高質(zhì)的數(shù)據(jù)是金融垂直領(lǐng)域跑出高性能模型更關(guān)鍵的資源。即便具有豐富的算力儲(chǔ)備,幻方量化仍然發(fā)文表示,數(shù)據(jù)才是Alpha(超額收益)的根本來(lái)源。截至2021年,幻方量化累積的數(shù)據(jù)量超過(guò)了10PB,每天還在從數(shù)十個(gè)不同數(shù)據(jù)源持續(xù)更新。一個(gè)更典型的“薄算力,厚數(shù)據(jù)”的案例則發(fā)生在最近。3月31日,金融商業(yè)咨詢平臺(tái)彭博社(Bloomberg)推出了其為金融界打造的大語(yǔ)言模型BloombergGPT。從官方發(fā)布的技術(shù)細(xì)節(jié)來(lái)看,BloombergGPT的參數(shù)規(guī)模為500億,遠(yuǎn)不到GPT-3 1750億的參數(shù)規(guī)模。在算力上,BloombergGPT在訓(xùn)練中備份了4個(gè)模型,共使用了約512塊內(nèi)存為40GB的A100——這對(duì)于不少頭部金融機(jī)構(gòu)而言,是可復(fù)制的路徑。但官方測(cè)試的結(jié)果顯示,BloombergGPT對(duì)金融任務(wù)的執(zhí)行效果已經(jīng)超過(guò)了現(xiàn)有的通用語(yǔ)言大模型,在通用場(chǎng)景的表現(xiàn)則持平——優(yōu)異表現(xiàn)的根源在于Bloomberg構(gòu)建了目前規(guī)模最大的金融數(shù)據(jù)集FINPILE,其中涵蓋了7000億預(yù)訓(xùn)練數(shù)據(jù)量。
這一案例或許也能將不少機(jī)構(gòu)從“算力焦慮”中解放,優(yōu)質(zhì)開(kāi)源模型底座+優(yōu)質(zhì)垂直領(lǐng)域數(shù)據(jù)的思路,依然可以在垂直領(lǐng)域訓(xùn)練出專(zhuān)精的大模型。
AI代替人炒股,仍在征途
不可否認(rèn)的是,ChatGPT引起的大模型熱潮,對(duì)包括量化在內(nèi)的金融行業(yè)會(huì)產(chǎn)生廣泛的影響。一方面,接入大模型有助于提升投研的效率,以個(gè)人智能助手為應(yīng)用形態(tài)的AI能夠理解分析師和研究員所輸入的信息,并呈現(xiàn)出經(jīng)過(guò)邏輯分析的檢索結(jié)果。另一方面,AI可以通過(guò)基于大量數(shù)據(jù)的深度學(xué)習(xí),輔助人們做出更準(zhǔn)確的投資決策、優(yōu)化交易策略,以及進(jìn)行風(fēng)險(xiǎn)管理。不少業(yè)內(nèi)人士也指出,大模型對(duì)金融領(lǐng)域的重要意義在于超越人有限的思維,站在更高的維度對(duì)行業(yè)進(jìn)行全面的解構(gòu)?!癆I做金融風(fēng)險(xiǎn)評(píng)估,不是基于人的規(guī)則,因?yàn)槿说囊?guī)則容易被破解,需要更高維的AI模型來(lái)做?!彪葱趴萍糃EO朱明杰為36氪舉了個(gè)例子:比如對(duì)交易風(fēng)險(xiǎn)的檢測(cè),銀行每天有上億筆交易,靠專(zhuān)家人力無(wú)法一一審核。而通過(guò)金融數(shù)據(jù)和金融專(zhuān)家經(jīng)驗(yàn)數(shù)據(jù)去訓(xùn)練AI模型,就能夠擁有更多的“專(zhuān)家”。但相對(duì)地,讓AI通過(guò)深度學(xué)習(xí)從而產(chǎn)生超越人的思維能力,在現(xiàn)階段是不少金融機(jī)構(gòu)可望而不可即的圖景。就決定垂直領(lǐng)域模型核心能力的數(shù)據(jù)而言,出于數(shù)據(jù)安全等因素的考慮,不同金融機(jī)構(gòu)之間的數(shù)據(jù)并未打通,這也意味著單一機(jī)構(gòu)的數(shù)據(jù)資源較有限。尤其對(duì)于成立初期、規(guī)模有限的中小型金融機(jī)構(gòu)而言,難以具備構(gòu)建垂直領(lǐng)域模型的能力。另一亟待完善的層面在于算法。朱明杰認(rèn)為,目前ChatGPT有模仿的能力,但本質(zhì)上還是人的思維,沒(méi)有自主創(chuàng)新的能力,很難應(yīng)對(duì)一些黑天鵝事件,“大模型涌現(xiàn)的能力還很有限”。一個(gè)案例是,隨著2020年下半年小票市場(chǎng)行情分化,明汯投資在同年Q4調(diào)整了選股模型,從而存在過(guò)度風(fēng)格暴露(指基金持有的資產(chǎn)在風(fēng)格特征上與某個(gè)特定的市場(chǎng)、指數(shù)或其他資產(chǎn)組合相關(guān)聯(lián)的程度)的嫌疑。2021年初,招商證券發(fā)布的一篇報(bào)告提到,量化投資在未來(lái)越來(lái)越難以靠“單純的風(fēng)格、行業(yè)暴露”來(lái)掙錢(qián),一定會(huì)在新的賽道展開(kāi)激烈比拼,包括基本面因子深度挖掘、輿情等另類(lèi)數(shù)據(jù),以及進(jìn)一步優(yōu)化模型與提高算力。
量化投資行業(yè)與科技行業(yè)的縫隙正在縮窄,這也意味著金融機(jī)構(gòu)在研發(fā)上依然需要舍得出血。在瞬息萬(wàn)變的市場(chǎng)環(huán)境中,不存在“躺平數(shù)錢(qián)”的時(shí)刻。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。