神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)算法中最流行且最強(qiáng)大的算法。在定量金融中,神經(jīng)網(wǎng)絡(luò)通常用于時(shí)間序列預(yù)測(cè)、構(gòu)建專(zhuān)有指標(biāo)、算法交易、證券分類(lèi)和信用風(fēng)險(xiǎn)建模,它也被用來(lái)構(gòu)建隨機(jī)過(guò)程模型和價(jià)格衍生工具。盡管它很有用,但神經(jīng)網(wǎng)絡(luò)往往因?yàn)樗鼈兊男阅苁恰安豢煽康摹倍曌u(yù)不佳。在我看來(lái),這可能是由于對(duì)神經(jīng)網(wǎng)絡(luò)工作機(jī)制誤解所致。本系列將討論了一些常見(jiàn)的對(duì)于神經(jīng)網(wǎng)絡(luò)的誤解。本文先介紹兩個(gè)錯(cuò)誤的理解:它是人腦的模型,第二它是統(tǒng)計(jì)學(xué)的一種弱形式。
人類(lèi)的大腦是我們這個(gè)時(shí)代最偉大的奧秘,科學(xué)家們尚未就其工作原理達(dá)成共識(shí)。目前有兩種大腦理論:即祖母細(xì)胞理論和分布式表征理論。第一個(gè)理論認(rèn)為,單個(gè)神經(jīng)元具有很高的處理信息能力,并且能夠表達(dá)復(fù)雜的概念。第二種理論認(rèn)為,神經(jīng)元更簡(jiǎn)單,復(fù)雜對(duì)象的表示分布在許多神經(jīng)元中。人工神經(jīng)網(wǎng)絡(luò)貌似是受到第二種理論的啟發(fā)。
我相信目前這一代神經(jīng)網(wǎng)絡(luò)不具備感知能力(與智能不同)的一個(gè)原因是因?yàn)樯锷窠?jīng)元比人工神經(jīng)元復(fù)雜得多。
大腦中的單個(gè)神經(jīng)元是一臺(tái)令人難以置信的復(fù)雜機(jī)器,即使在今天我們也不明白。而神經(jīng)網(wǎng)絡(luò)中的單個(gè)“神經(jīng)元”是一個(gè)非常簡(jiǎn)單的數(shù)學(xué)函數(shù),只能捕捉生物神經(jīng)元復(fù)雜性的一小部分。所以說(shuō)神經(jīng)網(wǎng)絡(luò)模仿大腦,這在思路上是真的,但真正的人造神經(jīng)網(wǎng)絡(luò)與生物大腦沒(méi)有什么相似之處——?Andrew Ng
大腦和神經(jīng)網(wǎng)絡(luò)之間的另一大區(qū)別在于規(guī)模和組織。人腦比神經(jīng)網(wǎng)絡(luò)包含更多的神經(jīng)元和突觸,他們有自我組織能力和適應(yīng)性。相比之下,神經(jīng)網(wǎng)絡(luò)是根據(jù)架構(gòu)來(lái)組織的。神經(jīng)網(wǎng)絡(luò)不像大腦那樣是“自組織”的,與有序網(wǎng)絡(luò)相比,神經(jīng)網(wǎng)絡(luò)更接近圖形。
由大腦成像技術(shù)發(fā)展而來(lái)的一些非常有趣的大腦視圖。
先比之下,我們只能說(shuō)神經(jīng)網(wǎng)絡(luò)受大腦啟發(fā),就像北京的奧林匹克體育場(chǎng)受到鳥(niǎo)巢的啟發(fā)。這并不意味著奧林匹克體育場(chǎng)就是鳥(niǎo)巢,它只意味著在體育場(chǎng)的設(shè)計(jì)中存在一些鳥(niǎo)巢的元素。換句話說(shuō),大腦的某些元素存在于神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)中,但它們比我們想像的要少得多。
事實(shí)上,神經(jīng)網(wǎng)絡(luò)與統(tǒng)計(jì)方法(如曲線擬合和回歸分析)更密切相關(guān)。在定量金融的背景下,我認(rèn)為重要的是要記憶,因?yàn)殡m然說(shuō)“某種東西受到大腦的啟發(fā)”可能聽(tīng)起來(lái)很酷,但這種說(shuō)法可能會(huì)導(dǎo)致不切實(shí)際的期望或恐懼。欲了解更多信息,請(qǐng)參閱這篇文章。
曲線擬合也稱(chēng)為函數(shù)逼近,神經(jīng)網(wǎng)絡(luò)常常用來(lái)逼近復(fù)雜的數(shù)學(xué)函數(shù)。
神經(jīng)網(wǎng)絡(luò)由相互連接的節(jié)點(diǎn)層組成,單個(gè)節(jié)點(diǎn)被稱(chēng)為感知器,類(lèi)似于多重線性回歸。在多層感知器中(MLP),感知器被排列成層并且層與層彼此連接。在MLP中,有三種類(lèi)型的層:即輸入層、隱藏層和輸出層。輸入層接收輸入模式,輸出層輸入映射的分類(lèi)或輸出信號(hào)的列表。隱藏層調(diào)整這些輸入的權(quán)重,直到神經(jīng)網(wǎng)絡(luò)的誤差最小化。
感知器可以接收由n個(gè)屬性組成的輸入向量z=(z1,z2,...Zn)。這個(gè)輸入向量稱(chēng)為輸入模式,這些輸入根據(jù)該感知器的權(quán)向量加權(quán):v=(v1,v2...,vn)。在多元線性回歸的背景下,這些可以被認(rèn)為是回歸系數(shù)或貝塔值。感知器的凈輸入信號(hào)net通常是輸入模式與其權(quán)重的總和乘積,其使用和積神經(jīng)元網(wǎng)絡(luò)被稱(chēng)為求和單元。
net=∑ni?1zivi
凈輸入信號(hào)減去偏差θ然后饋送到某個(gè)激活函數(shù)f()。激活函數(shù)通常是在(0,1)或(-1,1)之間有界的單調(diào)遞增函數(shù)(下文將進(jìn)行進(jìn)一步討論),另外激活函數(shù)可以是線性或非線性的。
下面顯示了一些神經(jīng)網(wǎng)絡(luò)中常用的激活函數(shù):
最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)就是只有一個(gè)將輸入映射到輸出的神經(jīng)元。給定一個(gè)模式p,這個(gè)網(wǎng)絡(luò)的目標(biāo)是使輸出信號(hào)op的誤差相對(duì)于某些給定訓(xùn)練模式tp的某個(gè)已知目標(biāo)值的誤差最小化。例如,如果神經(jīng)元應(yīng)該將p映射到-1,但其映射到了1,那么神經(jīng)元的誤差(如平方和距離測(cè)量)將為4。
如上圖所示,感知器被組織成層。第一層輸入感知器,從訓(xùn)練集PT中接收模式p。最后一層是映射到這些模式的預(yù)期輸出。
隱藏層是接收另一層的輸出作為輸入,并且輸出形成輸入到另一層的隱藏層。那么,這些隱藏層是做什么的?其中一種技術(shù)解釋是它們提取輸入數(shù)據(jù)中的顯著特征,這些特征對(duì)輸出具有預(yù)測(cè)能力。這被稱(chēng)為特征提取,并以某種方式執(zhí)行與統(tǒng)計(jì)技術(shù)(如主成分分析)類(lèi)似的功能。
深度神經(jīng)網(wǎng)絡(luò)具有大量的隱藏層,并且能夠從數(shù)據(jù)中提取更多的特征。最近,深度神經(jīng)網(wǎng)絡(luò)對(duì)于圖像識(shí)別問(wèn)題表現(xiàn)得特別好。下面顯示了圖像識(shí)別環(huán)境下的特征提取示例:
我認(rèn)為使用深度神經(jīng)網(wǎng)絡(luò)所面臨的問(wèn)題之一(除了過(guò)度擬合之外)是神經(jīng)網(wǎng)絡(luò)的輸入幾乎總是被大量預(yù)處理。
如前所述,神經(jīng)網(wǎng)絡(luò)的目標(biāo)是最小化一些誤差測(cè)量值ε。最常見(jiàn)的誤差指標(biāo)是平方和誤差,盡管這一指標(biāo)對(duì)異常值很敏感。
考慮到網(wǎng)絡(luò)的目標(biāo)是最小化ε,我們可以使用優(yōu)化算法來(lái)調(diào)整神經(jīng)網(wǎng)絡(luò)中的權(quán)重。神經(jīng)網(wǎng)絡(luò)最常見(jiàn)的學(xué)習(xí)算法是梯度下降算法,盡管可以使用其他更好的優(yōu)化算法。梯度下降的工作方式是計(jì)算誤差相對(duì)于神經(jīng)網(wǎng)絡(luò)中每個(gè)層的權(quán)重的偏導(dǎo)數(shù),然后向與梯度相反的方向移動(dòng)(因?yàn)槲覀兿胍钚』窠?jīng)網(wǎng)絡(luò)的誤差)。通過(guò)最小化誤差,我們可以最大化神經(jīng)網(wǎng)絡(luò)樣本的性能。
在學(xué)術(shù)界,一些統(tǒng)計(jì)學(xué)家認(rèn)為,神經(jīng)網(wǎng)絡(luò)是一個(gè)“懶惰分析師的弱統(tǒng)計(jì)”方式。但我認(rèn)為神經(jīng)網(wǎng)絡(luò)代表了數(shù)百年統(tǒng)計(jì)技術(shù)的抽象,對(duì)于神經(jīng)網(wǎng)絡(luò)背后統(tǒng)計(jì)數(shù)據(jù)的精彩解釋?zhuān)医ㄗh閱讀這篇文章。我同意一些從業(yè)者喜歡將神經(jīng)網(wǎng)絡(luò)視為一個(gè)“黑匣子”,可以在不花時(shí)間理解問(wèn)題本質(zhì)以及神經(jīng)網(wǎng)絡(luò)是否合適的情況下去研究神經(jīng)網(wǎng)絡(luò)。在對(duì)于金融市場(chǎng)來(lái)說(shuō),我認(rèn)為神經(jīng)網(wǎng)絡(luò)并不能完美的展示它的能力。因?yàn)槭袌?chǎng)是動(dòng)態(tài)的,而神經(jīng)網(wǎng)絡(luò)假定輸入模式的分布隨著時(shí)間的推移是保持不變。
聯(lián)系客服