關(guān)于機(jī)器學(xué)習(xí)在計(jì)量分析中的應(yīng)用,各位學(xué)者可以參閱如下文章:1.
Python中的計(jì)量回歸模塊及所有模塊概覽,2.
空間計(jì)量軟件代碼資源集錦(Matlab/R/Python/SAS/Stata), 不再因空間效應(yīng)而感到孤獨(dú),3.
回歸、分類與聚類:三大方向剖解機(jī)器學(xué)習(xí)算法的優(yōu)缺點(diǎn)(附Python和R實(shí)現(xiàn)),4.
機(jī)器學(xué)習(xí)第一書, 數(shù)據(jù)挖掘, 推理和預(yù)測(cè),5.
從線性回歸到機(jī)器學(xué)習(xí), 一張圖幫你文獻(xiàn)綜述,6.
11種與機(jī)器學(xué)習(xí)相關(guān)的多元變量分析方法匯總,7.
機(jī)器學(xué)習(xí)和大數(shù)據(jù)計(jì)量經(jīng)濟(jì)學(xué), 你必須閱讀一下這篇,8.
機(jī)器學(xué)習(xí)與Econometrics的書籍推薦, 值得擁有的經(jīng)典,9.
機(jī)器學(xué)習(xí)在微觀計(jì)量的應(yīng)用最新趨勢(shì): 大數(shù)據(jù)和因果推斷,10.
機(jī)器學(xué)習(xí)在微觀計(jì)量的應(yīng)用最新趨勢(shì): 回歸模型,11.
機(jī)器學(xué)習(xí)對(duì)計(jì)量經(jīng)濟(jì)學(xué)的影響, AEA年會(huì)獨(dú)家報(bào)道,12.
機(jī)器學(xué)習(xí),可異于數(shù)理統(tǒng)計(jì),13.
Python, Stata, R軟件史上最全快捷鍵合輯!,14.
Python與Stata, R, SAS, SQL在數(shù)據(jù)處理上的比較, 含code及細(xì)致講解,15.
Python做因果推斷的方法示例, 解讀與code,16.
文本分析的步驟, 工具, 途徑和可視化如何做?17.
文本大數(shù)據(jù)分析在經(jīng)濟(jì)學(xué)和金融學(xué)中的應(yīng)用, 最全文獻(xiàn)綜述,18.
文本函數(shù)和正則表達(dá)式, 文本分析事無巨細(xì)。
前幾日,我們引薦了“
機(jī)器學(xué)習(xí)方法出現(xiàn)在AER, JPE, QJE等頂刊上了!”,在學(xué)術(shù)同行間引起巨大反響。機(jī)器學(xué)習(xí)方法逐漸在經(jīng)濟(jì)管理等社科類頂刊,如AER,JPE,QJE,JOF等期刊上出現(xiàn)了。為了進(jìn)一步了解機(jī)器學(xué)習(xí)在國(guó)外最新應(yīng)用動(dòng)向,我們?yōu)楦魑粚W(xué)者奉上“機(jī)器學(xué)習(xí)在能源經(jīng)濟(jì)和金融領(lǐng)域的應(yīng)用”。對(duì)機(jī)器學(xué)習(xí)方法感興趣的學(xué)者,建議認(rèn)真研讀該篇文章及其附上的參考文獻(xiàn)。
必看: 計(jì)量經(jīng)濟(jì)圈公眾號(hào)搜索功能及操作流程演示 (戳前面)
正文
關(guān)于下方文字內(nèi)容,作者:張芷寧,東北財(cái)經(jīng)大學(xué)金融學(xué),通信郵箱:zhangzhining510@163.com作者之前刊發(fā)的作品:
氣候經(jīng)濟(jì)學(xué)能發(fā)Nature,Science的三大熱點(diǎn)問題!該文獻(xiàn)(見文后reference)通過對(duì)2005年-2018年間發(fā)表的130多篇論文進(jìn)行梳理分析表明,支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和遺傳算法(GAs)是能源經(jīng)濟(jì)學(xué)論文中最常用的方法。同時(shí),文章還對(duì)機(jī)器學(xué)習(xí)的方法、應(yīng)用、優(yōu)缺點(diǎn)以及未來可以拓展的領(lǐng)域進(jìn)行了細(xì)致的總結(jié)。主要聚焦于以下幾個(gè)問題:1、哪些方法在能源經(jīng)濟(jì)學(xué)中被頻繁的使用,哪些方法未被充分利用,為什么?2、在能源經(jīng)濟(jì)和金融領(lǐng)域,哪些具體應(yīng)用比較受歡迎,但還沒有得到充分開發(fā)?3、能源經(jīng)濟(jì)和金融領(lǐng)域可以從其他領(lǐng)域借鑒什么?4、這些領(lǐng)域未來的研究機(jī)會(huì)是什么?
簡(jiǎn)介
機(jī)器學(xué)習(xí)(ML)是指一類能夠從數(shù)據(jù)中學(xué)習(xí)并隨著時(shí)間的推移不斷提高其性能的數(shù)據(jù)科學(xué)模型,它在處理一些無法由解析解(analytic solution)明確說明的任務(wù)上很有用,這使其在能源工業(yè)的一些研究中很受歡迎,包括石油天然氣的開采、風(fēng)力電力系統(tǒng)的一些故障、負(fù)荷預(yù)測(cè)等等。同時(shí),它也被廣泛地運(yùn)用于能源市場(chǎng)中的一些經(jīng)濟(jì)金融分析,例如價(jià)格預(yù)測(cè)和風(fēng)險(xiǎn)管理。和傳統(tǒng)的統(tǒng)計(jì)或計(jì)量模型相比,由于ML沒有對(duì)方程的函數(shù)形式、變量之間的相互作用和參數(shù)的統(tǒng)計(jì)分布做出任何預(yù)先指定的假設(shè),所以可以處理大量結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)并快速的做出決策或預(yù)測(cè)。通過對(duì)文獻(xiàn)的整理,作者發(fā)現(xiàn)對(duì)原油和電力價(jià)格預(yù)測(cè)是目前為止ML在能源經(jīng)濟(jì)和金融領(lǐng)域最受歡迎的應(yīng)用。而就方法而言,人工神經(jīng)網(wǎng)絡(luò)是一種廣泛使用的技術(shù),近些年支持向量機(jī)的研究也得到了廣泛關(guān)注,而與二者相比,深度學(xué)習(xí)(DL)在這個(gè)領(lǐng)域還不太常見。同時(shí),作者明確了以下問題:1、本文主要是對(duì)能源經(jīng)濟(jì)與金融市場(chǎng)的ML應(yīng)用進(jìn)行深入的發(fā)掘與分析,因此不提供關(guān)于能源工程中ML應(yīng)用的深入探究。2、Weron(2014)回顧了電價(jià)預(yù)測(cè)的方法,雖然沒有特別關(guān)注ML技術(shù),但也可以作為本文的補(bǔ)充。3、經(jīng)濟(jì)學(xué)界主要關(guān)注ML在理論檢驗(yàn)和因果推斷方面的能力和限制,而能源領(lǐng)域則對(duì)實(shí)際的應(yīng)用更感興趣研究方法
首先再次框定本文研究范圍—能源經(jīng)濟(jì)和金融領(lǐng)域與能源工程領(lǐng)域的邊界并不明晰,而本文的主要研究對(duì)象是廣義的能源經(jīng)濟(jì)學(xué)/金融學(xué)應(yīng)用。所謂“廣義”即定義為涉及有關(guān)類型的市場(chǎng)變量(如價(jià)格、投資和消費(fèi)者最佳行為以及公共政策)的問題。然后說明用來識(shí)別文獻(xiàn)雙重檢索辦法(double checking)的方法:1、識(shí)別期刊:找到可能發(fā)表ML技術(shù)在能源領(lǐng)域應(yīng)用的刊物,具體方法是在一些文獻(xiàn)索引【SCImago Journal Rank (SJR), Science Citation Index Expanded (SCIE), Social Sciences Citation Index (SSCI), and Arts & Humanities Citation Index (A&HCI)】中尋找能源相關(guān)和經(jīng)濟(jì)相關(guān)的期刊。2、找關(guān)鍵詞:利用下表中的關(guān)鍵詞庫進(jìn)行搜索
指出沒有包括的文獻(xiàn)及理由:本研究不包含三種專門的電器工程期刊【IEEE Transactions on Power Systems, Electric Power Systems Research, and International Journal of Electrical Power & Energy Systems】,因?yàn)槠渌P(guān)于電力市場(chǎng)預(yù)測(cè)的調(diào)查對(duì)這類論文提供了更深入、專業(yè)的分析。
指出可能遺漏的問題及原因:1、可能忽略了在主流經(jīng)濟(jì)學(xué)期刊之外刊物上發(fā)表的論文,所以統(tǒng)計(jì)出的結(jié)果可能偏低。但是由于本文的目標(biāo)是對(duì)相關(guān)論文的內(nèi)容和方法進(jìn)行深入的闡述和總結(jié),而非單純的統(tǒng)計(jì)分析,因此這一問題并不嚴(yán)重。2、還可能會(huì)漏掉一些ML在能源行業(yè)的應(yīng)用進(jìn)展,例如一些專有技術(shù),因?yàn)檫@些都是不可公開獲取的,這也導(dǎo)致了對(duì)該領(lǐng)域前沿水平一定程度上的低估。調(diào)查結(jié)果統(tǒng)計(jì)
ML應(yīng)用領(lǐng)域如下圖所示,其中價(jià)格預(yù)測(cè)占比最大
2005年-2018年文獻(xiàn)的總體數(shù)量和累計(jì)數(shù)量如下圖所示
具體總結(jié):應(yīng)用領(lǐng)域
一、能源價(jià)格預(yù)測(cè)
能源商品價(jià)格序列具有典型的非線性、滯后依賴、非平穩(wěn)性、波動(dòng)聚類等復(fù)雜特征,由于ML在處理復(fù)雜的內(nèi)部動(dòng)態(tài)時(shí)有較高的靈活性,因此可以更好的處理這類問題。目前的絕大多數(shù)論文要么預(yù)測(cè)原油價(jià)格,要么預(yù)測(cè)電力價(jià)格,預(yù)測(cè)天然氣價(jià)格的很少。而且,在當(dāng)今以煤炭作為主要能源的情況下,還沒有任何使用ML技術(shù)來預(yù)測(cè)煤炭?jī)r(jià)格的論文。1、原油價(jià)格預(yù)測(cè),有關(guān)文獻(xiàn)整理如下: 作者 研究?jī)?nèi)容
Moshiri and Foroutan (2006) 早期成功案例之一,運(yùn)用非線性的人工神經(jīng)算法模型來預(yù)測(cè)未來石油價(jià)格日序列
Yu et al. (2008) 首次嘗試使用不同ML模型的集成,使用基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)(NNEL)
Ding (2018) 把上述(Yu et al.)方法擴(kuò)展到預(yù)測(cè)油價(jià)的最后一個(gè)集成步驟
Jammazi and Aloui (2012) 將多層次的神經(jīng)網(wǎng)絡(luò)與小波分解相結(jié)合,優(yōu)化了對(duì)油價(jià)的預(yù)測(cè)
Yu et al. (2017b) 提出了將稀疏表示(SR)和前饋神經(jīng)網(wǎng)絡(luò)(FNN)相結(jié)合的一種集成預(yù)測(cè)方法,結(jié)果表明該方法優(yōu)于其他流行的預(yù)測(cè)模型和分解模型
Godarzietal.(2014) 建立了一個(gè)帶有外生輸入變量的動(dòng)態(tài)非線性自回歸模型(NARX)
Zhang et al. (2015) 采用集合模態(tài)分解(EEMD)將國(guó)際原油價(jià)格分解為一系列獨(dú)立的內(nèi)在模函數(shù)(IMFs)和殘差項(xiàng)。 還分別結(jié)合粒子群算法(PSO)和GARCH模型,發(fā)展了支持向量機(jī)最小二乘法,分別用于預(yù)測(cè)原油價(jià)格的非線性和時(shí)變部分
Chai et al.,(2018) 早期的模型通常使用自回歸結(jié)構(gòu),然而最近的一些論文使用了一種混合方法,可以處理輸入的大量變量,如供求、股價(jià)水平和金融市場(chǎng)指標(biāo)等
Dogah and Premaratne (2018) 將VAR模型與隨機(jī)森林技術(shù)相結(jié)合,研究了金磚國(guó)家石油風(fēng)險(xiǎn)因素變化對(duì)行業(yè)股票回報(bào)率的影響,克服了VAR建模中的一些缺點(diǎn)
Yu et al. (2014) 將壓縮感知的去噪(CSD)和人工智能方法(AI)相結(jié)合,提出了一種基于壓縮感知(CSD-AI)的學(xué)習(xí)范式。結(jié)果表明CSD-AI學(xué)習(xí)模式明顯優(yōu)于其他模型,包括不適用CSD過程的單一模型和使用其他去噪技術(shù)的混合模型
Wang and Wang (2016) 提出一種結(jié)合多層感知機(jī)和Elman型反饋神經(jīng)網(wǎng)絡(luò)(ERNNs)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這是一種具有隨機(jī)時(shí)間有效函數(shù)(stochastic time effective function)的時(shí)變預(yù)測(cè)系統(tǒng)。他們發(fā)展出的這種ERNN具有記憶近期事件來預(yù)測(cè)價(jià)格的能力
Zhao et al. (2017) 使用DL算法進(jìn)行原油價(jià)格預(yù)測(cè),將多層去噪自編碼器(SDAE)和自舉匯聚法(bagging)相結(jié)合。
Tang et al. (2015a) 提出了一個(gè)集成學(xué)習(xí)耦合的補(bǔ)充總體經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)和擴(kuò)展極限學(xué)習(xí)機(jī)(EELM)來提高原油價(jià)格預(yù)測(cè)的準(zhǔn)確性。結(jié)果表明,該模型可以作為預(yù)測(cè)高波動(dòng)性、高不規(guī)則性的復(fù)雜時(shí)間序列數(shù)據(jù)的有效工具
Zhu et al. (2016) 利用EEMD、PSO和最小二乘支持向量機(jī)(LSSVM)以及核函數(shù)原型,開發(fā)了一種自適應(yīng)多尺度集成學(xué)習(xí)范式
Cheng et al. (2018a) 利用對(duì)數(shù)周期冪律和多種群遺傳算法預(yù)測(cè)油價(jià)拐點(diǎn)
Safari and Davallou (2018) 將指數(shù)平滑模型(ESM)、ARIMA和NARNN結(jié)合在一個(gè)狀態(tài)空間模型框架中
Cheng et al. (2018b) 結(jié)合向量誤差修正模型和NARNN模型,提出一種混合模型(VECNARNN)來預(yù)測(cè)未來的原油價(jià)格。結(jié)果表明,與GARCH、VAR、VEC、NARNN等傳統(tǒng)模型相比,它具有更好的預(yù)測(cè)精度
Yu et al. (2016b)
Huang and Wang (2018) 將小波神經(jīng)網(wǎng)絡(luò)與隨機(jī)事件有效函數(shù)相結(jié)合
Zhao et al. (2018) 將向量趨勢(shì)預(yù)測(cè)方法(VTFM)應(yīng)用于油價(jià)預(yù)測(cè)
Sun et al. (2018) 基于區(qū)間分解集成學(xué)習(xí)(IDE)的方法來預(yù)測(cè)原油價(jià)格,這一方法在預(yù)測(cè)精度和假設(shè)檢驗(yàn)方面明顯優(yōu)于其他的一些基準(zhǔn)模型,表明“分而治之”的策略的確可以有效地提高原油價(jià)格的預(yù)測(cè)性能
2、電力價(jià)格預(yù)測(cè)由于系統(tǒng)運(yùn)營(yíng)商運(yùn)行的可行性要求,電力市場(chǎng)是日前市場(chǎng)。而且電力價(jià)格預(yù)測(cè)是一個(gè)復(fù)雜的過程,因?yàn)閮r(jià)格會(huì)受到發(fā)電和輸電的物理約束,以及市場(chǎng)力量的潛在作用。這類預(yù)測(cè)與原油價(jià)格預(yù)測(cè)的差別包括電價(jià)模型要使用很多物理變量如溫度、風(fēng)速、產(chǎn)量和輸電能力等來提高預(yù)測(cè)的準(zhǔn)確性。因此,ML的運(yùn)用是很恰當(dāng)有效的,它甚至可以不用經(jīng)過復(fù)雜的預(yù)處理和清洗過程,直接處理大量的輸入變量。同時(shí),因?yàn)殡妰r(jià)模型通常是由精通CI方法的電力,一般來說在技術(shù)上更為先進(jìn)。
類型作者研究?jī)?nèi)容
allConejoetal.(2005)預(yù)測(cè)了電力日前市場(chǎng)24個(gè)市場(chǎng)出清價(jià)格,比較了時(shí)間序列分析、神經(jīng)網(wǎng)絡(luò)分析和小波分析的性能
Lin et al. (2010)結(jié)合徑向基函數(shù)網(wǎng)絡(luò)(RBFN)和正交實(shí)驗(yàn)設(shè)計(jì)(OED),提出了一種強(qiáng)化的RBFN(ERBFN)求解過程
Khosravi et al. (2013)利用delta和脫靴法構(gòu)建了用于量化不確定性的電價(jià)預(yù)測(cè)區(qū)間(PIs),結(jié)果表明預(yù)測(cè)區(qū)間的性能由于人工神經(jīng)網(wǎng)絡(luò)
Papadimitriou et al. (2014)基于支持向量機(jī)預(yù)測(cè)未來一天電價(jià)定向變化的效率。結(jié)果表明,這是一種有效的方法,200天的預(yù)測(cè)精度為76.12%
He et al. (2015)結(jié)合徑向基函數(shù)網(wǎng)絡(luò)(RBFN)和正交實(shí)驗(yàn)設(shè)計(jì)(OED),提出了一種強(qiáng)化的RBFN(ERBFN)求解過程
集成方法Mirakyanet al.(2017)將集成方法運(yùn)用于電力市場(chǎng)
Ghasemi et al. (2016)提出一種包含了一個(gè)靈活的小波變換(FWPT)、非線性最小二乘支持向量機(jī)(NLSSVM)、ARIMA和基于時(shí)變系數(shù)的人工蜂群算法,即TV-SABC的混合算法,來優(yōu)化學(xué)習(xí)過程中NLSSVM在學(xué)習(xí)過程中的參數(shù)
多層神經(jīng)網(wǎng)絡(luò)Dudek (2016)基于前饋神經(jīng)網(wǎng)絡(luò)(FFNN)的電價(jià)預(yù)測(cè)方法,優(yōu)點(diǎn)是它不需要任何特殊的數(shù)據(jù)預(yù)處理
PanapakidisandDagoumas(2016)研究了基于人工神經(jīng)網(wǎng)絡(luò)的日前價(jià)格預(yù)測(cè)模型
Wang et al. (2017)提出了一種兩層分解技術(shù),開發(fā)了基于快速集成經(jīng)驗(yàn)?zāi)B(tài)分解(FEEMD)、變分模態(tài)分解(VMD)和BP神經(jīng)網(wǎng)絡(luò)的混合模型,并用基于群智能的算法對(duì)其進(jìn)行優(yōu)化
Singh et al. (2017)運(yùn)用廣義神經(jīng)元模型預(yù)測(cè)澳大利亞電力市場(chǎng)短期電價(jià),克服了傳統(tǒng)ANN模型的局限
Yang et al. (2017)提出了一種結(jié)合小波變換、基于自適應(yīng)粒子群算法(SAPSO)的核極限學(xué)習(xí)機(jī)模型(KELM)和ARMA混合方法
Bento et al. (2018)基于蝙蝠算法(BA)、小波變換和神經(jīng)網(wǎng)絡(luò)的短期電價(jià)預(yù)測(cè)方法
深度學(xué)習(xí)Lago et al. (2018a)通過四種不同的深度學(xué)習(xí)模型實(shí)現(xiàn)了高精度
Lago et al. (2018b)以深度神經(jīng)網(wǎng)絡(luò)(DNNs)為基礎(chǔ)模型,將市場(chǎng)整合納入電價(jià)預(yù)測(cè)
Pengetal. (2018)將長(zhǎng)短時(shí)記憶(LSTM)與差分進(jìn)化(DE)算法應(yīng)用于電價(jià)預(yù)測(cè)
代理模型(ABM)注:主要優(yōu)點(diǎn)是能在不需要完全解決博弈論最佳相應(yīng)的基礎(chǔ)上對(duì)現(xiàn)實(shí)電網(wǎng)中的行為策略進(jìn)行建模Chen (2012)回顧了ABM研究領(lǐng)域的內(nèi)容和起源
Weidlich and Veit (2008)將ABM應(yīng)用于電力市場(chǎng)
Guerci et al. (2010)將ABM應(yīng)用于電力市場(chǎng)
Young et al. (2014)能否使用改進(jìn)的Roth和Erev算法構(gòu)建和校準(zhǔn)代理模型預(yù)測(cè)現(xiàn)實(shí)電力市場(chǎng)中的短期價(jià)格
Dehghanpour et al. (2018)運(yùn)用代理模型研究了有空調(diào)負(fù)荷需求響應(yīng)的零售電能日前市場(chǎng)行為
3、其他能源商品價(jià)格預(yù)測(cè)包括柴火 (Koutroumanidis et al., 2009), 天然氣(Nguyen and Nabney, 2010; ˇCeperi′c et al., 2017)和碳價(jià)(Fan et al., 2015; Zhu et al., 2017; Sun et al., 2016; Zhu et al., 2018)。二、預(yù)測(cè)建模能源的消耗或供求為了進(jìn)行短期和長(zhǎng)期的規(guī)劃,了解未來的能源需求和消耗水平是至關(guān)重要的。能源消耗預(yù)測(cè)通常使用滯后的消耗值和一組外生的社會(huì)經(jīng)濟(jì)和技術(shù)變量,如人均GDP、人口和技術(shù)趨勢(shì)等。和之前的價(jià)格預(yù)測(cè)相比,消耗預(yù)測(cè)的一個(gè)關(guān)鍵特點(diǎn)是不受市場(chǎng)效率動(dòng)態(tài)的影響。1、長(zhǎng)期預(yù)測(cè)ML模型目前已經(jīng)被應(yīng)用于對(duì)總能源需求和各部門能源需求的長(zhǎng)期預(yù)測(cè)。但是挑戰(zhàn)在于,此類應(yīng)用中的觀測(cè)值往往較少,削弱了ML方法的固有優(yōu)勢(shì)。一些文獻(xiàn)運(yùn)用神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)國(guó)家層面能源的消耗:
S?zen and Arcaklioglu (2007) and S?zen et al. (2007)使用人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)土耳其的各部門能源消耗和溫室氣體排放
Geem and Roper (2009)用人工神經(jīng)網(wǎng)絡(luò)估計(jì)韓國(guó)的能源需求
Liu et al. (2016)將灰色預(yù)測(cè)方法與BP神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,對(duì)西班牙經(jīng)濟(jì)部門的能源消耗進(jìn)行預(yù)測(cè)
此外,該領(lǐng)域還有如下研究:
Tang等(2012)提出了EEMD和最小二乘支持向量回歸(LSSVR)相結(jié)合的混合集成學(xué)習(xí)(EL)范式,用于核能消費(fèi)預(yù)測(cè)
Tang等(2014)提出了一種由數(shù)據(jù)特征驅(qū)動(dòng)的建模方法來用于核能消費(fèi)預(yù)測(cè)
Li等(2018)預(yù)測(cè)了能源消費(fèi)的非線性變化,運(yùn)用AdaBoost來提高單一非線性預(yù)測(cè)模型的預(yù)測(cè)精度
Wang等(2018g)通過構(gòu)建自適應(yīng)多節(jié)優(yōu)化器(AMVO)來優(yōu)化SVM參數(shù),并應(yīng)用滾動(dòng)交叉驗(yàn)證來提高其性能,從而預(yù)測(cè)中國(guó)的能源消耗
Wang等(2011)采用季節(jié)分解(SD)的LSSVR集成學(xué)習(xí)模型進(jìn)行中國(guó)水電消費(fèi)預(yù)測(cè)
Tang等(2015b)通過將螢火蟲算法(FA)整合到LSSVR中來預(yù)測(cè)中國(guó)的水電消耗
2、電力需求預(yù)測(cè)電力需求預(yù)測(cè)是能源經(jīng)濟(jì)學(xué)中的傳統(tǒng)研究領(lǐng)域之一,該研究方向有關(guān)論文的整體結(jié)構(gòu)和組成大部分比較相近,即使用傳統(tǒng)的時(shí)間序列模型,SVM,人工神經(jīng)網(wǎng)絡(luò),以及最近的前饋和反饋多層模型,GAs和PSO也經(jīng)常被使用.3、智能電網(wǎng)負(fù)荷預(yù)測(cè)與國(guó)家層面的預(yù)測(cè)相比,ML更適合這種短期電力的需求預(yù)測(cè),因?yàn)樗O(shè)計(jì)對(duì)大量潛在輸入變量的高頻觀測(cè),ML能夠充分發(fā)揮它的優(yōu)勢(shì).有一些利用ML來研究電力負(fù)荷預(yù)測(cè)的文獻(xiàn),例如Liu et al. (2014), Coelho et al. (2016), Bassamzadeh和 Ghanem (2017), Mohan et al. (2018), Anderson et al. (2011) and Li et al. (2018b).還有一個(gè)相關(guān)的研究方向是對(duì)電網(wǎng)故障概率的預(yù)測(cè),Rudin等人(2012)提出了一種基于電網(wǎng)組件故障可能性的排序算法.4、天然氣需求預(yù)測(cè)作者列舉了一些預(yù)測(cè)天然需求的論文:Azadeh et al. (2010), Szoplik (2015), 和Panapakidis和 Dagoumas (2017),并詳細(xì)講解了一些論文的研究?jī)?nèi)容:
Ozmen等(2018)將多元自適應(yīng)回歸樣條法(MARS)和二次MARS(CMARS)應(yīng)用于天然氣消費(fèi)預(yù)測(cè)
Collado和Creamer(2016)使用近似動(dòng)態(tài)規(guī)劃方法將時(shí)間序列方法(ARIMA)和兩種機(jī)器學(xué)習(xí)算法(支持向量機(jī)和隨機(jī)森林)相結(jié)合,來預(yù)測(cè)天然氣價(jià)格
5、交通運(yùn)輸能源需求預(yù)測(cè)
Murat和Ceylan(2006)提出了一種基于監(jiān)督神經(jīng)網(wǎng)絡(luò)的方法,通過社會(huì)經(jīng)濟(jì)和交通相關(guān)指標(biāo)對(duì)交通能源需求進(jìn)行預(yù)測(cè)
Limanond等(2011)運(yùn)用了對(duì)數(shù)線性回歸(LLR)結(jié)合ANN模型來預(yù)測(cè)泰國(guó)的交通能源消耗
Geem(2011)開發(fā)了ANN模型來預(yù)測(cè)韓國(guó)的交通能源要求
Forouzanfar等(2012)提出了一種多層次的遺傳規(guī)劃(MLGP)方法來預(yù)測(cè)伊朗的交通能源需求
6、煤炭需求預(yù)測(cè)利用ML技術(shù)進(jìn)行煤炭消耗量預(yù)測(cè)的文獻(xiàn)較少,如Yun-cai (2003), Xuemian and Guohao (2008), and Yang et al. (2014).Jia等(2007)采用多輸入單輸出支持向量機(jī)模型對(duì)1980-2002年中國(guó)煤炭需求進(jìn)行預(yù)測(cè).三、其他應(yīng)用1、模型校準(zhǔn)
Sun等(2011)利用神經(jīng)網(wǎng)絡(luò)對(duì)能源供需系統(tǒng)的參數(shù)進(jìn)行了識(shí)別
Amjady和Keynia(2010)提出了一種新的學(xué)習(xí)算法運(yùn)用于放松管制的電力市場(chǎng)
Genc(2017)使用SVM模型對(duì)2009年危機(jī)前后的數(shù)據(jù)進(jìn)行了分割,并對(duì)原油市場(chǎng)進(jìn)行了計(jì)量分析
2、交易策略這一研究方向?qū)儆贛L和優(yōu)化模型相結(jié)合的一個(gè)小子集
Moreno(2009)提出了一個(gè)基于模糊邏輯和ML的模型來模擬哥倫比亞電力市場(chǎng)中的交易代理人策略
Wang等(2016)運(yùn)用GAs對(duì)原油期貨市場(chǎng)的交易規(guī)則進(jìn)行了篩選
Pinto等(2016)將支持向量機(jī)運(yùn)用于電力市場(chǎng)的投標(biāo)策略
3、能源系統(tǒng)結(jié)構(gòu)
Fang等(2013)使用人工神經(jīng)網(wǎng)絡(luò)來識(shí)別實(shí)際系統(tǒng)中的定量系數(shù)
Farajzadeh和Nematollahi(2018)使用WNNs檢驗(yàn)回歸模型預(yù)測(cè)能源強(qiáng)度的能力和其組成部分
Ermis等(2007)通過神經(jīng)網(wǎng)絡(luò)對(duì)世界綠色能源消耗進(jìn)行了分析
Ju等(2016a)利用支持向量機(jī),對(duì)19個(gè)主要是由相關(guān)國(guó)家/地區(qū)因油價(jià)意外變化而產(chǎn)生的宏觀經(jīng)濟(jì)效應(yīng)進(jìn)行了補(bǔ)充解釋
Ju等(2016b)利用人工智能預(yù)測(cè)中國(guó)宏觀經(jīng)濟(jì)于油價(jià)沖擊之間的聯(lián)動(dòng)
Skiba等(2017)利用ANN模型估計(jì)了潛在的能源節(jié)約
Sozen(2009)使用ANN方法,根據(jù)基本能源指標(biāo)和部門能源消耗來估計(jì)土耳其的能源依賴
Wang和Tian(2015)利用前饋神經(jīng)網(wǎng)絡(luò)(FFNN)構(gòu)建能源價(jià)格-能源供給-經(jīng)濟(jì)增長(zhǎng)動(dòng)態(tài)系統(tǒng)
Zhang等(2016)提出了電力供應(yīng)-消費(fèi)-價(jià)格的動(dòng)態(tài)系統(tǒng)模型,應(yīng)用神經(jīng)網(wǎng)絡(luò)來識(shí)別系統(tǒng)的參數(shù).
4、政策分析
Azadeh等人(2007)運(yùn)用ML來測(cè)量效率,作為以往效率研究方法的補(bǔ)充.
Cinar等人(2010)將GAs運(yùn)用于未來能源發(fā)展的設(shè)想和土耳其能源的戰(zhàn)略研究
Granell等(2014)將幾種ML方法應(yīng)用于評(píng)估企業(yè)轉(zhuǎn)換電價(jià)的收益或損失
Dagoumas等(2017)利用日前電價(jià)預(yù)測(cè)的ANN模型研究電力商的風(fēng)險(xiǎn)管理
Skiba等(2017)利用ANN模型估計(jì)了潛在的能源節(jié)約
Mashhadi和Behdad(2018)使用最小絕對(duì)收縮和選擇算子(LASSO)回歸分析住宅單元的能耗
Mahmoud和Alajmi(2010)使用人工神經(jīng)網(wǎng)絡(luò)對(duì)節(jié)能進(jìn)行定量評(píng)估
Wang等(2018a)提出了一種混合ML方法對(duì)中國(guó)煤炭產(chǎn)能過剩問題進(jìn)行了定量分析和預(yù)測(cè)
5、數(shù)據(jù)處理在許多應(yīng)用程序中,數(shù)據(jù)的完整性和質(zhì)量在整個(gè)過程中很重要,數(shù)據(jù)缺失會(huì)帶來各種各樣的問題.而ML是一個(gè)識(shí)別離群值、推測(cè)缺失數(shù)據(jù)的強(qiáng)大工具,并可以緩解與不完整數(shù)據(jù)相關(guān)的潛在問題(Abdella and Marwala, 2005; Nelwamondo et al., 2007).Li等(2017)在大數(shù)據(jù)驅(qū)動(dòng)的模型中采用人工智能算法對(duì)油價(jià)趨勢(shì)進(jìn)行了預(yù)測(cè).Zhang等(2018)應(yīng)用支持向量機(jī)、AdaBoost等機(jī)器學(xué)習(xí)方法對(duì)數(shù)據(jù)進(jìn)行挖掘和分析,結(jié)論表明機(jī)器學(xué)習(xí)方法能夠有效的解決能耗數(shù)據(jù)缺失的問題.四、不同的機(jī)器學(xué)習(xí)技術(shù)比較1、支持向量機(jī):優(yōu)勢(shì):總體上的準(zhǔn)確性、分類速度、對(duì)不相關(guān)特征的容忍度、對(duì)冗余特征的容忍度、對(duì)高度相互依存特征的容忍度、可以建立線性與非線性模型、可處理二分類和連續(xù)的特征局限性:學(xué)習(xí)的速度、對(duì)缺失值的容忍度、對(duì)白噪聲的容忍度、處理過度擬合時(shí)的風(fēng)險(xiǎn)、對(duì)于增量學(xué)習(xí)的嘗試(可能是說SVM目前嘗試不出來增量學(xué)習(xí))、解釋能力差、模型參數(shù)處理代表性應(yīng)用:分類、回歸、時(shí)間序列預(yù)測(cè)2、決策樹:優(yōu)勢(shì):學(xué)習(xí)速度、分類速度、對(duì)缺失值的容忍度、對(duì)高度相互依存特征的容忍度、解釋能力、模型參數(shù)處理、可處理過度擬合問題、可處理二分類和連續(xù)特征、可以用不同的代價(jià)(損失)函數(shù)處理特征局限性:總體上的準(zhǔn)確性差、對(duì)冗余特征的容忍度、對(duì)高度相互依存特征的容忍度、對(duì)白噪聲的容忍度、對(duì)于增量學(xué)習(xí)的嘗試、誤差的上限代表性應(yīng)用:分類、回歸、信用風(fēng)險(xiǎn)模型、市場(chǎng)細(xì)分、時(shí)間序列預(yù)測(cè)3、隨機(jī)森林:優(yōu)勢(shì):無過擬合問題、對(duì)若干個(gè)樹結(jié)果的集成、誤差的上限、白噪聲具有穩(wěn)健性、是基于樹的算法里最快的、對(duì)變量的分割節(jié)點(diǎn)不是很敏感(比如老人是多少歲以上的?這種)局限性:運(yùn)行的時(shí)候是在黑箱里的、解釋能力差代表性應(yīng)用:分類、回歸、時(shí)間序列預(yù)測(cè)4、AdaBoost:優(yōu)勢(shì):無過度擬合問題、具有特征選擇能力、使誤差項(xiàng)的偏差最小、樹的更新(交替決策樹)可以促進(jìn)對(duì)結(jié)果的解釋、誤差的上限局限性:增加了響應(yīng)的差異(響應(yīng)簡(jiǎn)單地說也叫偽殘差..直接叫響應(yīng)也行)、表現(xiàn)依賴于數(shù)據(jù)的質(zhì)量和數(shù)量以及弱分類器、對(duì)白噪聲的容忍度代表性應(yīng)用:分類、排序5、人工神經(jīng)網(wǎng)絡(luò):優(yōu)勢(shì):分類速度快、可處理二分類或連續(xù)特征、對(duì)于增量學(xué)習(xí)的嘗試局限性:對(duì)缺失值的容忍度、對(duì)不相關(guān)變量的容忍度、對(duì)冗余變量的容忍度、對(duì)白噪聲的容忍度、處理不好過擬合問題、解釋能力差、模型參數(shù)處理能力差、黑箱子代表性應(yīng)用:時(shí)間序列預(yù)測(cè)6、深度學(xué)習(xí):優(yōu)勢(shì):和人工神經(jīng)網(wǎng)絡(luò)類似局限性:黑箱子、需要極其大量數(shù)據(jù)代表性應(yīng)用:視覺和聲音的處理、時(shí)間序列預(yù)測(cè)優(yōu)缺點(diǎn)評(píng)價(jià)
一、預(yù)測(cè)精度上的優(yōu)勢(shì)
有關(guān)文獻(xiàn)通過計(jì)算一些績(jī)效評(píng)估指標(biāo)和進(jìn)行統(tǒng)計(jì)檢驗(yàn)來驗(yàn)證機(jī)器學(xué)習(xí)在預(yù)測(cè)精度上的優(yōu)勢(shì).1、績(jī)效評(píng)估指標(biāo)在對(duì)連續(xù)變量進(jìn)行回歸或預(yù)測(cè)的文獻(xiàn)中,主要運(yùn)用均方根誤差(RMSE),平均絕對(duì)誤差(MAE),平均絕對(duì)百分比誤差(MAPE),方向精度(DA).運(yùn)用ML進(jìn)行分類的文獻(xiàn)中則通常使用Matthews相關(guān)系數(shù)、測(cè)試誤差或準(zhǔn)確率來評(píng)估ML方法于其他統(tǒng)計(jì)和計(jì)量方法相比的預(yù)測(cè)準(zhǔn)確性.Safari和Davallou(2018)基于上述一些指標(biāo)進(jìn)行來比較不同方法的性能,結(jié)果如下表所示:
可以看出,EWH方法要優(yōu)于ARIMA在內(nèi)的其他方法.
2、統(tǒng)計(jì)檢驗(yàn)比較ML和計(jì)量經(jīng)濟(jì)模型預(yù)測(cè)結(jié)果的統(tǒng)計(jì)檢驗(yàn)方法包括Wilcoxon符號(hào)秩檢驗(yàn)(WSRT),Forecast Encompassing Test(FET)和真實(shí)性檢驗(yàn)(RC)等.作者分別簡(jiǎn)單介紹了上述三種統(tǒng)計(jì)檢驗(yàn): Wilcoxon符號(hào)秩檢驗(yàn)是最著名且使用最廣泛的非參數(shù)檢驗(yàn),原假設(shè)是兩個(gè)預(yù)測(cè)誤差序列的損失函數(shù)差值的中位數(shù)為0;FET的原假設(shè)是模型B中的所有信息都包含在模型A中;RC則是進(jìn)行了預(yù)測(cè)能力的測(cè)試,零假設(shè)為模型A的預(yù)測(cè)能力并不優(yōu)于模型B。趙等學(xué)者(2017)應(yīng)用上述三種測(cè)試對(duì)機(jī)器學(xué)習(xí)模型以及隨機(jī)游走(RW)、馬爾科夫狀態(tài)轉(zhuǎn)換(MRS)等計(jì)量經(jīng)濟(jì)學(xué)模型進(jìn)行了評(píng)估,構(gòu)建的場(chǎng)景為原油價(jià)格的預(yù)測(cè),結(jié)果如下表所示。
從表中(表中數(shù)據(jù)為兩兩之間的p值)可以看出,SDAE-Bagging模型與其他模型之間的p值均小于0.1,且根據(jù)趙的原文可知,該模型的DA最高,MAPE和RMSE最低,表明預(yù)測(cè)精度優(yōu)于其他模型。
二、可處理不同種類和大量的輸入項(xiàng)機(jī)器學(xué)習(xí)模型對(duì)變量的格式要求極低。在處理大量以及多維數(shù)據(jù)時(shí),不需人工降維與考慮共線性問題,可以自動(dòng)選擇用于預(yù)測(cè)目的的正確因素,深度學(xué)習(xí)模型更是如此。同時(shí),定量和定性數(shù)據(jù)可以同時(shí)出現(xiàn),這一優(yōu)點(diǎn)對(duì)能源部門極為重要。三、具有發(fā)現(xiàn)復(fù)雜關(guān)系的能力機(jī)器學(xué)習(xí)模型會(huì)找到輸入和輸出數(shù)據(jù)之間可能存在的關(guān)系結(jié)構(gòu)。對(duì)于傳統(tǒng)模型,貝葉斯平均模型(BMA)允許運(yùn)行一系列模型,但需要提前制定每個(gè)模型的結(jié)構(gòu),但機(jī)器學(xué)習(xí)模型則會(huì)自動(dòng)找到更高維、更復(fù)雜,以及非線性的關(guān)系。四、對(duì)數(shù)據(jù)質(zhì)量的敏感性較低對(duì)于傳統(tǒng)的計(jì)量經(jīng)濟(jì)學(xué)模型來說,觀測(cè)數(shù)據(jù)的缺失現(xiàn)象不可避免,而機(jī)器學(xué)習(xí)模型中,已開發(fā)了模糊模型與GNN模型等對(duì)數(shù)據(jù)質(zhì)量要求較低的模型。Alobaidi et al.(2018)基于此類集成模型提供了對(duì)于低質(zhì)量數(shù)據(jù)性能提升的簡(jiǎn)介。五、對(duì)數(shù)據(jù)的預(yù)處理要求低時(shí)間序列數(shù)據(jù)通常需要進(jìn)行數(shù)據(jù)預(yù)處理,這耗費(fèi)了大量的時(shí)間。但由于機(jī)器學(xué)習(xí)模型可以將這些特征視為數(shù)據(jù)的附加特征,不需要對(duì)數(shù)據(jù)進(jìn)行大量的預(yù)處理,機(jī)器學(xué)習(xí)模型會(huì)自動(dòng)發(fā)掘使性能提高的特性,并呈現(xiàn)到結(jié)果中。與此同時(shí),若是需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換(例如將絕對(duì)數(shù)變?yōu)樵鲩L(zhǎng)率),主動(dòng)的預(yù)處理對(duì)提高性能也是可行的,即數(shù)據(jù)預(yù)處理并不是必要的。六、可靈活運(yùn)用于回歸、分類或排名領(lǐng)域機(jī)器學(xué)習(xí)模型中,監(jiān)督類算法可運(yùn)用于回歸、分類或排序領(lǐng)域,根據(jù)研究問題的不同,可自由改變輸出項(xiàng),例如:可將預(yù)測(cè)問題轉(zhuǎn)化為分類問題,以簡(jiǎn)化計(jì)算。七、局限性與挑戰(zhàn):1、性能問題預(yù)測(cè)的精度會(huì)根據(jù)基礎(chǔ)變量的不同差距較大,當(dāng)基礎(chǔ)變量為高效市場(chǎng)中的交易資產(chǎn),預(yù)測(cè)的準(zhǔn)確性就會(huì)受到挑戰(zhàn),因?yàn)槭袌?chǎng)價(jià)格的結(jié)構(gòu)已經(jīng)非常接近模型所能預(yù)測(cè)的價(jià)格(Ceperic et al. (2017))。2、過擬合問題任何預(yù)測(cè)方法都有過擬合的風(fēng)險(xiǎn),機(jī)器學(xué)習(xí)也不例外。比如當(dāng)擬合模型中包含樣本噪聲,嘗試進(jìn)行數(shù)據(jù)預(yù)測(cè)時(shí)會(huì)達(dá)到很高的精度。處理的方法常使用交叉驗(yàn)證,以計(jì)算測(cè)試誤差,在這種情況下,測(cè)試誤差近似于底層分布的真實(shí)測(cè)試誤差。而隨機(jī)森林等算法已包含了交叉驗(yàn)證的過程。3、泛化能力問題機(jī)器學(xué)習(xí)算法的一個(gè)主要目的是最小化可計(jì)算的經(jīng)驗(yàn)風(fēng)險(xiǎn),來最小化不可計(jì)算的預(yù)期風(fēng)險(xiǎn),從而獲得較低的泛化差距,但泛華差距成為了制約許多機(jī)器學(xué)習(xí)模型應(yīng)用的瓶頸(如前饋神經(jīng)網(wǎng)絡(luò))。正則化對(duì)泛華誤差起到修正作用,包括隱式和顯式兩類,它們都對(duì)網(wǎng)絡(luò)的有效容量起到控制作用:其中隱式正則化利用網(wǎng)絡(luò)結(jié)構(gòu)、學(xué)習(xí)算法或數(shù)據(jù)的特點(diǎn)來控制有效容量(如隨機(jī)梯度下降,卷積層,批量歸一化);顯式正則化則與隱式相反,不是網(wǎng)絡(luò)結(jié)構(gòu)、算法或數(shù)據(jù)的結(jié)構(gòu)部分,很容易添加或刪除(如權(quán)重衰減、dropout算法、數(shù)據(jù)增強(qiáng)與隨機(jī)深度)。4、自然黑箱問題以ANN和SVM為代表的機(jī)器學(xué)習(xí)算法,被認(rèn)為是黑箱型算法。與更透明的線性回歸模型相比,很難對(duì)結(jié)果進(jìn)行解釋。但也有一些算法提供了對(duì)每個(gè)特征影響的識(shí)別,并識(shí)別了特征之間的線性和非線性能力,典型例子為決策樹。建模師需解決的主要問題是,重心放在預(yù)測(cè)還是解釋,這需要對(duì)于特定場(chǎng)景靈活選擇。5、對(duì)大量數(shù)據(jù)的要求宏觀經(jīng)濟(jì)領(lǐng)域由于數(shù)據(jù)量較少(常為50-100),無法使用機(jī)器學(xué)習(xí)模型。Dietterich(2000)認(rèn)為可以使用集成學(xué)習(xí)方法彌補(bǔ),Moshiri和Cameron(2000)等學(xué)者認(rèn)為可以使用經(jīng)濟(jì)理論指導(dǎo)變量選擇。6、缺乏統(tǒng)計(jì)檢驗(yàn)由于機(jī)器學(xué)習(xí)不再關(guān)注計(jì)量經(jīng)濟(jì)學(xué)中的回歸系數(shù),而是關(guān)注預(yù)測(cè)結(jié)果的精度,缺乏對(duì)自變量的檢驗(yàn),近年學(xué)者正在嘗試開發(fā)。7、對(duì)穩(wěn)健性的評(píng)估由于機(jī)器學(xué)習(xí)算法的非線性和動(dòng)態(tài)性,常常穩(wěn)健性較差。因此在使用機(jī)器學(xué)習(xí)算法進(jìn)行建模時(shí),常將數(shù)據(jù)集分成訓(xùn)練集與測(cè)試集,檢驗(yàn)其穩(wěn)健性。8、專注于市場(chǎng)價(jià)格的預(yù)測(cè)由于機(jī)器學(xué)習(xí)算法的推行會(huì)影響人們的行為,故具有外部性,例如當(dāng)用于預(yù)測(cè)交易資產(chǎn)價(jià)格時(shí),會(huì)立即影響人們的決策,進(jìn)而影響價(jià)格。因此,一個(gè)機(jī)器學(xué)習(xí)算法的成功會(huì)對(duì)下一個(gè)算法造成阻礙,其推行是有限制的。未來方向的建議
一、現(xiàn)有做法的提升空間:1、計(jì)算機(jī)科學(xué)和經(jīng)濟(jì)金融分析思維,沒有充分結(jié)合,大多數(shù)文獻(xiàn)都是專注于其中一方2、目前,非監(jiān)督的學(xué)習(xí)方法應(yīng)用非常有限,大多數(shù)文獻(xiàn)使用的都是監(jiān)督學(xué)習(xí)算法3、一些和營(yíng)銷與客戶管理相關(guān)的問題可以通過使用集群技術(shù)來解決,如運(yùn)用K-means聚類算法根據(jù)人數(shù)統(tǒng)計(jì)、行為特征以及違約可能性來劃分客戶4、在能源風(fēng)險(xiǎn)管理領(lǐng)域,利用主成分分析或排序算法可以將極端的事件識(shí)別為離群值二、未被充分利用的方法:1、理論驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法:目前沒有發(fā)現(xiàn)任何文獻(xiàn)中有理論模型和機(jī)器學(xué)習(xí)的結(jié)合應(yīng)用。因此,這個(gè)待開發(fā)的領(lǐng)域中可能蘊(yùn)含著結(jié)合理論和方法從而獲得更穩(wěn)健分析結(jié)果的機(jī)會(huì)。2、深度學(xué)習(xí):深度學(xué)習(xí)上的進(jìn)步對(duì)于機(jī)器學(xué)習(xí)來說是革命性的。它能夠更穩(wěn)定的處理大量的輸入變量,對(duì)預(yù)處理的要求也不高。但是存在的問題就是:首先,在處理大量輸入變量時(shí)它才能更好的發(fā)揮自身優(yōu)勢(shì),而且需要更多時(shí)間和精力校準(zhǔn)。所以,如果實(shí)際問題中沒有那么大的數(shù)據(jù)量,容易有“殺雞用牛刀”之嫌3、自然語言處理:在目前經(jīng)濟(jì)管理領(lǐng)域,很多研究都用機(jī)器學(xué)習(xí)處理文本和非結(jié)構(gòu)化數(shù)據(jù),然而這種方法還沒有被廣泛應(yīng)用于能源領(lǐng)域。4、社會(huì)網(wǎng)絡(luò)分析:能源市場(chǎng)其實(shí)也是一個(gè)巨大的網(wǎng)絡(luò),也可以看作多種網(wǎng)絡(luò)的結(jié)合。所以將社會(huì)網(wǎng)絡(luò)分析拓展到對(duì)能源網(wǎng)絡(luò)的分析也是一個(gè)具有很大潛力的領(lǐng)域。三、未被充分發(fā)掘的領(lǐng)域1、波動(dòng)率預(yù)測(cè):ML算法目前已經(jīng)被應(yīng)用于金融數(shù)據(jù)波動(dòng)率的預(yù)測(cè),而對(duì)于能源市場(chǎng)風(fēng)險(xiǎn)管理的應(yīng)用很少。對(duì)波動(dòng)率進(jìn)行建模包含著機(jī)遇與挑戰(zhàn):挑戰(zhàn)在于標(biāo)準(zhǔn)的ML模型中包含二階矩聚類的概念,優(yōu)點(diǎn)是波動(dòng)率不受市場(chǎng)效率的影響。目前一個(gè)嘗試是,Afkhami等人(2017)和Wang等人(2018c)等人利用互聯(lián)網(wǎng)情緒來預(yù)測(cè)能源價(jià)格波動(dòng)。2、量化非結(jié)構(gòu)化和定性信息:ML能夠很好的量化并分類非結(jié)構(gòu)化和定性數(shù)據(jù),將其運(yùn)用于預(yù)測(cè)和因果推斷,這類方法目前已經(jīng)在能源領(lǐng)域得到了應(yīng)用。但是,未來還有很大的研究空間,例如轉(zhuǎn)換不同公司的財(cái)務(wù)報(bào)告和媒體信息來確定他們的能源環(huán)境方面的狀況,或者使用基于GIS的數(shù)據(jù)來估計(jì)能源生產(chǎn)和消耗模式,以及使用情緒和社交媒體信息更好地預(yù)測(cè)電力消耗。3、因果和橫截面推斷:關(guān)于ML和因果推斷的理論討論可以參考Grimmer(2015)和Athey(2015)。一般來說,時(shí)間序列模型是能源經(jīng)濟(jì)學(xué)領(lǐng)域的主要分析形式。Hajko(2017)是極少數(shù)的例外,他試圖在研究中找出能源消耗和經(jīng)濟(jì)增長(zhǎng)之間的因果關(guān)系。4、交易策略:和波動(dòng)率類似,目前在經(jīng)濟(jì)市場(chǎng)中研究人員經(jīng)常用ML技術(shù)來制定交易策略、設(shè)計(jì)交易系統(tǒng)使交易最大化。但在能源市場(chǎng),除了諸如Wang等(2016)的一些論文外,關(guān)于ML在能源市場(chǎng)交易策略上的運(yùn)用還是很少。5、基于機(jī)器學(xué)習(xí)的優(yōu)化:幾乎沒有論文將ML與優(yōu)化技術(shù)相結(jié)合來解決管理或策略問題,然而這樣的組合已經(jīng)被用于其他領(lǐng)域,如投資組合優(yōu)化(Ban等2016)和供應(yīng)鏈(Chi等2007)因此,分析最優(yōu)行為是一個(gè)待挖掘的領(lǐng)域。四、ML/AI技術(shù)的影響ML這種高科技技術(shù)能夠替代或者補(bǔ)充人工的一些技能,這將對(duì)能源市場(chǎng)乃至其他領(lǐng)域都有變革性的影響。這種影響也會(huì)帶來行業(yè)的結(jié)構(gòu)調(diào)整,催生出新型市場(chǎng)結(jié)構(gòu)和參與者。未來的研究也可以圍繞ML對(duì)能源效率、智能網(wǎng)絡(luò)、能源生產(chǎn)成本、能源交互和市場(chǎng)效率以及行業(yè)勞動(dòng)力等領(lǐng)域的影響識(shí)別與分析展開。特別是隨著氣候變化問題關(guān)注度提高,可再生能源的利用和智能電網(wǎng)的普及,ML/AI可以更快地了解消費(fèi)者這些方面的需求。最后作者不完全地總結(jié)了目前可圍繞ML/AI技術(shù)展開的開放性問題:1、緩解可再生能源間斷性問題2、探究自動(dòng)駕駛汽車對(duì)各種能源需求的影響3、智能樓宇及其能源管理系統(tǒng)對(duì)整體能源需求的影響,以及能源分布模式4、ML本身對(duì)于能源消耗和氣候問題目標(biāo)的積極影響(提高了能源利用效率)和消極影響(為了計(jì)算而耗費(fèi)的大量電力)5、更智能的能源系統(tǒng)可能帶來的反彈問題6、當(dāng)前和未來能源行業(yè)勞動(dòng)力所需要具備的新技能7、人機(jī)如何最佳契合來更有效地管理能源系統(tǒng)結(jié)論
本文通過回顧大量能源經(jīng)濟(jì)與金融應(yīng)用領(lǐng)域的文獻(xiàn),得出以下四條結(jié)論:1、原油和電力價(jià)格預(yù)測(cè)是最受歡迎的應(yīng)用領(lǐng)域;2、支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、遺傳算法(GA)和粒子群優(yōu)化算法(PSO)是最常用的算法;3、大部分論文使用的是價(jià)格時(shí)間序列等結(jié)構(gòu)化的數(shù)據(jù),很少處理非結(jié)構(gòu)化和定性的輸入;4、深度學(xué)習(xí)目前存在未開發(fā)的領(lǐng)域。這兩個(gè)領(lǐng)域?qū)⑼该鞯慕?jīng)濟(jì)驅(qū)動(dòng)模型與黑箱型機(jī)器學(xué)習(xí)進(jìn)行了結(jié)合,并可以使用深度學(xué)習(xí)等方法獲益。但由于能源商品市場(chǎng)效率較高,使用復(fù)雜方法預(yù)測(cè)價(jià)格的好處可能有限,且市場(chǎng)可能由于其他參與者的行為變得高效,進(jìn)一步削弱收益。同時(shí),機(jī)器學(xué)習(xí)模型在預(yù)測(cè)市場(chǎng)風(fēng)險(xiǎn)和風(fēng)險(xiǎn)管理中可以很好運(yùn)用。作者認(rèn)為,由于不同方法運(yùn)用的場(chǎng)景不同,其性能比較和排名無意義,未來的研究可能集中在特定領(lǐng)域中不同方法的運(yùn)用。附錄:監(jiān)督機(jī)器學(xué)習(xí)算法的簡(jiǎn)要概述
作者在該部分闡述了監(jiān)督類機(jī)器學(xué)習(xí)算法的概念框架,以便讀者的閱讀。一、學(xué)習(xí)學(xué)習(xí)的過程就是通過不斷地迭代,使預(yù)測(cè)值更逼近真實(shí)值的過程,當(dāng)誤差小于給定值時(shí),學(xué)習(xí)過程停止。目前為了提升學(xué)習(xí)速度,集成算法等應(yīng)運(yùn)而生。除了通過近似來學(xué)習(xí)外,也可以探索更大范圍的搜索空間進(jìn)行學(xué)習(xí)。二、支持向量機(jī)支持向量機(jī)(SVM)是一種分類方法,它將數(shù)據(jù)放置在一個(gè)超平面內(nèi),使每個(gè)類別的觀測(cè)值之間的距離最大化。SVM是用于預(yù)測(cè)原油、電力等時(shí)間序列的主要算法之一。核函數(shù)的出現(xiàn),衍生了新的算法,即核函數(shù)極限學(xué)習(xí)機(jī)(KELM)。三、人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ANN)由McCulloch和Pitts(1943)提出,它基于神經(jīng)元之間的連接,模擬大腦工作的過程,是業(yè)界最常用的機(jī)器學(xué)習(xí)算法之一。使用X-V-Y的組合方式,輸入項(xiàng)X的線性組合為隱含節(jié)點(diǎn)層,它是向量V的派生特征,Y則是這些派生特征的組合,并可以使用反向傳播的方法進(jìn)行校對(duì)。ANN模型常被用于預(yù)測(cè)電價(jià),并導(dǎo)致了徑向基函數(shù)網(wǎng)絡(luò)(RBFN)、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、非線性自回歸神經(jīng)網(wǎng)絡(luò)(NARNN)、帶有隨機(jī)時(shí)效函數(shù)的小波神經(jīng)網(wǎng)絡(luò)(WNN)、深度學(xué)習(xí)(DL)和自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)(ANBFIS)等新算法的發(fā)展。作者簡(jiǎn)要介紹了兩種具有代表性的拓展算法:1、小波神經(jīng)網(wǎng)絡(luò)(WNN):結(jié)合小波分解和神經(jīng)網(wǎng)絡(luò)的思想,通過降維來提高學(xué)習(xí)算法的性能。它首先通過生成小波基對(duì)時(shí)間序列進(jìn)行預(yù)處理,并利用估計(jì)的系數(shù)來滿足網(wǎng)絡(luò)的下一層。小波神經(jīng)網(wǎng)絡(luò)技術(shù)在能源經(jīng)濟(jì)領(lǐng)域得到了廣泛的應(yīng)用。2、深度學(xué)習(xí)(DL):深度學(xué)習(xí)準(zhǔn)確性較高,速度較快,正成為主流的機(jī)器學(xué)習(xí)算法。它具有多層結(jié)構(gòu),可以模擬更復(fù)雜的輸入變量間的交互作用。主要在圖像和語音識(shí)別、醫(yī)學(xué)診斷、自然語言處理和自動(dòng)駕駛汽車領(lǐng)域運(yùn)用。四、進(jìn)化算法進(jìn)化算法的目標(biāo)是在搜索空間很大且很復(fù)雜時(shí),優(yōu)化一個(gè)目標(biāo)函數(shù)。主要方法是遺傳算法(GAs)和粒子群優(yōu)化算法(PSO)。1、遺傳算法(GAs)和遺傳規(guī)劃(GP):內(nèi)核為達(dá)爾文進(jìn)化論。該算法使用一個(gè)值為布爾函數(shù)結(jié)果的染色體作為數(shù)據(jù)結(jié)構(gòu),染色體按照突變、交叉和選擇等進(jìn)化規(guī)律進(jìn)化,直到染色體的組合收斂成一個(gè)解,并表示一組決策規(guī)則,常用于預(yù)測(cè)每月的電能消耗。遺傳規(guī)劃是遺傳算法的一種變體,計(jì)算程序被分割成染色體,通過演化產(chǎn)生一個(gè)具有最優(yōu)解的新程序。它為編碼復(fù)雜的算法提供幫助,如SVM或決策樹。2、粒子群優(yōu)化算法(PSO):粒子群優(yōu)化和遺傳算法的演化、評(píng)估和比較不同解決方案的步驟相同,不同點(diǎn)在于解決方案沒有對(duì)過去的記憶,每個(gè)解決方案都記得它走過的路徑與到達(dá)當(dāng)前狀態(tài)的速度,并分享經(jīng)驗(yàn)和學(xué)習(xí);同時(shí),PSO中無突變過程,Unler(2008)使用PSO進(jìn)行土耳其的能源需求預(yù)測(cè)。五、混合和集成模型為提高模型預(yù)測(cè)的準(zhǔn)確性和穩(wěn)健性,可以結(jié)合多個(gè)模型?;旌夏P褪菍⑼耆煌姆椒ńM合,而集成算法則是將同一方法的多版本、弱學(xué)習(xí)器的輸出與數(shù)據(jù)或參數(shù)的變化混合在一起。1、混合模型:通常結(jié)合傳統(tǒng)的計(jì)量經(jīng)濟(jì)模型(如ARIMA),使用基于機(jī)器學(xué)習(xí)的方法,取簡(jiǎn)單或加權(quán)平均值、中位數(shù)等整合各個(gè)預(yù)測(cè),Wang等(2005)剔除了預(yù)測(cè)原油價(jià)格的早起混合模型之一。2、集成模型:常見的有引導(dǎo)集聚算法、Adaboost模型和隨機(jī)森林。引導(dǎo)集聚算法是將決策樹等學(xué)習(xí)算法應(yīng)用于多個(gè)具有置換的樣本的平均結(jié)果,Adaboost在每次迭代中增加誤分類觀測(cè)的權(quán)重,隨機(jī)森林隨機(jī)選擇不同的樣本和特征構(gòu)建多個(gè)決策樹。
Reference: Ghoddusi, H., et al. (2019). 'Machine learning in energy economics and finance: A review.' Energy Economics *81*: 709-727.