書(shū)名:《量化投資:數(shù)據(jù)挖掘技術(shù)與實(shí)踐》
作者:卓金武 周英
出版社:電子工業(yè)出版社
出版時(shí)間:2015-5-1
內(nèi)容簡(jiǎn)介
全書(shū)內(nèi)容分為三篇。第一篇(基礎(chǔ)篇)主要介紹數(shù)據(jù)挖掘與量化投資的關(guān)系,以及數(shù)據(jù)挖掘的概念、實(shí)現(xiàn)過(guò)程、主要內(nèi)容、主要工具等內(nèi)容。第二篇(技術(shù)篇)系統(tǒng)介紹了數(shù)據(jù)挖掘的相關(guān)技術(shù)及這些技術(shù)在量化投資中的應(yīng)用,主要包括數(shù)據(jù)的準(zhǔn)備、數(shù)據(jù)的探索、關(guān)聯(lián)規(guī)則方法、數(shù)據(jù)回規(guī)方法、分類方法、聚類方法、預(yù)測(cè)方法、診斷方法、時(shí)間序列方法、智能優(yōu)化方法等內(nèi)容。第三篇(實(shí)踐篇)主要介紹數(shù)據(jù)挖掘技術(shù)在量化投資中的綜合應(yīng)用實(shí)例,包括統(tǒng)計(jì)套利策略的挖掘與優(yōu)化、配對(duì)交易策略的挖掘與實(shí)現(xiàn)、數(shù)據(jù)挖掘在股票程序化交易中的綜合應(yīng)用,以及基于數(shù)據(jù)挖掘技術(shù)的量化交易系統(tǒng)的構(gòu)建。
前言
量化投資交易策略的業(yè)績(jī)穩(wěn)定,市場(chǎng)規(guī)模和份額不斷擴(kuò)大,得到越來(lái)越多投資者的認(rèn)可。中國(guó)金融業(yè)飛速發(fā)展,尤其是2010年股指期貨的推出,使得量化投資和對(duì)沖基金逐步進(jìn)入國(guó)內(nèi)投資者的視野。2012年丁鵬博士(600804)所著的《量化投資——策略與技術(shù)》出版后,更是推動(dòng)了量化投資技術(shù)在國(guó)內(nèi)的普及。目前,量化投資、對(duì)沖基金已經(jīng)成為中國(guó)資本市場(chǎng)最熱門(mén)的話題之一,各投資機(jī)構(gòu)紛紛開(kāi)始著手打造各自的量化投資精英團(tuán)隊(duì)。
量化投資是將投資理念及策略通過(guò)具體指標(biāo)、參數(shù)的設(shè)計(jì),融入到具體的模型中,用模型對(duì)市場(chǎng)進(jìn)行不帶任何情緒的跟蹤,簡(jiǎn)單而言,就是用數(shù)量化的方法對(duì)股票、期貨等投資對(duì)象進(jìn)行估值,選取適合的對(duì)象進(jìn)行投資。目前,量化投資的書(shū)籍主要集中在模型和策略及工具的使用上,但關(guān)于如何產(chǎn)生這些量化模型、量化策略的書(shū)籍的確非常少。金融市場(chǎng)瞬息萬(wàn)變,為了更好地進(jìn)行量化投資,我們要不斷去驗(yàn)證既有模型的有效性,同時(shí)要想在金融行業(yè)保持自己的競(jìng)爭(zhēng)力,又必須不斷開(kāi)發(fā)新的模型,而驗(yàn)證模型、開(kāi)發(fā)模型,所謂量化投資的主要內(nèi)容,都需要數(shù)據(jù)的支撐。另一方面,金融領(lǐng)域是數(shù)據(jù)資源保存最好、最為豐富的行業(yè),在金融領(lǐng)域已經(jīng)積累了大量的數(shù)據(jù),同時(shí)每天還在產(chǎn)生大量的交易數(shù)據(jù)、價(jià)格數(shù)據(jù)等數(shù)據(jù)信息。這些數(shù)據(jù)資源正好為量化投資提供了很好的數(shù)據(jù)基礎(chǔ),那么問(wèn)題的關(guān)鍵就是如何利用金融業(yè)豐富的數(shù)據(jù)資源更好地進(jìn)行量化投資。
數(shù)據(jù)挖掘技術(shù)是從數(shù)據(jù)中挖掘有用知識(shí)的一門(mén)系統(tǒng)性的技術(shù),剛好解決了數(shù)據(jù)利用的問(wèn)題,所以數(shù)據(jù)挖掘與量化投資便很自然地結(jié)合在一起。但數(shù)據(jù)挖掘在國(guó)內(nèi)也是一個(gè)新領(lǐng)域,所以還沒(méi)有關(guān)于量化投資與數(shù)據(jù)挖掘相結(jié)合的相關(guān)書(shū)籍。另外,目前關(guān)于數(shù)據(jù)挖掘的幾本書(shū)基本都是譯著,由于語(yǔ)言和文化的差異,國(guó)內(nèi)讀者讀起來(lái)相對(duì)吃力。在這樣的背景下,能有一本書(shū)介紹如何利用數(shù)據(jù)挖掘技術(shù)進(jìn)行量化投資還是很好的。
巧合的是,筆者在MathWorks平時(shí)的工作職責(zé)之一是支持金融客戶,相當(dāng)比例是關(guān)于量化投資的,二是支持其他商業(yè)客戶的數(shù)據(jù)挖掘,所以對(duì)這兩個(gè)領(lǐng)域都有一定的了解。在一次研討會(huì)上,丁鵬博士與筆者討論了數(shù)據(jù)挖掘在量化投資中應(yīng)用的話題,感覺(jué)這是個(gè)非常好的課題,建議筆者寫(xiě)一本這樣的書(shū)。筆者對(duì)這個(gè)課題也非常感興趣,于是就有了這本書(shū)的開(kāi)始。
雖然筆者之前寫(xiě)過(guò)一本《MATLAB在數(shù)學(xué)建模中的應(yīng)用》(在MATLAB相關(guān)書(shū)籍中也算是有影響力的書(shū),2013年當(dāng)當(dāng)網(wǎng)自然科學(xué)類圖書(shū)中銷量排名Top20),具有一些寫(xiě)作經(jīng)驗(yàn)。但寫(xiě)這本書(shū)確實(shí)還是相當(dāng)費(fèi)勁。因?yàn)榻鹑趶臉I(yè)者大多比較務(wù)實(shí),所以本書(shū)的一個(gè)寫(xiě)作原則就是內(nèi)容一定要?jiǎng)?wù)實(shí)。數(shù)據(jù)挖掘中涉及很多方法,這些方法的理論往往比較難,對(duì)于金融從業(yè)者來(lái)說(shuō),這些方法的思想和應(yīng)用最重要,理論不是關(guān)注的重點(diǎn)。所以對(duì)于本書(shū)中介紹的每個(gè)方法,盡量介紹清楚方法的思想、實(shí)現(xiàn)步驟,并以案例形式提供方法實(shí)現(xiàn)的MATLAB程序,這樣讀者就可以直接借鑒書(shū)中的程序,很快將書(shū)中的技術(shù)轉(zhuǎn)化為自己的實(shí)際操作工具。但筆者查閱了大量的參數(shù)書(shū)和網(wǎng)絡(luò)資料,發(fā)現(xiàn)數(shù)據(jù)挖掘中的這些方法,很少有這樣的程序,所以筆者花費(fèi)了大量的時(shí)間和精力去編寫(xiě)這些方法的程序。這樣做也特別符合當(dāng)代人的學(xué)習(xí)習(xí)慣,現(xiàn)在社會(huì)信息實(shí)在是太豐富了,對(duì)讀者來(lái)說(shuō),一本好書(shū)應(yīng)該能讓大家快速掌握這本書(shū)的精華。為了早點(diǎn)寫(xiě)好本書(shū),在寫(xiě)書(shū)期間,筆者將幾乎全部工作和生活之余的時(shí)間全部投入到寫(xiě)書(shū)中去,每個(gè)晚上,每個(gè)周末,每次帶孩子去練習(xí)跆拳道的時(shí)候都在寫(xiě)書(shū)。雖然看似很辛苦,但確實(shí)很有成就感,是這份成就感給了我執(zhí)著的動(dòng)力和快樂(lè),最終完成了此書(shū)??傊瑢?xiě)書(shū)的過(guò)程是“痛并快樂(lè)著”!
本書(shū)內(nèi)容
全書(shū)內(nèi)容分為三篇。
第一篇(基礎(chǔ)篇)主要介紹一些基本概念和知識(shí),包括數(shù)據(jù)挖掘與量化投資的關(guān)系,數(shù)據(jù)挖掘的概念、實(shí)現(xiàn)過(guò)程、主要內(nèi)容、主要工具等內(nèi)容。
第二篇(技術(shù)篇)是本書(shū)的主體,系統(tǒng)介紹了數(shù)據(jù)挖掘的相關(guān)技術(shù)及這些技術(shù)在量化投資中的應(yīng)用實(shí)例。這部分又分為如下三個(gè)層次:
?。?)數(shù)據(jù)挖掘前期的一些技術(shù),包括數(shù)據(jù)的準(zhǔn)備(收集數(shù)據(jù)、數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)預(yù)處理等)和數(shù)據(jù)的探索(衍生變量、數(shù)據(jù)可視化、樣本選擇、數(shù)據(jù)降維等)。
?。?)數(shù)據(jù)挖掘的核心六大類方法,包括關(guān)聯(lián)規(guī)則、回歸、分類、聚類、預(yù)測(cè)和診斷。對(duì)于每類方法,則詳細(xì)介紹了其包含的典型算法,包括基本思想、應(yīng)用場(chǎng)景、算法步驟、MATLAB實(shí)現(xiàn)程序、應(yīng)用案例。同時(shí),對(duì)每類方法還介紹了一個(gè)在量化投資中的應(yīng)用案例,以強(qiáng)化這些方法在量化投資中的實(shí)用性。
?。?)數(shù)據(jù)挖掘中特殊的實(shí)用技術(shù),包含兩章內(nèi)容,一是關(guān)于時(shí)序數(shù)據(jù)挖掘的時(shí)間序列技術(shù),二是關(guān)于優(yōu)化的智能優(yōu)化方法。這個(gè)層次也是數(shù)據(jù)技術(shù)體系中不可或缺的技術(shù)。時(shí)序數(shù)據(jù)是數(shù)據(jù)挖掘中的一類特殊數(shù)據(jù),并且金融數(shù)據(jù)往往都具有時(shí)序性,所以針對(duì)該類特殊的數(shù)據(jù)類型,又介紹了時(shí)間序列方法。另外,數(shù)據(jù)挖掘離不開(kāi)優(yōu)化,量化投資也離不開(kāi)優(yōu)化,所以又以一章智能優(yōu)化方法介紹兩個(gè)比較常用的優(yōu)化方法,遺傳算法和模擬退火算法。
第三篇(實(shí)踐篇)主要介紹數(shù)據(jù)挖掘技術(shù)在量化投資中的綜合應(yīng)用實(shí)例,包括統(tǒng)計(jì)套利策略的挖掘、配對(duì)交易策略的挖掘、基于數(shù)據(jù)挖掘技術(shù)的股票程序化交易,最后一章——基于數(shù)據(jù)挖掘技術(shù)的量化交易系統(tǒng),則給出了集成主流數(shù)據(jù)挖掘技術(shù)的量化投資系統(tǒng)的框架,讀者可以利用該框架,依據(jù)書(shū)中介紹的數(shù)據(jù)挖掘技術(shù),結(jié)合自己的情況,開(kāi)發(fā)出屬于自己的量化交易系統(tǒng),從而輕松實(shí)現(xiàn)從理論到實(shí)踐這一跨越,更好地利用數(shù)據(jù)挖掘技術(shù)在量化投資的領(lǐng)域乘風(fēng)破浪,不斷創(chuàng)造佳績(jī)。
本書(shū)特色
綜觀全書(shū),可發(fā)現(xiàn)本書(shū)的特點(diǎn)鮮明,主要表現(xiàn)在:
?。?)方法務(wù)實(shí),學(xué)以致用。本書(shū)介紹的方法都是數(shù)據(jù)挖掘中的主流方法,都經(jīng)過(guò)實(shí)踐的檢驗(yàn),具有較強(qiáng)的實(shí)踐性。對(duì)于每種方法,本書(shū)基本都給出了完整、詳細(xì)的源代碼,這對(duì)于讀者來(lái)說(shuō),具有非常大的參考價(jià)值,很多程序可供讀者直接套用并加以學(xué)習(xí),并可以直接轉(zhuǎn)化為自己的量化投資實(shí)戰(zhàn)工具。
?。?)知識(shí)系統(tǒng),易于理解。本書(shū)的知識(shí)體系應(yīng)該是當(dāng)前數(shù)據(jù)挖掘書(shū)籍中最全、最完善的,不僅包含詳細(xì)的數(shù)據(jù)挖掘流程、數(shù)據(jù)準(zhǔn)備方法、數(shù)據(jù)探索方法,還包含六大類數(shù)據(jù)挖掘主體方法、時(shí)序數(shù)據(jù)挖掘方法、智能優(yōu)化方法。正因?yàn)橛型暾闹R(shí)體系,讀者讀起來(lái)才有很好的完整感,從而更利于理解數(shù)據(jù)挖掘的知識(shí)體系,這對(duì)于學(xué)習(xí)是非常有幫助的。
(3)結(jié)構(gòu)合理,易于學(xué)習(xí)。在講解方法時(shí),由淺入深,循序漸進(jìn),讓初學(xué)者知道入門(mén)的切入點(diǎn),讓專業(yè)人員又有值得借鑒的“干貨”?;A(chǔ)篇、技術(shù)篇和實(shí)踐篇的結(jié)構(gòu)部署也讓本書(shū)獨(dú)樹(shù)一幟,讓讀者在學(xué)習(xí)數(shù)據(jù)挖掘和量化投資的過(guò)程中有一個(gè)循序漸進(jìn)的過(guò)程,使讀者在短時(shí)間內(nèi)成為一位數(shù)據(jù)挖掘高手,同時(shí)成為一位量化投資高手。
?。?)案例實(shí)用,易于借鑒。絕大多數(shù)實(shí)例都是量化投資領(lǐng)域的實(shí)例,所以綜觀全書(shū),本書(shū)都在有意引導(dǎo)讀者思考如何讓數(shù)據(jù)挖掘在量化投資中產(chǎn)生更實(shí)際的價(jià)值。
?。?)主線明晰,脈絡(luò)分明。本書(shū)涉及知識(shí)面寬廣,以數(shù)據(jù)挖掘和量化投資為中心,輻射銀行、債券、營(yíng)銷、零售等領(lǐng)域和學(xué)科。為了與書(shū)稿主線保持一致,這些所涵蓋的領(lǐng)域雖然只是略微帶過(guò),但是從側(cè)面折射出數(shù)據(jù)挖掘技術(shù)真的廣泛服務(wù)于社會(huì)各個(gè)領(lǐng)域。在現(xiàn)代社會(huì),某學(xué)科單打獨(dú)斗的時(shí)代已經(jīng)過(guò)去了,本書(shū)在無(wú)形之中已經(jīng)樹(shù)立了一個(gè)意識(shí):各學(xué)科的知識(shí)之間是相通的,運(yùn)用知識(shí)的最高境界是各學(xué)科知識(shí)的大融合。
?。?)理論與實(shí)踐相得益彰。對(duì)于本書(shū)的每個(gè)方法,除理論的講解,都配有一個(gè)典型的應(yīng)用案例,讀者可以通過(guò)案例加深對(duì)理論的理解,同時(shí)理論也讓案例的應(yīng)用更有信服力。技術(shù)的介紹都是以實(shí)現(xiàn)實(shí)例為目地,同時(shí)提供大量技術(shù)實(shí)現(xiàn)的源程序,方便讀者學(xué)習(xí),注重實(shí)踐和應(yīng)用,秉承筆者務(wù)實(shí)、切近讀者的寫(xiě)作風(fēng)格。
(7)內(nèi)容獨(dú)特,趣味橫生。很多方法和內(nèi)容是同類書(shū)籍所沒(méi)有的,這無(wú)疑增強(qiáng)了本書(shū)的新穎性和趣味性。
(8)文字簡(jiǎn)介、明了,易于閱讀。在本書(shū)編寫(xiě)過(guò)程中,在保證描述精準(zhǔn)的前提下,摒棄那些刻板、索然無(wú)味的文字,讓文字充滿活力,更易于閱讀。
讀者對(duì)象
從事投資工作的專業(yè)人士,包括證券、基金、私募、信托、銀行、保險(xiǎn)等領(lǐng)域的從業(yè)者。
從事數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)管理工作的專業(yè)人士。
金融、經(jīng)濟(jì)、管理、統(tǒng)計(jì)等專業(yè)的教師和學(xué)生。
從事量化投資或數(shù)據(jù)挖掘方向研究的科研工作者。
希望學(xué)習(xí)MATLAB的工程師或科研工作者。因?yàn)楸緯?shū)的代碼都是用MATLAB編寫(xiě)的,所以對(duì)于希望學(xué)習(xí)MATLAB的讀者來(lái)說(shuō),也是一本很好的參考書(shū)。
致專業(yè)人士
對(duì)于從事量化投資的專業(yè)人士來(lái)說(shuō),書(shū)中的數(shù)據(jù)挖掘技術(shù)是值得借鑒的技術(shù),至少會(huì)有助于挖掘或啟發(fā)策略。書(shū)中的實(shí)例都具有一定的實(shí)戰(zhàn)背景,含有一些從數(shù)據(jù)挖掘?qū)用娴牟呗?,大家可以嘗試將這些技術(shù)和策略融入自己的思想和策略中,以讓自己的策略更強(qiáng)大。另外,對(duì)于書(shū)中介紹的各方法的理論,如果您有很好的數(shù)學(xué)或計(jì)算機(jī)背景,且有時(shí)間或感興趣,可以認(rèn)真看,否則,理論部分可以直接跳過(guò)。但是每種方法的思想,應(yīng)用場(chǎng)景一定要領(lǐng)悟,這樣當(dāng)遇到合適的場(chǎng)景后,就可以馬上想到用哪種方法,然后直接借鑒書(shū)中的代碼就可以輕松將這些方法應(yīng)用到自己的量化投資實(shí)踐中。
對(duì)于從事數(shù)據(jù)挖掘的專業(yè)人士來(lái)說(shuō),大家可以關(guān)注整個(gè)數(shù)據(jù)挖掘知識(shí)體系和數(shù)據(jù)挖掘的流程,因?yàn)楸緯?shū)的數(shù)據(jù)挖掘知識(shí)體系應(yīng)該是當(dāng)前數(shù)據(jù)挖掘數(shù)據(jù)中體系最全、最完善的。另外,數(shù)據(jù)挖掘流程也介紹得很詳細(xì),具有很強(qiáng)的操作性。此外,書(shū)中的算法案例和綜合應(yīng)用案例,也算是本書(shū)的特色,值得借鑒。
致教師
本書(shū)系統(tǒng)地介紹了數(shù)據(jù)挖掘設(shè)計(jì)的理論、方法和案例,可以作為金融、經(jīng)濟(jì)、管理、統(tǒng)計(jì)等學(xué)科的本科專業(yè)教材或研究生教材。相比一般的數(shù)據(jù)挖掘教材,量化投資更容易激發(fā)學(xué)生的學(xué)習(xí)興趣,興趣是最好的老師,這對(duì)開(kāi)展教學(xué)是非常有利的。
書(shū)中的內(nèi)容雖然系統(tǒng),但也相對(duì)獨(dú)立,教師可以根據(jù)課程的學(xué)時(shí)安排和專業(yè)方向的側(cè)重,選擇合適的內(nèi)容進(jìn)行課堂教學(xué),其他內(nèi)容則可以作為參考章節(jié)。授課部分,一般會(huì)包含第一篇的兩章和第二篇的前8章,總共10章內(nèi)容,而如果課時(shí)較多,則可以增加其他章節(jié),包括后面商業(yè)案例的學(xué)習(xí)。
聯(lián)系客服