量化選股之因子選股(僅供參考,大牛輕拍)
一、 定義和思想
因子選股模型是應(yīng)用最為廣泛的一種選股模型,基本原理是采用某個(gè)或某些因子作為選股的標(biāo)準(zhǔn),滿足這些因子的股票則被買入,不滿足的則賣出。
因子選股模型為什么適用?舉一個(gè)簡(jiǎn)單的例子:如果有一批人參加馬拉松,想知道哪些人能獲得不錯(cuò)的成績(jī),只需在跑前做一個(gè)身體測(cè)試即可。測(cè)試可以用一個(gè)或多個(gè)指標(biāo)。對(duì)測(cè)試的結(jié)果進(jìn)行排名,排名靠前的運(yùn)動(dòng)員獲得好成績(jī)的可能性就比較大。因子選股模型的原理與此類似,可以利用某些指標(biāo)(因子)選擇未來(lái)可能表現(xiàn)較好的股票。
二、 因子的種類
哪些因子可能成為選擇股票的依據(jù)?這主要依賴于金融經(jīng)濟(jì)邏輯和市場(chǎng)經(jīng)驗(yàn)??偟膩?lái)說(shuō),因子的來(lái)源有三方面:1)公司層面因子;2)外部環(huán)境因子;3)市場(chǎng)表現(xiàn)因子。
(一)公司層面因子
公司層面因子來(lái)自于公司的微觀結(jié)構(gòu),與公司的生產(chǎn)經(jīng)營(yíng)息息相關(guān),一般來(lái)自公司的財(cái)務(wù)指標(biāo),反映了公司的盈利、運(yùn)營(yíng)、債務(wù)和成長(zhǎng)狀況。這些因子主要有:1)價(jià)值類因子,如PE、PB;2)成長(zhǎng)類因子,如ROE、凈利潤(rùn)增長(zhǎng)率;3)規(guī)模類因子,如凈利潤(rùn)、營(yíng)業(yè)收入;4)情緒類因子,如預(yù)測(cè)未來(lái)12個(gè)月的利潤(rùn)增長(zhǎng)率;5)質(zhì)量類因子,如資產(chǎn)負(fù)債率、應(yīng)收賬款周轉(zhuǎn)率。
(二)外部環(huán)境因子
政治法律、宏觀經(jīng)濟(jì)、社會(huì)習(xí)俗和技術(shù)發(fā)展等外部環(huán)境對(duì)一個(gè)行業(yè)和企業(yè)來(lái)說(shuō)都是非常重要的。比較重要并且容易量化的外部環(huán)境因子主要是1)宏觀環(huán)境因子,如經(jīng)濟(jì)增長(zhǎng)率、利率等;2)行業(yè)環(huán)境,如行業(yè)集中度等。
(三)市場(chǎng)表現(xiàn)因子
市場(chǎng)表現(xiàn)因子主要體現(xiàn)的是股票在交易過(guò)程中的價(jià)格和交易量。這些因子主要有動(dòng)量和反轉(zhuǎn)類因子、資金流向和各種技術(shù)類指標(biāo)等。
三、 建模方法
因子選股模型想法比較簡(jiǎn)單,幾乎用不到特別復(fù)雜的數(shù)學(xué)模型。如果從數(shù)
學(xué)的角度來(lái)看,因子選股模型僅僅是一個(gè)從因子到資金曲線的映射:
f(factors,parameters)=equity
其中f表示交易系統(tǒng)(線性或非線性),實(shí)際建模時(shí)可以用回歸法或打分法進(jìn)行簡(jiǎn)化處理。Factors是我們篩選出來(lái)的一些有效因子,如果這些因子有信息重疊,可以采用多元統(tǒng)計(jì)中的主成分分析或因子分析進(jìn)行降維處理。Parameters是建模時(shí)遇到的各種參數(shù),它們包括因子的權(quán)重、觀察時(shí)間長(zhǎng)度和持有時(shí)間長(zhǎng)度等。Equity是資金曲線,它反映我們賬戶隨時(shí)間的變化情況。通過(guò)對(duì)資金曲線equity的一些再處理,就可以得到一些評(píng)價(jià)指標(biāo)(如年化收益率、年化夏普比率和最大回撤等),通過(guò)這些指標(biāo)可以來(lái)評(píng)價(jià)該投資策略的效果。
從上面的模型可以可以看出,因子選股模型最重要的有兩方面:一個(gè)是有效因子的選擇,另一個(gè)是因子參數(shù)的選擇。例如到底是PE有效還是ROE有效;到底是采用1個(gè)月做調(diào)倉(cāng)周期還是3個(gè)月做調(diào)倉(cāng)周期。這些因子和參數(shù)的獲取只能通過(guò)歷史數(shù)據(jù)的回測(cè)來(lái)獲得。
四、 模型回測(cè)
模型回測(cè)的目的是為了獲得有效因子和參數(shù),再利用這些有效因子和參數(shù)篩選股票,然后構(gòu)造投資組合進(jìn)行投資,從而獲得正的alpha收益。
總體來(lái)說(shuō),模型的回測(cè)可以分下面幾個(gè)步驟進(jìn)行(具體的細(xì)節(jié)只有在做的時(shí)候才能感受到)。
第一步,數(shù)據(jù)的準(zhǔn)備。這一步主要包括數(shù)據(jù)時(shí)間段的選擇、從數(shù)據(jù)庫(kù)導(dǎo)出數(shù)據(jù)以及數(shù)據(jù)結(jié)構(gòu)的的設(shè)計(jì)。
第二步,樣本的篩選。為了使模型的有效性更強(qiáng),我們需要對(duì)樣本進(jìn)行一些篩選。如剔除選股日的ST/PT股票、剔除新股和剔除由于停牌而無(wú)法買入的股票。
第三步,數(shù)據(jù)清洗。數(shù)據(jù)清洗主要是對(duì)異常值和缺失值進(jìn)行處理。
第四步,分析計(jì)算。這一步是整個(gè)回測(cè)過(guò)程的核心,它涉及到是否標(biāo)準(zhǔn)化、參數(shù)的選擇、是否考慮交易成本和結(jié)果計(jì)算等等非常重要的問(wèn)題。
五、 撰寫研究報(bào)告
可以模仿一些比較好的數(shù)量分析報(bào)告撰寫我們的研究報(bào)告。
參考資料
[1]無(wú)名.《多因子選股模型》
[2]李洋.前言—基于matlab的量化投資
[3]光大證券.數(shù)量化投資:體系與策略
[4]國(guó)信證券.數(shù)量化投資技術(shù)綜述
[5]劉毅.因子選股模型在中國(guó)市場(chǎng)的實(shí)證研究[D].上海:復(fù)旦大學(xué),2012
聯(lián)系客服