本書以大數(shù)據(jù)時(shí)代為背景,將機(jī)器學(xué)習(xí)與資產(chǎn)定價(jià)相結(jié)合,在風(fēng)險(xiǎn)解釋、收益預(yù)測(cè)以及經(jīng)濟(jì)機(jī)制等方面進(jìn)行了探索研究。首先,針對(duì)中國(guó)A股市場(chǎng)存在的收益與風(fēng)險(xiǎn)不對(duì)稱問(wèn)題,使用機(jī)器學(xué)習(xí)重新對(duì)系統(tǒng)性風(fēng)險(xiǎn)進(jìn)行測(cè)度,緩解了異象;其次,將研究拓展到樣本外的可預(yù)測(cè)性上,對(duì)比了各類機(jī)器學(xué)習(xí)算法,創(chuàng)新性地構(gòu)建了動(dòng)態(tài)深度學(xué)習(xí)模型,提升了市場(chǎng)有效性;最后,從機(jī)器學(xué)習(xí)的可解釋性出發(fā),從微觀和宏觀兩個(gè)視角對(duì)機(jī)器學(xué)習(xí)背后的經(jīng)濟(jì)機(jī)制進(jìn)行了討論。
本書以大數(shù)據(jù)時(shí)代為背景,將機(jī)器學(xué)習(xí)與資產(chǎn)定價(jià)相結(jié)合,在風(fēng)險(xiǎn)解釋、收益預(yù)測(cè)以及經(jīng)濟(jì)機(jī)制等方面進(jìn)行了探索研究。通過(guò)分析已有數(shù)據(jù)資料、建立模型、數(shù)據(jù)分析,本書得出機(jī)器學(xué)習(xí)在資產(chǎn)定價(jià)領(lǐng)域有廣泛應(yīng)用空間。
馬甜、中央民族大學(xué)經(jīng)濟(jì)學(xué)院講師,本科和碩士就讀于北京航空航天大學(xué)可靠性與系統(tǒng)工程學(xué)院,博士畢業(yè)于中央財(cái)經(jīng)大學(xué)金融學(xué)院。主要研究方向?yàn)闄C(jī)器學(xué)習(xí)與資產(chǎn)定價(jià),相關(guān)研究成果發(fā)表于《經(jīng)濟(jì)學(xué)(季刊)》《管理科學(xué)學(xué)報(bào)》、JournalofEmpiricalFinance等國(guó)內(nèi)外權(quán)威金融雜志。主持國(guó)家自然科學(xué)基金青年項(xiàng)目。
第一章緒論1
第一節(jié)研究背景2
第二節(jié)研究?jī)?nèi)容和方法6
第三節(jié)研究意義及創(chuàng)新10
第四節(jié)本書結(jié)構(gòu)18
第二章文獻(xiàn)綜述21
第一節(jié)資產(chǎn)定價(jià)的理論模型發(fā)展歷程23
第二節(jié)資產(chǎn)定價(jià)中的異象特征36
第三節(jié)機(jī)器學(xué)習(xí)與資產(chǎn)定價(jià)44
第四節(jié)文獻(xiàn)述評(píng)51
第三章數(shù)據(jù)構(gòu)建及機(jī)器學(xué)習(xí)模型設(shè)定55
第一節(jié)中國(guó)股市收益和特征數(shù)據(jù)56
第二節(jié)機(jī)器學(xué)習(xí)模型設(shè)定68
第三節(jié)本章小節(jié)86
第四章機(jī)器學(xué)習(xí)與中國(guó)股市系統(tǒng)性風(fēng)險(xiǎn)測(cè)度—基于貝塔異象視角的研究87
第一節(jié)理論模型和數(shù)據(jù)統(tǒng)計(jì)89
第二節(jié)第二節(jié)基于機(jī)器學(xué)習(xí)的動(dòng)態(tài)CAPM模型93
第三節(jié)基于Fama-French三因子模型的探討101
第四節(jié)穩(wěn)健性檢驗(yàn)104
第五節(jié)本章小結(jié)105
第五章基于機(jī)器學(xué)習(xí)的中國(guó)股市收益預(yù)測(cè)研究107
第一節(jié)個(gè)股橫截面收益預(yù)測(cè)109
第二節(jié)投資組合分析115
第三節(jié)本章小節(jié)124
第六章機(jī)器學(xué)習(xí)模型的可解釋性與經(jīng)濟(jì)機(jī)制分析127
第一節(jié)經(jīng)濟(jì)重要度分析129
第二節(jié)因子重要度分析130
第三節(jié)深度學(xué)習(xí)因子的微觀經(jīng)濟(jì)機(jī)制研究132
第四節(jié)深度學(xué)習(xí)因子的宏觀經(jīng)濟(jì)機(jī)制分析137
第五節(jié)本章小節(jié)143
第七章結(jié)論與展望145
第一節(jié)主要結(jié)論146
第二節(jié)啟示150
第三節(jié)研究不足和未來(lái)研究展望152
參考文獻(xiàn)155
附錄169
附錄一:企業(yè)微觀層面特征變量構(gòu)建方法170
附錄二:機(jī)器學(xué)習(xí)模型的超參數(shù)設(shè)定180
后記184
第一節(jié)研究背景
對(duì)收益與風(fēng)險(xiǎn)的解釋和預(yù)測(cè)是資產(chǎn)定價(jià)領(lǐng)域的核心議題。無(wú)論是橫截面上的個(gè)股收益比較還是市場(chǎng)或指數(shù)的時(shí)序收益預(yù)測(cè),核心問(wèn)題在于確定合適的資產(chǎn)定價(jià)模型。傳統(tǒng)的資本資產(chǎn)定價(jià)模型CAPM基于Markowitz的均值-方差組合理論設(shè)定,認(rèn)為股票或組合的超額收益來(lái)源于其包含的系統(tǒng)風(fēng)險(xiǎn)。后續(xù)的套利定價(jià)模型APT和經(jīng)典的Fama-French因子模型指出影響收益的因素不只市場(chǎng)因子,還應(yīng)包括其他諸如企業(yè)基本面和宏觀環(huán)境等因子變量,即多因子模型。多因子模型的提出極大地豐富了資產(chǎn)定價(jià)領(lǐng)域的探索度,眾多傳統(tǒng)模型無(wú)法解釋的異象被發(fā)現(xiàn)并構(gòu)造成為定價(jià)因子,形成了因子動(dòng)物園(FactorZoo)。
目前,學(xué)術(shù)界對(duì)于資產(chǎn)定價(jià)研究缺乏高維視角的探索。到目前為止,我們已經(jīng)發(fā)現(xiàn)了大量具備預(yù)測(cè)能力的企業(yè)特征,而很多研究文獻(xiàn)仍然只使用了少量的因子數(shù)。相當(dāng)一部分橫截面股票收益預(yù)測(cè)的研究工作將重點(diǎn)放在少量的公司特征的挖掘和回歸上,如公司規(guī)模、盈利能力或公司賬面市值比等。鑒于大量因子變量與收益預(yù)測(cè)和構(gòu)建基于因子的投資組合的潛在相關(guān)性,關(guān)注如此少的變量實(shí)際上意味著研究者采用了非常高程度的稀疏性模型。即在成百上千的潛在因子中,通過(guò)正則化將絕大多數(shù)特征的影響都降低為零。
但上述變量選擇過(guò)程具有相當(dāng)?shù)闹饔^性,且我們無(wú)法獲知在引入息優(yōu)勢(shì)。與此同時(shí),近年來(lái)可以充分捕捉預(yù)期股票收益的有效因子數(shù)量一直呈上升趨勢(shì)。從最早的FamaandFrench(1993)三因子模型,到Fama-French五因子模型,以及后續(xù)更多異象因子的發(fā)現(xiàn)(圖1-1),資產(chǎn)定價(jià)正在走入大數(shù)據(jù)時(shí)代。新的時(shí)代背景帶來(lái)新的研究挑戰(zhàn),如對(duì)于眾多特征異象有效性的聯(lián)合檢驗(yàn),異象之間的冗余關(guān)系,新異象對(duì)于定價(jià)模型的邊際貢獻(xiàn)度以及異象的重要度排序等,這些問(wèn)題無(wú)法通過(guò)傳統(tǒng)計(jì)量模型進(jìn)行解釋,而需要以高維視角結(jié)合機(jī)器學(xué)習(xí)進(jìn)行探討研究。
不只是學(xué)術(shù)研究,現(xiàn)實(shí)世界中的投資者在進(jìn)行資產(chǎn)配置決策時(shí)同樣面臨高維數(shù)據(jù)問(wèn)題。理性的投資者基于資產(chǎn)價(jià)格進(jìn)行投資,資產(chǎn)價(jià)格反映了投資者對(duì)未來(lái)資產(chǎn)收益的預(yù)期。近年來(lái),隨著新媒體的快速發(fā)展,投資者面臨著如何從大量潛在預(yù)測(cè)變量中獲取有效信息進(jìn)行預(yù)測(cè)的困擾,F(xiàn)有的研究框架將投資者認(rèn)知簡(jiǎn)單地設(shè)定為只包含少量參數(shù)的低維模型,并不能充分地反映當(dāng)下的高維數(shù)據(jù)環(huán)境。
面對(duì)金融大數(shù)據(jù)帶來(lái)的挑戰(zhàn),機(jī)器學(xué)習(xí)算法的改進(jìn)和應(yīng)用已成為近年來(lái)學(xué)術(shù)研究的熱點(diǎn)。機(jī)器學(xué)習(xí)將訓(xùn)練數(shù)據(jù)輸入計(jì)算機(jī)進(jìn)行學(xué)習(xí),并利用訓(xùn)練后的模型進(jìn)行預(yù)測(cè)研究。例如,在圖像識(shí)別中,通過(guò)將食物圖像分為包含水果和不包含水果兩類,算法在訓(xùn)練集中學(xué)習(xí)各圖像像素與食物分類之間的關(guān)系。在完成訓(xùn)練后該算法就可以用來(lái)預(yù)測(cè)尚未進(jìn)行分類的圖像中是否包含水果。機(jī)器學(xué)習(xí)模型在訓(xùn)練過(guò)程中可以有效處理高維數(shù)據(jù),避免傳統(tǒng)回歸模型如最小二乘回歸(OLS)等統(tǒng)計(jì)工具的過(guò)擬合問(wèn)題。雖然機(jī)器學(xué)習(xí)在諸多工程領(lǐng)域中表現(xiàn)優(yōu)異,但其在金融市場(chǎng)的應(yīng)用并不能通過(guò)簡(jiǎn)單的移植來(lái)完成。其主要原因在于金融數(shù)據(jù)自身特有的性質(zhì)。首先是信噪比問(wèn)題,由于存在巨大的市場(chǎng)噪聲,金融數(shù)據(jù)的信噪比往往較低,此外有效市場(chǎng)假說(shuō)理論表明一個(gè)完全有效的市場(chǎng)是無(wú)法利用過(guò)往信息獲取超額收益的,雖然現(xiàn)實(shí)中并不存在這樣一個(gè)完美市場(chǎng),但市場(chǎng)交易者套利行為的存在的確會(huì)消化大部分有效信息,降低歷史數(shù)據(jù)的有效性。由此帶來(lái)的另一個(gè)問(wèn)題是市場(chǎng)結(jié)構(gòu)的周期變化,新信息的不斷構(gòu)建和消化帶來(lái)了定價(jià)模型的動(dòng)態(tài)變化,正如一張隨時(shí)變化的“臉”使得面部識(shí)別不再有效一樣,這種波動(dòng)使得模型預(yù)測(cè)變得復(fù)雜和困難。
金融數(shù)據(jù)的第二個(gè)特點(diǎn)在于其較短的樣本量。現(xiàn)代化股票市場(chǎng)成立不過(guò)百年,相比其他人工智能項(xiàng)目,更多新金融數(shù)據(jù)的獲取只能依靠時(shí)間的推移產(chǎn)生。而相比結(jié)構(gòu)化面板數(shù)據(jù),非結(jié)構(gòu)化的新興媒體數(shù)據(jù)誕生的時(shí)間更晚,受限的數(shù)據(jù)量約束了模型的估計(jì)和驗(yàn)證過(guò)程。
機(jī)器學(xué)習(xí)的可解釋性研究同樣十分必要。一些機(jī)器學(xué)習(xí)模型為典型的“黑箱”結(jié)構(gòu),雖然擁有優(yōu)異的預(yù)測(cè)和分類能力,但理論解釋卻十分匱乏。而對(duì)于金融市場(chǎng)的參與者來(lái)說(shuō),了解模型的傳遞機(jī)理是非常重要的。其意義在于:第一,可以了解模型定價(jià)機(jī)理;第二,在模型發(fā)生失效時(shí)可以及時(shí)做出調(diào)整。傳統(tǒng)資產(chǎn)定價(jià)模型如Fama-French三因子模型認(rèn)為超額回報(bào)可由市場(chǎng)資產(chǎn)組合、市值因子和賬面市值比因子來(lái)解釋,