金融商業(yè)算法建模:基于Python和SAS
定 價(jià):109 元
叢書(shū)名:金融商業(yè)數(shù)據(jù)分析與應(yīng)用系列
- 作者:趙仁乾,田建中,葉本華,常國(guó)珍
- 出版時(shí)間:2021/10/1
- ISBN:9787111692775
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:F830.41
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
內(nèi)容簡(jiǎn)介
這是一本貫穿金融業(yè)務(wù)經(jīng)營(yíng)全流程,以業(yè)務(wù)為驅(qū)動(dòng)的金融數(shù)據(jù)挖掘與建模著作,涵蓋分析框架、模型算法、模型評(píng)估、模型監(jiān)控、算法工程化等整個(gè)數(shù)據(jù)建模的閉環(huán)。
本書(shū)的4位作者都是在金融領(lǐng)域有有多年工作經(jīng)驗(yàn)的大數(shù)據(jù)專家,不僅技術(shù)功底深厚、業(yè)務(wù)經(jīng)驗(yàn)豐富,而且對(duì)金融行業(yè)從業(yè)者的需求痛點(diǎn)和圖書(shū)市場(chǎng)的供給情況有深入了解,他們通過(guò)精心策劃和寫(xiě)作,讓本書(shū)內(nèi)容獨(dú)樹(shù)一幟:涵蓋金融業(yè)務(wù)經(jīng)營(yíng)全流程,全部以業(yè)務(wù)驅(qū)動(dòng),包含大量針對(duì)具體場(chǎng)景的實(shí)戰(zhàn)案例。
本書(shū)針對(duì)決策類、識(shí)別類、優(yōu)化分析類3大主題,獨(dú)創(chuàng)9大模板:客戶價(jià)值預(yù)測(cè)、營(yíng)銷響應(yīng)預(yù)測(cè)、細(xì)分畫(huà)像、交叉銷售、申請(qǐng)反欺詐、違規(guī)行為識(shí)別、預(yù)測(cè)、運(yùn)籌優(yōu)化、流程挖掘,詳細(xì)講解了每個(gè)模板算法原理、評(píng)估方法、優(yōu)化方法和應(yīng)用案例等,內(nèi)容上極力做到準(zhǔn)確、明晰、直觀與實(shí)用。
此外,本書(shū)還對(duì)數(shù)據(jù)科學(xué)項(xiàng)目中比較容易被忽視的內(nèi)容做了補(bǔ)充,包括模型評(píng)估、模型監(jiān)控、算法工程化,能指導(dǎo)讀者構(gòu)建易讀、高效、健壯的數(shù)據(jù)科學(xué)工程。
本書(shū)堅(jiān)持理論與實(shí)踐相結(jié)合,通過(guò)圖形、示例、公式幫助讀者快速掌握算法與優(yōu)化理論的同時(shí),還打造了一套可輕松適配各種分析場(chǎng)景與需求的工具模板,力圖幫助讀者從理論快速跨越到實(shí)踐。
(1)作者背景資深:4位作者都是在金融領(lǐng)域有10~20年數(shù)據(jù)挖掘和算法建模經(jīng)驗(yàn)的資深專家,技術(shù)功底深厚,業(yè)務(wù)經(jīng)驗(yàn)豐富。(2)金融業(yè)務(wù)驅(qū)動(dòng):以真實(shí)的業(yè)務(wù)場(chǎng)景和案例為驅(qū)動(dòng),涵蓋金融業(yè)務(wù)經(jīng)營(yíng)的全流程,告別純理論和不接地氣。(3)獨(dú)創(chuàng)9大模板:針對(duì)決策類、識(shí)別類、優(yōu)化分析類3大主題,獨(dú)創(chuàng)9大模板:客戶價(jià)值預(yù)測(cè)、營(yíng)銷響應(yīng)預(yù)測(cè)、細(xì)分畫(huà)像、交叉銷售、申請(qǐng)反欺詐、違規(guī)行為識(shí)別、預(yù)測(cè)、運(yùn)籌優(yōu)化、流程挖掘。(4)數(shù)據(jù)建模閉環(huán):涵蓋分析框架、模型算法、模型評(píng)估、模型監(jiān)控、算法工程化等完整的數(shù)據(jù)建模閉環(huán)。
為何寫(xiě)作本書(shū)
“工欲善其事,必先利其器!
首先,當(dāng)你考慮如何將數(shù)據(jù)應(yīng)用到經(jīng)營(yíng)管理當(dāng)中,如何從數(shù)據(jù)角度診斷業(yè)務(wù)發(fā)展中存在的問(wèn)題,如何用數(shù)據(jù)指導(dǎo)業(yè)務(wù)發(fā)展,以及如何進(jìn)行數(shù)據(jù)資產(chǎn)變現(xiàn)時(shí),你會(huì)發(fā)現(xiàn)必須有一套數(shù)據(jù)加工工具以及可應(yīng)用的工作流程作為支撐。當(dāng)前市面上的數(shù)據(jù)分析工具十分豐富,有支持分布式計(jì)算的,有提供操作界面的,有免費(fèi)開(kāi)源的,有提供自動(dòng)建模功能的,甚至兼而有之的。SAS EM與Python是其中十分優(yōu)秀和流行的工具。SAS EM功能強(qiáng)大,操作簡(jiǎn)便,自動(dòng)化程度高;而Python應(yīng)用范圍廣,框架豐富,使用靈活,編寫(xiě)效率高。二者在分析過(guò)程中可以互相印證,在實(shí)際應(yīng)用中可以互為補(bǔ)充。
其次,當(dāng)前市面上有很多的數(shù)據(jù)建模分析書(shū)籍,絕大多數(shù)圖書(shū)的目錄組織方式無(wú)外乎兩種類型:一種是工具型,以介紹建模分析軟件、語(yǔ)言、框架為主;另一種是算法型,以介紹模型算法、調(diào)參、優(yōu)化等為主。而以案例為主的建模分析圖書(shū)較少,且其中往往以算法為主干,配合行業(yè)典型案例進(jìn)行講解。這樣的材料組織方式有助于開(kāi)闊眼界,但容易
“博而不專”,無(wú)法讓讀者將案例融入具體行業(yè)。對(duì)于具體行業(yè)的新手來(lái)說(shuō),一本以案例為主的金融垂直領(lǐng)域的算法手冊(cè)會(huì)更有幫助。
后,數(shù)據(jù)建模分析的目的是服務(wù)業(yè)務(wù)?v向來(lái)看,其縱貫業(yè)務(wù)經(jīng)營(yíng)的全流程,這需要我們使用一系列模型來(lái)支持獲客營(yíng)銷、客戶畫(huà)像、價(jià)值預(yù)測(cè)、交叉銷售、風(fēng)險(xiǎn)控制、運(yùn)籌優(yōu)化、客戶維系等工作;橫向來(lái)看,建模分析師要對(duì)接業(yè)務(wù)前端需求與后臺(tái)的應(yīng)用部署,這就要求建模分析師不僅要懂業(yè)務(wù)、懂?dāng)?shù)據(jù)、懂模型,還要了解數(shù)據(jù)治理體系、工程化實(shí)現(xiàn)等,這對(duì)工作流程中的協(xié)同有重要作用。從這個(gè)角度看,市場(chǎng)上也需要能涵蓋分析框架、算法案例、工程化實(shí)現(xiàn)的圖書(shū)。
鑒于以上原因,筆者認(rèn)為需要寫(xiě)一本專注于金融垂直領(lǐng)域、支持業(yè)務(wù)全流程需求、以業(yè)務(wù)引領(lǐng)的建模分析手冊(cè),為廣大從業(yè)者的工作和學(xué)習(xí)提供便利。本書(shū)以Python和SAS EM為工具,致力于為熟悉金融業(yè)務(wù)的你打造一套工具模板,使你可以輕松地根據(jù)需求展開(kāi)分析工作,并能對(duì)當(dāng)前工作的上下游流程加深理解,以便更好地開(kāi)展協(xié)同工作。
本書(shū)主要內(nèi)容
本書(shū)主要內(nèi)容如下。
(1)金融數(shù)據(jù)挖掘的九大分析模板
本書(shū)從業(yè)務(wù)需求角度出發(fā),探討統(tǒng)計(jì)建模、機(jī)器學(xué)習(xí)模型在金融領(lǐng)域的應(yīng)用,包括客戶價(jià)值預(yù)測(cè)、營(yíng)銷響應(yīng)預(yù)測(cè)、細(xì)分畫(huà)像、交叉銷售、申請(qǐng)反欺詐、違規(guī)行為識(shí)別、預(yù)測(cè)技術(shù)、運(yùn)籌優(yōu)化、流程挖掘等九大分析模板,形成模板化的工作流。同時(shí),對(duì)模型算法做了重點(diǎn)講解,方便讀者理解模型本身,并在實(shí)際工作中應(yīng)用。
(2)實(shí)踐案例
本書(shū)主要涉及SAS EM以及Python建模分析實(shí)踐,一方面介紹如何結(jié)合案例背景形成分析思路,以及在面對(duì)特定問(wèn)題時(shí)調(diào)優(yōu)模型,另一方面介紹工具的基本使用,使不熟悉SAS EM和Python的讀者能夠快速上手。
(3)算法工程化
本書(shū)為編程新手構(gòu)建良好的工程代碼結(jié)構(gòu)和編寫(xiě)優(yōu)雅的工程代碼提供建議。
讀者對(duì)象
本書(shū)主要面向金融行業(yè)的廣大業(yè)務(wù)分析師、咨詢師、數(shù)據(jù)建模師、算法工程師,同樣適合有志于從事金融行業(yè)的在校學(xué)生和數(shù)據(jù)建模分析愛(ài)好者閱讀。數(shù)據(jù)建模分析在金融行業(yè)的應(yīng)用歷史悠久,相關(guān)研究十分深入,因此對(duì)于從事電商、通信、傳統(tǒng)貿(mào)易、制造等行業(yè)的從業(yè)者來(lái)說(shuō)本書(shū)也有重要的借鑒價(jià)值。
內(nèi)容特色
本書(shū)更多地從業(yè)務(wù)應(yīng)用場(chǎng)景來(lái)組織內(nèi)容,意在更加貼近業(yè)務(wù),而非單純羅列算法。經(jīng)過(guò)與業(yè)內(nèi)專家的反復(fù)探討,本書(shū)提取了在行業(yè)應(yīng)用中價(jià)值、常用的9類場(chǎng)景,力圖提供不同場(chǎng)景中構(gòu)建數(shù)據(jù)應(yīng)用的實(shí)踐。本書(shū)涉及的算法不局限于傳統(tǒng)統(tǒng)計(jì)分析,也結(jié)合了金融業(yè)務(wù)的需求,解構(gòu)了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的前沿方法,并提供了豐富的示例代碼,以方便讀者借鑒。
如何閱讀本書(shū)
本書(shū)的定位是“手冊(cè)”,這意味著你可以根據(jù)需求單獨(dú)查閱相關(guān)章節(jié)的內(nèi)容。不過(guò),筆者仍然建議你通讀全書(shū),不僅因?yàn)楸緯?shū)涉及的算法存在一定的前后關(guān)聯(lián)性,而且因?yàn)檫@可以讓你在大腦中構(gòu)建一套商業(yè)分析工作的全流程。如果你擁有充足的時(shí)間并希望建立完整的數(shù)據(jù)建模分析體系,筆者建議你合理分配時(shí)間,反復(fù)閱讀本書(shū)。
遍,快速通讀,形成印象。這一步其實(shí)非常重要,當(dāng)你能夠在大腦中構(gòu)建本書(shū)的一個(gè)大致的體系框架時(shí),你已經(jīng)理解了金融建模分析的工作內(nèi)容和要求,并能在本書(shū)中快速定位所需的解決方案。你可以在這一步跳過(guò)算法公式和程序代碼。
第二遍,選擇性地精讀相關(guān)章節(jié)。具體選擇哪部分取決于你工作中遇到的實(shí)際問(wèn)題,只有結(jié)合實(shí)踐才能更好地理解并發(fā)散思維。精讀意味著需要耗費(fèi)時(shí)間研究業(yè)務(wù)問(wèn)題的特點(diǎn)、數(shù)據(jù)特征和模型細(xì)節(jié),一方面好能結(jié)合實(shí)際數(shù)據(jù)進(jìn)行擴(kuò)展,另一方面在某些重點(diǎn)、難點(diǎn)上需要閱讀大量相關(guān)參考資料進(jìn)行佐證。雖然本書(shū)不是純粹的編程技術(shù)書(shū),但代碼仍然非常重要,并且使用了多個(gè)數(shù)據(jù)建模分析框架。尤其對(duì)于新手來(lái)說(shuō),一定不要只是“跑”代碼,而是要“敲”代碼。
第三遍,通讀全書(shū),并關(guān)注其中的一些細(xì)節(jié),例如數(shù)學(xué)公式、參數(shù)調(diào)優(yōu)等。這有助于你加深對(duì)模型的理解,并更好地運(yùn)用模型。需要注意的是,自然語(yǔ)言永遠(yuǎn)
前言
第1章 金融建模綜述1
1.1 企業(yè)中數(shù)據(jù)分析的層級(jí)1
1.2 操作層面的數(shù)據(jù)分析對(duì)象與成果4
1.3 數(shù)據(jù)挖掘方法分類介紹4
1.3.1 預(yù)測(cè)性—有監(jiān)督學(xué)習(xí)5
1.3.2 描述性—無(wú)監(jiān)督學(xué)習(xí)10
1.4 數(shù)據(jù)挖掘方法論12
1.5 數(shù)據(jù)挖掘建?蚣艿3個(gè)原則14
1.6 利用SAS EM創(chuàng)建數(shù)據(jù)挖掘項(xiàng)目16
1.6.1 創(chuàng)建數(shù)據(jù)挖掘項(xiàng)目16
1.6.2 給項(xiàng)目添加邏輯庫(kù)和數(shù)據(jù)集20
1.6.3 SAS EM項(xiàng)目的系統(tǒng)文檔介紹26
第2章 決策類模型28
2.1 客戶價(jià)值預(yù)測(cè)28
2.1.1 線性回歸模型概述28
2.1.2 Python案例:線性回歸建模33
2.1.3 多元線性回歸的變量篩選40
2.1.4 Python案例:多元線性回歸變量篩選43
2.1.5 模型假設(shè)檢驗(yàn)44
2.1.6 殘差分析48
2.1.7 強(qiáng)影響點(diǎn)分析49
2.1.8 Python案例:線性回歸調(diào)優(yōu)實(shí)戰(zhàn)50
2.1.9 線性回歸的完整流程小結(jié)59
2.1.10 正則化61
2.1.11 Python案例:嶺回歸與Lasso回歸實(shí)戰(zhàn)65
2.2 營(yíng)銷響應(yīng)預(yù)測(cè)70
2.2.1 使用邏輯回歸預(yù)測(cè)用戶響應(yīng)率70
2.2.2 比較邏輯回歸與線性回歸70
2.2.3 圖解邏輯回歸71
2.2.4 邏輯回歸算法概述73
2.2.5 分類模型的評(píng)估75
2.2.6 分類變量的處理79
2.2.7 Python案例:邏輯回歸建模實(shí)戰(zhàn)80
2.2.8 SAS EM案例:貸款違約預(yù)測(cè)實(shí)戰(zhàn)88
2.2.9 邏輯回歸建模小結(jié)104
2.3 細(xì)分畫(huà)像104
2.3.1 主成分分析105
2.3.2 因子分析116
2.3.3 變量聚類127
2.3.4 樣本聚類1—層次聚類130
2.3.5 樣本聚類2—K-Means聚類136
2.4 交叉銷售165
2.4.1 關(guān)聯(lián)規(guī)則165
2.4.2 序列模式185
第3章 識(shí)別類模型195
3.1 申請(qǐng)反欺詐195
3.1.1 決策樹(shù)195
3.1.2 組合算法228
3.1.3 近鄰域法253
3.1.4 樸素貝葉斯257
3.1.5 支持向量機(jī)263
3.1.6 神經(jīng)網(wǎng)絡(luò)276
3.2 違規(guī)行為識(shí)別294
3.2.1 孤立森林296
3.2.2 局部異常因子304
第4章 優(yōu)化分析類模型308
4.1 預(yù)測(cè)技術(shù)308
4.1.1 效應(yīng)分解法309
4.1.2 基于動(dòng)力模型的ARIMA317
4.1.3 基于深度學(xué)習(xí)的LSTM333
4.2 運(yùn)籌優(yōu)化341
4.2.1 線性規(guī)劃342
4.2.2 整數(shù)規(guī)劃344
4.2.3 非線性規(guī)劃347
4.3 流程挖掘348
4.3.1 業(yè)務(wù)流程挖掘的總體理念348
4.3.2 流程發(fā)現(xiàn)352
4.3.3 流程監(jiān)控353
4.3.4 流程遵循354
4.3.5 Python案例:利用pm4py實(shí)現(xiàn)流程挖掘355
第5章 模型評(píng)估與模型監(jiān)控363
5.1 模型評(píng)估363
5.1.1 混淆矩陣363
5.1.2 ROC曲線363
5.1.3 KS統(tǒng)計(jì)量365
5.1.4 洛倫茲曲線與基尼系數(shù)366
5.2 模型監(jiān)控368
5.2.1 前端監(jiān)控—業(yè)務(wù)指標(biāo)368
5.2.2 前端監(jiān)控—評(píng)分分布穩(wěn)定性368
5.2.3 前端監(jiān)控—特征分布穩(wěn)定性370
5.2.4 后端監(jiān)控—評(píng)分正確性371
5.2.5 后端監(jiān)控—變量有效性372
第6章 算法工程化374
6.1 構(gòu)建合理的項(xiàng)目工程結(jié)構(gòu)374
6.1.1 為什么要構(gòu)建合理的項(xiàng)目工程結(jié)構(gòu)374
6.1.2 什么是一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目應(yīng)有的結(jié)構(gòu)375
6.2 如何編寫(xiě)規(guī)范的數(shù)據(jù)工程代碼378
6.2.1 代碼可讀性379
6.2.2 數(shù)據(jù)處理性能381
附錄 SAS EM節(jié)點(diǎn)說(shuō)明386