智能風(fēng)控:評分卡建模原理 方法與風(fēng)控策略構(gòu)建
定 價:89 元
叢書名:金融科技
- 作者:張偉
- 出版時間:2021/12/1
- ISBN:9787111695677
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:F830.9
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
內(nèi)容簡介
這是一部系統(tǒng)講解評分卡建模的智能風(fēng)控著作,從業(yè)務(wù)與技術(shù)、理論與實踐、傳統(tǒng)風(fēng)控與智能風(fēng)控等角度透徹講解評分卡建模的原理、流程、方法及其風(fēng)控策略構(gòu)建。
作者在智能風(fēng)控領(lǐng)域深耕十余年,既熟悉商業(yè)銀行傳統(tǒng)風(fēng)控體系思想、方法、技術(shù)、工具,又熟悉人工智能背景下的創(chuàng)新智能風(fēng)控相關(guān)解決方案、風(fēng)險策略和風(fēng)險建模技術(shù),本書是作者實踐經(jīng)驗的系統(tǒng)性總結(jié)。
本書內(nèi)容分為六部分。
第1部分(第1章)介紹評分卡建模基礎(chǔ)知識,包括評分卡模型的概念和定義、評分卡建模全流程、評分卡模型的評價等。
第二部分(第2章)介紹銀行零售信貸領(lǐng)域產(chǎn)品特征和業(yè)務(wù)流程,以及信用風(fēng)險和欺詐風(fēng)險概念,介紹評分卡的應(yīng)用場景和業(yè)務(wù)基礎(chǔ)知識。
第三部分(第3~11章)系統(tǒng)介紹評分建模的全流程,覆蓋需求理解、數(shù)據(jù)理解、特征工程、模型設(shè)計、模型開發(fā)、模型驗證、模型部署、模型監(jiān)控、模型優(yōu)化等模型全生命周期各環(huán)節(jié)。
第四部分(第12~14章)總結(jié)了評分建模的關(guān)鍵問題及其解決方案,包括拒絕推斷、模型可解釋性等,以及模型開發(fā)過程中諸如分布不均衡、模型性能下降、模型迭代漂移等問題。
第五部分(第15章)介紹了當(dāng)前業(yè)界除評分卡外使用頻率Z高的高維機(jī)器學(xué)習(xí)技術(shù),比較了傳統(tǒng)評分卡模型和高維機(jī)器學(xué)習(xí)模型,并重點(diǎn)介紹了XGBoost和LightGBM模型。
第六部分(第16章)以貸前自動化審批場景為例,介紹基于評分的自動化審批策略構(gòu)建,幫助讀者理解評分卡模型在風(fēng)險策略設(shè)計中的應(yīng)用。
(1)作者經(jīng)驗豐富:智能風(fēng)控領(lǐng)域深耕十余年,既熟悉商業(yè)銀行傳統(tǒng)風(fēng)控體系思想、方法、技術(shù)、工具,又熟悉人工智能背景下創(chuàng)新智能風(fēng)控相關(guān)解決方案、風(fēng)險策略和風(fēng)險建模技術(shù)。(2)內(nèi)容系統(tǒng)扎實:全面系統(tǒng)講解評分建模的理論知識、業(yè)務(wù)基礎(chǔ)、建模全流程、Z新建模技術(shù)和風(fēng)控策略構(gòu)建。(3)行業(yè)一致好評:來自上海交通大學(xué)、樂信、西南財經(jīng)大學(xué)、螞蟻集團(tuán)、360金融、eBay等學(xué)界和業(yè)界的近二十位風(fēng)控專家高口碑推薦。(4)大量實戰(zhàn)代碼:結(jié)合實際生產(chǎn)環(huán)境,給出了大量Python代碼,便于讀者理解且可直接使用,實操性強(qiáng)。(5)新視角、新觀點(diǎn)、新思考:在部分技術(shù)點(diǎn)上提出了作者的新看法和新觀點(diǎn),特別 是對模型的系統(tǒng)性思考、對拒絕推斷的理解、對業(yè)務(wù)需求的理解等。 (6)融入Z新建模技術(shù):評分卡建模是相對傳統(tǒng)的建模技術(shù),作者特地介紹了特征工程、模型可解釋性、高維機(jī)器學(xué)習(xí)等Z新智能化建模技術(shù)。
為什么要寫本書
近些年來,智能風(fēng)控技術(shù)在金融風(fēng)險管理中的應(yīng)用越來越廣泛。智能風(fēng)控利用金融大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、時序數(shù)據(jù)分析、異常檢測、社交網(wǎng)絡(luò)分析、圖深度學(xué)習(xí)、知識圖譜、自然語言處理、文本挖掘等智能分析建模技術(shù),以及分布式計算、實時流式計算、實時決策引擎、設(shè)備行為分析等數(shù)據(jù)工程技術(shù),賦能金融風(fēng)控管理,極大地提升了風(fēng)險決策的準(zhǔn)確性和效率。而評分卡模型作為智能風(fēng)控技術(shù)的基礎(chǔ)部分,以其良好的可解釋性和穩(wěn)定性廣泛應(yīng)用于金融領(lǐng)域。系統(tǒng)地掌握評分卡建模技術(shù)是很有必要的,既有助于直接進(jìn)行量化建模,為金融風(fēng)控提供決策支持,又有助于加深對風(fēng)險建模的理解和認(rèn)識,提升風(fēng)險建模能力。
十多年前我初入金融風(fēng)控領(lǐng)域,便是從評分卡建模開始上手的,至今一直從事風(fēng)險量化建模、風(fēng)控策略設(shè)計、風(fēng)險解決方案相關(guān)工作。在早期做評分卡建模時,我對評分卡沒有太深刻的認(rèn)識。正所謂“無知者無畏”,我認(rèn)為評分卡建模是很簡單的事情。隨著工作經(jīng)驗的不斷積累,我逐漸嘗試從更高層面分析和建模:1)從宏觀建模全生命周期流程及全面風(fēng)控體系的角度構(gòu)建模型;2)開始深入探究和思考建模的技術(shù)細(xì)節(jié);3)更加重視從業(yè)務(wù)角度(而非純技術(shù)角度)思考建模問題。此外,我開始更深刻地理解評分卡建模技術(shù)的精妙之處,并對建模技術(shù)進(jìn)行了系統(tǒng)性的思考、梳理和總結(jié),也正是因為有了系統(tǒng)性的思考和總結(jié),才有了本書的初稿。
近幾年我經(jīng)常參加智能風(fēng)控和數(shù)據(jù)分析的線下交流活動,也曾受邀作為講師為金融機(jī)構(gòu)做內(nèi)部風(fēng)控培訓(xùn),了解到很多風(fēng)險建模人員都對評分卡建模缺乏深刻的理解。市面上已有的介紹評分卡建模技術(shù)的圖書或者側(cè)重理論介紹,實戰(zhàn)內(nèi)容很少,或者過于聚焦零散的技術(shù)片段和細(xì)枝末節(jié),不夠系統(tǒng)。不少朋友希望能有一本全面系統(tǒng)地介紹建模全流程和方法的圖書,并能兼顧業(yè)務(wù)和技術(shù),本書就是在此背景下完成的。
我曾在FICO和Accenture任職十余年,熟悉銀行傳統(tǒng)風(fēng)控體系的思想、方法、技術(shù)和工具,近幾年我又在國內(nèi)領(lǐng)先的金融科技公司負(fù)責(zé)智能風(fēng)控解決方案、風(fēng)險策略設(shè)計和風(fēng)險建模技術(shù)的創(chuàng)新研究,深刻體會到,在理解金融風(fēng)險業(yè)務(wù)本質(zhì)特征的基礎(chǔ)上,既能繼承傳統(tǒng)金融風(fēng)控核心技術(shù),又能在人工智能背景下創(chuàng)新智能風(fēng)控技術(shù),實現(xiàn)“傳統(tǒng)風(fēng)控+智能風(fēng)控”雙引擎驅(qū)動,對從事金融風(fēng)控的人員而言是很有必要的。在本書策劃編輯楊福川的邀請下,我基于這些工作經(jīng)驗以及對智能風(fēng)控的理解寫了本書,供廣大已從事或擬從事智能風(fēng)控工作的讀者參考,以期促進(jìn)行業(yè)交流和人才技能提升。
讀者對象
本書主要面向以下讀者:
在金融機(jī)構(gòu)(特別是商業(yè)銀行、信用卡中心、持牌消費(fèi)金融機(jī)構(gòu)等)從事風(fēng)險量化建模、風(fēng)險數(shù)據(jù)分析、風(fēng)控業(yè)務(wù)策略設(shè)計的人員;
在金融科技公司、互聯(lián)網(wǎng)公司等科技類公司從事風(fēng)險量化建模、風(fēng)險數(shù)據(jù)分析、風(fēng)控業(yè)務(wù)策略設(shè)計的人員;
對智能風(fēng)控技術(shù)感興趣的其他人員;
智能風(fēng)控相關(guān)專業(yè)的在校學(xué)生。
本書特色
注重實戰(zhàn),代碼豐富:本書基于作者十余年風(fēng)險建模和風(fēng)控策略經(jīng)驗,對評分卡建模技術(shù)進(jìn)行了系統(tǒng)的梳理和總結(jié),所介紹的內(nèi)容都是實際風(fēng)險建模工作中能用到的。另外還給出了豐富的Python代碼示例,具有較強(qiáng)的實踐性。
結(jié)構(gòu)清晰,邏輯嚴(yán)謹(jǐn):本書不僅包括模型本身的設(shè)計、開發(fā)、驗證,還包括模型的工程部署、監(jiān)控和優(yōu)化,按建模方法論的流程對建模的各環(huán)節(jié)依次進(jìn)行介紹。
新視角、新觀點(diǎn)、新思考:本書在部分技術(shù)點(diǎn)上提出了一些新看法和新觀點(diǎn),特別是我對模型的系統(tǒng)化思考、對拒絕推斷的理解、對業(yè)務(wù)需求的理解等方面,以期拋磚引玉,引起更廣泛的交流和探討。
融入建模技術(shù):評分卡建模是相對傳統(tǒng)的建模技術(shù),我結(jié)合當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域熱點(diǎn)技術(shù),介紹了特征工程、高維機(jī)器學(xué)習(xí)等技術(shù)。
如何閱讀本書
本書內(nèi)容分為6個部分。
第1章介紹評分卡入門知識,包括評分卡模型的概念和定義、評分卡建模全流程、對模型的評價等,以概念性內(nèi)容介紹為主,幫助讀者初步了解評分卡的基本概念。
第2章介紹零售信貸業(yè)務(wù)基礎(chǔ)知識,包括銀行零售信貸領(lǐng)域產(chǎn)品特征、業(yè)務(wù)流程,以及信用風(fēng)險概念、欺詐風(fēng)險概念,幫助讀者理解評分卡的應(yīng)用場景和要解決的業(yè)務(wù)問題。
第3~11章介紹評分卡建模全流程,是全書核心內(nèi)容,覆蓋業(yè)務(wù)需求理解、數(shù)據(jù)理解、特征工程、模型設(shè)計、模型開發(fā)、模型驗證、模型部署、模型監(jiān)控、模型優(yōu)化等模型全生命周期的各個環(huán)節(jié)。該部分以技術(shù)介紹為主,幫助讀者系統(tǒng)地掌握模型需求、設(shè)計、開發(fā)、測試、部署和應(yīng)用全流程技術(shù)。
第12~14章介紹評分卡建模關(guān)鍵問題,包括拒絕推斷問題、可解釋性問題,以及模型開發(fā)過程中諸如分布不均衡、模型性能下降等常見問題及應(yīng)對方案。
第15章介紹高維機(jī)器學(xué)習(xí),討論了當(dāng)前業(yè)界除評分卡外使用頻率較高的高維機(jī)器學(xué)習(xí)技術(shù),并重點(diǎn)介紹了XGBoost和LightGBM模型。
第16章介紹風(fēng)險策略應(yīng)用,以貸前自動化審批場景為例,介紹了基于風(fēng)險評分的自動化審批策略構(gòu)建方法,幫助讀者理解評分卡模型在風(fēng)險策略設(shè)計中的應(yīng)用。
本書是量化建模方法論的系統(tǒng)性總結(jié)和介紹,無論是對于已經(jīng)從事評分卡建模多年的“老兵”,還是剛?cè)胄谢蚣磳⑷胄械摹靶率帧,都具有較好的參考價值。本書既可以作為系統(tǒng)性介紹評分卡建模技術(shù)的教科書,帶領(lǐng)讀者進(jìn)行系統(tǒng)學(xué)習(xí),也可以作為案頭工具書,供讀者在工作過程中隨時查閱和參考。
勘誤和支持
由于作者的水平有限,加之撰寫時間倉促,書中難免會出現(xiàn)一些錯誤、疏漏或者不準(zhǔn)確的地方,歡迎各位讀者和專家批評指正?梢酝ㄟ^如下方式與作者交流或獲得支持。
本書專屬代碼托管GitHub:https://github.com/jackzhang83/ScoreCard。
知乎:https://www.zhihu.com/people/boypet。
致謝
本書內(nèi)容基于我十余年風(fēng)險建模和風(fēng)控策略經(jīng)驗。首先要感謝領(lǐng)我進(jìn)門的前輩,既包括我工作過的公司的領(lǐng)導(dǎo)、技術(shù)專家和業(yè)務(wù)專家,也包括在我參與過的20余個大中型銀行項目實施過程中與我深入交流的行方領(lǐng)導(dǎo)和業(yè)務(wù)專家。
特別感謝上海交通大學(xué)上海高級金融學(xué)院李祥林(David X. Li)教授、樂信集團(tuán)首席風(fēng)控官喬楊先生和同盾科技副總裁余旭鑫博士百忙之中抽出時間為本書作序。李祥林教授是信用風(fēng)險特別是信用衍生品估值定價領(lǐng)域的知名學(xué)者和行業(yè)領(lǐng)先實踐者,其基于Copula的信用衍生品定價原理在行業(yè)得到廣泛應(yīng)用。喬楊先生曾在Discover和數(shù)科工作多年,他撰寫的《數(shù)據(jù)化風(fēng)控》是風(fēng)控建模從業(yè)者參考書。余旭鑫博士很重視咨詢的專業(yè)性和價值,對于模型風(fēng)險有獨(dú)到見解,是國內(nèi)模型風(fēng)險管理(MRM)的積極倡導(dǎo)者。
其次感謝來自智能風(fēng)控和數(shù)據(jù)分析行業(yè)交流圈的朋友。我一直推崇“三人行,必有吾
師”之訓(xùn),非常樂于參與或組織行業(yè)交流,也有幸認(rèn)識了許多業(yè)內(nèi)同行,在交流過程中思想的碰撞對我有很大啟發(fā)。
感謝機(jī)械工業(yè)出版社華章公司的策劃編輯楊福川,他在近一年的時間中不斷地鼓勵我,并對本書的寫作提出了一些建設(shè)性的意見。感謝本書責(zé)任編輯韓蕊,她認(rèn)真審校了全書,并提出了不少中肯的建議。
后感謝我的妻子邢夢娟和我的女兒。寫作需要犧牲不少陪伴家人的時間,她們非常理解和支持我;寫作是一個既享受又折磨人的過程,她們給予我不少鼓勵和督促。
張 偉(筆名:上善若愚)
2021年11月
作者簡介
張偉(筆名:上善若愚)
金融科技公司技術(shù)合伙人、高級風(fēng)控總監(jiān)及解決方案專家,前FICO風(fēng)險評分建模與風(fēng)控業(yè)務(wù)策略專家。
在金融風(fēng)險管理和智能風(fēng)控領(lǐng)域有近15年工作經(jīng)驗,擅長業(yè)務(wù)策略、量化建模、解決方案、風(fēng)控體系建設(shè),專注于商業(yè)銀行、消費(fèi)金融和金融科技行業(yè),在智能風(fēng)控策略模型數(shù)據(jù)決策體系建設(shè)、風(fēng)險業(yè)務(wù)架構(gòu)和技術(shù)架構(gòu)、信用風(fēng)險業(yè)務(wù)策略與量化模型、信貸資產(chǎn)組合管理、金融資產(chǎn)定價與風(fēng)險管理、業(yè)務(wù)安全技術(shù)、巴塞爾新資本協(xié)議等方面積累了豐富的工作經(jīng)驗。
曾作為技術(shù)專家或行業(yè)專家多次受邀出席上海市政府組織的行業(yè)產(chǎn)業(yè)聯(lián)盟研討調(diào)研座談,多次受邀出席金融科技領(lǐng)域行業(yè)論壇并做主題演講或圓桌討論,多次接受主流金融科技媒體和財經(jīng)媒體采訪,并受聘為上海交通大學(xué)上海高金金融研究院研究員和華東理工大學(xué)商學(xué)院職業(yè)導(dǎo)師。
贊譽(yù)
序1
序2
序3
前言
第1章 評分卡建模理論基礎(chǔ) 1
1.1 評分卡建模常見面試問題 1
1.2 關(guān)于模型的系統(tǒng)性理解 2
1.3 與建模密切相關(guān)的4個領(lǐng)域 3
1.3.1 機(jī)器學(xué)習(xí) 3
1.3.2 數(shù)據(jù)挖掘 4
1.3.3 數(shù)據(jù)分析 4
1.3.4 統(tǒng)計分析 5
1.3.5 四者之間的聯(lián)系與區(qū)別 5
1.4 評分模型與評分卡模型 6
1.4.1 評分模型和評分卡模型的定義 6
1.4.2 評分卡模型的分類 6
1.4.3 評分卡模型的適用性 7
1.4.4 評分卡模型的價值 8
1.4.5 評分卡模型的應(yīng)用 9
1.5 評分卡建模全流程 9
1.6 對評分卡模型的評價 10
1.7 本章小結(jié) 11
第2章 零售信貸業(yè)務(wù)基礎(chǔ)和風(fēng)險管理 12
2.1 銀行零售信貸產(chǎn)品的產(chǎn)品特征和業(yè)務(wù)流程 12
2.1.1 個人貸款 13
2.1.2 信用卡 17
2.2 信用與信用風(fēng)險 21
2.2.1 信用風(fēng)險識別 22
2.2.2 信用風(fēng)險評估 23
2.2.3 信用風(fēng)險監(jiān)測 24
2.2.4 信用風(fēng)險控制 24
2.2.5 征信 25
2.3 欺詐與欺詐風(fēng)險 26
2.3.1 欺詐風(fēng)險的分類 27
2.3.2 欺詐風(fēng)險的防范 27
2.3.3 欺詐風(fēng)險與信用風(fēng)險比較 27
2.4 本章小結(jié) 28
第3章 業(yè)務(wù)需求理解 29
3.1 業(yè)務(wù)需求理解概述 29
3.2 明確擬解決問題和分析目標(biāo) 29
3.3 業(yè)務(wù)訪談的設(shè)計和實施 30
3.4 整體分析方案設(shè)計 31
3.5 本章小結(jié) 32
第4章 數(shù)據(jù)基礎(chǔ)決定模型效果上限 33
4.1 關(guān)于數(shù)據(jù)的系統(tǒng)性認(rèn)識 33
4.1.1 數(shù)據(jù)基本特征 33
4.1.2 常見數(shù)據(jù)問題 36
4.2 傳統(tǒng)信貸業(yè)務(wù)數(shù)據(jù) 37
4.2.1 貸款可用數(shù)據(jù) 38
4.2.2 信用卡可用數(shù)據(jù) 38
4.3 征信數(shù)據(jù) 39
4.3.1 征信數(shù)據(jù)概述 39
4.3.2 一代人行征信 40
4.3.3 二代人行征信 41
4.3.4 一、二代人行征信的差異及映射轉(zhuǎn)換 42
4.3.5 人行征信數(shù)據(jù)的使用 43
4.4 內(nèi)外部大數(shù)據(jù) 44
4.4.1 大數(shù)據(jù)概述 44
4.4.2 銀行內(nèi)部大數(shù)據(jù) 45
4.4.3 銀行外部大數(shù)據(jù) 45
4.5 數(shù)據(jù)質(zhì)量診斷 46
4.5.1 數(shù)據(jù)質(zhì)量診斷目的 46
4.5.2 數(shù)據(jù)質(zhì)量診斷方法 47
4.6 業(yè)務(wù)數(shù)據(jù)分析 48
4.6.1 業(yè)務(wù)數(shù)據(jù)分析目的 48
4.6.2 業(yè)務(wù)數(shù)據(jù)分析方法 49
4.7 本章小結(jié) 49
第5章 利用特征工程提取有效的風(fēng)險特征 50
5.1 特征工程概述 50
5.1.1 特征與特征工程 50
5.1.2 數(shù)據(jù)處理與特征工程流程 51
5.1.3 特征工程的理論體系 51
5.1.4 特征工程的抽象范式 52
5.2 特征預(yù)處理與轉(zhuǎn)換 53
5.2.1 常見數(shù)據(jù)質(zhì)量問題 53
5.2.2 特征清洗與預(yù)處理 53
5.2.3 特征編碼 54
5.2.4 特征轉(zhuǎn)換 55
5.3 特征提取與生成 56
5.3.1 業(yè)務(wù)專家經(jīng)驗定義 56
5.3.2 工程化自動化衍生 56
5.3.3 表征學(xué)習(xí) 58
5.4 特征評價、選擇與降維 62
5.4.1 特征評價 62
5.4.2 特征選擇與降維 63
5.5 自動化特征工程技術(shù)與工具 65
5.5.1 自動化特征工程概述 65
5.5.2 自動化特征工程工具 66
5.6 本章小結(jié) 74
第6章 評分卡模型設(shè)計 75
6.1 模型設(shè)計概述 75
6.1.1 模型設(shè)計的定義 75
6.1.2 模型設(shè)計的工作內(nèi)容 76
6.2 排除規(guī)則與樣本范圍 76
6.2.1 排除規(guī)則和樣本范圍的定義 76
6.2.2 申請評分卡模型排除規(guī)則 77
6.2.3 行為評分卡模型排除規(guī)則 77
6.2.4 催收評分卡模型排除規(guī)則 78
6.3 模型細(xì)分 79
6.4 表現(xiàn)期定義與Vintage分析 80
6.4.1 表現(xiàn)期定義 80
6.4.2 Vintage分析 80
6.5 滾動率 83
6.5.1 滾動率定義 83
6.5.2 滾動率分析 84
6.5.3 滾動率計算常見問題 84
6.6 觀察期的定義與選擇 85
6.6.1 觀察期的定義 85
6.6.2 觀察期的選擇 85
6.7 模型設(shè)計匯總計數(shù) 86
6.7.1 匯總計數(shù)定義 87
6.7.2 匯總計數(shù)的特別說明 87
6.8 建模方式和模型原型選擇 87
6.9 本章小結(jié) 88
第7章 評分卡模型開發(fā) 89
7.1 模型開發(fā)概述 89
7.2 樣本分區(qū) 90
7.3 樣本抽樣 91
7.4 變量預(yù)篩選 93
7.5 變量分箱 94
7.6 變量再篩選 96
7.7 變量轉(zhuǎn)換WOE 97
7.8 使用邏輯回歸進(jìn)行模型擬合 97
7.8.1 多重共線性檢驗 97
7.8.2 邏輯回歸建模 98
7.8.3 模型訓(xùn)練結(jié)果 100
7.9 模型驗證 101
7.9.1 排序性 101
7.9.2 區(qū)分能力 101
7.9.3 穩(wěn)定性 103
7.9.4 分值集中度 103
7.9.5 分值分布 104
7.9.6 離散度 104
7.10 評分標(biāo)尺 105
7.11 模型導(dǎo)出PMML并測試 107
7.12 評分卡建模專用Python包 108
7.12.1 scorecardpy工具包 108
7.12.2 toad工具包 108
7.12.3 RiskModeler工具包 109
7.13 評分卡建模實例 109
7