本書內(nèi)容主要包括機器學(xué)習(xí)的基本知識、基本學(xué)習(xí)方法、集成學(xué)習(xí)方法、深度學(xué)習(xí)方法和深度強化學(xué)習(xí)方法等內(nèi)容,將機器學(xué)習(xí)的經(jīng)典內(nèi)容與深度學(xué)習(xí)等前沿內(nèi)容有機地結(jié)合在一起,形成一套相對完整的知識體系,并在每個章節(jié)穿插相應(yīng)的應(yīng)用實例,使得廣大讀者不但能夠較好地掌握機器學(xué)習(xí)基本理論,而且能夠比較系統(tǒng)地掌握其應(yīng)用技術(shù),為今后的工作和進一步學(xué)習(xí)打下扎實的理論與應(yīng)用基礎(chǔ)。
前言
第1章 機器學(xué)習(xí)概述 1
1.1 機器學(xué)習(xí)基本概念 1
1.1.1 人工智能與機器學(xué)習(xí) 1
1.1.2 機器學(xué)習(xí)基本術(shù)語 5
1.1.3 機器學(xué)習(xí)誤差分析 8
1.2 機器學(xué)習(xí)發(fā)展歷程 11
1.2.1 感知機與連接學(xué)習(xí) 11
1.2.2 符號學(xué)習(xí)與統(tǒng)計學(xué)習(xí) 13
1.2.3 連接學(xué)習(xí)的興起 17
1.3 機器學(xué)習(xí)基本問題 19
1.3.1 特征提取 19
1.3.2 規(guī)則構(gòu)建 23
1.3.3 模型評估 27
1.4 模型優(yōu)化與正則化 31
1.4.1 梯度下降法 31
1.4.2 隨機梯度法 34
1.4.3 模型正則化 36
1.5 習(xí)題 41
第2章 基本學(xué)習(xí)方法 43
2.1 監(jiān)督學(xué)習(xí) 43
2.1.1 線性模型 43
2.1.2 決策樹模型 50
2.1.3 貝葉斯模型 62
2.1.4 支持向量機 68
2.2 無監(jiān)督學(xué)習(xí) 72
2.2.1 聚類分析法 72
2.2.2 主分量分析法 76
2.3 強化學(xué)習(xí) 81
2.3.1 強化學(xué)習(xí)概述 81
2.3.2 馬爾可夫模型 84
2.3.3 值迭代學(xué)習(xí) 89
2.3.4 時序差分學(xué)習(xí) 94
2.4 基本學(xué)習(xí)方法的應(yīng)用 103
2.4.1 垃圾郵件檢測與分類 103
2.4.2 人臉自動識別 106
2.4.3 自動爬山小車 112
2.5 習(xí)題 117
第3章 集成學(xué)習(xí)方法 119
3.1 集成學(xué)習(xí)概述 119
3.1.1 集成學(xué)習(xí)基本概念 119
3.1.2 集成學(xué)習(xí)基本范式 120
3.1.3 集成學(xué)習(xí)泛化策略 122
3.2 Bagging集成學(xué)習(xí) 124
3.2.1 Bagging集成策略 124
3.2.2 隨機森林模型結(jié)構(gòu) 127
3.2.3 隨機森林訓(xùn)練算法 129
3.3 Boosting集成學(xué)習(xí) 142
3.3.1 Boosting集成策略 143
3.3.2 AdaBoost學(xué)習(xí)算法 145
3.3.3 GBDT學(xué)習(xí)算法 146
3.4 集成學(xué)習(xí)方法的應(yīng)用 151
3.4.1 房價預(yù)測分析 151
3.4.2 人臉自動檢測 156
3.5 習(xí)題 162
第4章 深度學(xué)習(xí)方法 163
4.1 神經(jīng)網(wǎng)絡(luò)概述 163
4.1.1 神經(jīng)元與感知機 163
4.1.2 前饋網(wǎng)絡(luò)訓(xùn)練范式 168
4.1.3 淺層學(xué)習(xí)與深度學(xué)習(xí) 176
4.2 深度卷積網(wǎng)絡(luò) 181
4.2.1 卷積網(wǎng)絡(luò)概述 181
4.2.2 基本網(wǎng)絡(luò)模型 190
4.2.3 改進網(wǎng)絡(luò)模型 199
4.3 深度循環(huán)網(wǎng)絡(luò) 206
4.3.1 動態(tài)系統(tǒng)展開 207
4.3.2 網(wǎng)絡(luò)結(jié)構(gòu)與計算 208
4.3.3 模型訓(xùn)練策略 217
4.4 生成式對抗網(wǎng)絡(luò) 221
4.4.1 生成器與判別器 222
4.4.2 網(wǎng)絡(luò)結(jié)構(gòu)與計算 224
4.4.3 模型訓(xùn)練策略 229
4.5 深度學(xué)習(xí)方法的應(yīng)用 234
4.5.1 光學(xué)字符識別 235
4.5.2 圖像目標檢測 239
4.5.3 自動文本摘要 245
4.6 習(xí)題 249
第5章 深度強化學(xué)習(xí) 251
5.1 深度強化學(xué)習(xí)概述 251
5.1.1 基本學(xué)習(xí)思想 251
5.1.2 基本計算方式 254
5.1.3 蒙特卡洛樹搜索 255
5.2 基于價值的深度強化學(xué)習(xí) 261
5.2.1 深度Q網(wǎng)絡(luò) 261
5.2.2 深度雙Q網(wǎng)絡(luò) 266
5.2.3 DQN改進模型 270
5.3 基于策略的深度強化學(xué)習(xí) 273
5.3.1 策略梯度算法 273
5.3.2 Actor-Critic算法 278
5.3.3 DDPG學(xué)習(xí)算法 284
5.4 深度強化學(xué)習(xí)的應(yīng)用 288
5.4.1 智能巡航小車 288
5.4.2 自動對弈游戲 292
5.5 習(xí)題 303
參考文獻 305