本書圍繞模式識別的基本概念、基礎(chǔ)理論和典型方法,從實際應(yīng)用問題出發(fā),系統(tǒng)描述了模式識別的常用方法和常見技巧,并給出了一系列實驗及應(yīng)用案例。本書首先介紹了機器視覺的概念及特征提取的概念和方法;其次介紹了線性分類模型、非線性分類模型、時間序列預(yù)測模型和混合模型等理論知識與實踐操作;最后重點介紹了圖像識別、視頻目標檢測與跟蹤、語音識別、生物特征識別和醫(yī)學圖像檢索等典型應(yīng)用。
劉鵬:博士畢業(yè)于清華大學,教授,現(xiàn)任南京大數(shù)據(jù)研究院院長、中國大數(shù)據(jù)應(yīng)用聯(lián)盟人工智能專家委員會主任、中國大數(shù)據(jù)專家委員會委員。曾率隊奪得2002 PennySort國際計算機排序比賽冠軍(這是我國獲得的第一個大數(shù)據(jù)比賽世界冠軍),兩次奪得全國高?萍急荣*高獎,三次奪得清華大學科技比賽*高獎。主持完成科研項目25項,發(fā)表論文80余篇,出版專業(yè)圖書20部。獲部級科技進步二等獎4項、三等獎4項。2002年開創(chuàng)性地提出了“計算池”模式,被2007年開始流行的“云計算”所證實。2003年開創(chuàng)性地提出了“反垃圾郵件網(wǎng)格”,被2008年開始流行的“云安全”所證實。榮獲“全軍十大學習成才標兵”、南京市“十大杰出青年”、江蘇省中青年科學技術(shù)帶頭人、清華大學“學術(shù)新秀”等稱號。劉河,現(xiàn)就職于重慶市教育科學研究院,中國計算機學會會員,重慶市教育信息化專家委員會成員;主要研究領(lǐng)域為大數(shù)據(jù)、人工智能等;獨立開發(fā)了10余個軟件系統(tǒng),主持主研了多項省部級重點課題,編著了多部教材,獲得了多個計算機軟件著作權(quán)登記證書。
第1章 緒論 1
1.1 機器感知與視覺信息 1
1.1.1 機器感知 1
1.1.2 視覺信息感知 2
1.1.3 視覺機理 2
1.2 特征選擇與提取 3
1.2.1 特征 3
1.2.2 特征選擇 3
1.2.3 特征提取 4
1.3 模式識別系統(tǒng) 4
1.3.1 模式與模式識別 4
1.3.2 模式識別系統(tǒng) 5
1.4 機器感知與模式識別 5
1.5 機器感知與人工智能的關(guān)系 6
1.6 章節(jié)安排 6
習題 7
參考文獻 8
第2章 機器視覺 9
2.1 視覺系統(tǒng) 9
2.1.1 機器視覺的發(fā)展 9
2.1.2 機器視覺系統(tǒng)的構(gòu)成與評價指標 10
2.1.3 機器視覺的應(yīng)用 12
2.2 硬件系統(tǒng) 14
2.2.1 工業(yè)相機 15
2.2.2 鏡頭 20
2.2.3 光源 24
2.2.4 其他組成部分 29
2.3 視覺軟件 30
2.4 實驗:車牌識別 31
2.4.1 實驗?zāi)康?31
2.4.2 實驗要求 31
2.4.3 實驗原理 31
2.4.4 實驗環(huán)境 31
2.4.5 實驗步驟 31
習題 32
參考文獻 33
第3章 特征提取 35
3.1 特征提取簡述 35
3.2 特征選擇 37
3.2.1 特征方差 38
3.2.2 特征相關(guān)系數(shù) 38
3.2.3 類間距離 38
3.2.4 降維 38
3.3 降維 39
3.3.1 基于PCA的特征提取 40
3.3.2 PCA的步驟 41
3.4 類腦智能 42
3.4.1 模式識別與人工智能 42
3.4.2 類腦智能的概念 43
3.4.3 類腦智能的技術(shù)框架 44
3.5 模式識別系統(tǒng)設(shè)計 45
3.6 計算學習理論 46
3.6.1 基本的PAC模型 47
3.6.2 基本概念 47
3.6.3 問題框架 48
3.6.4 小結(jié) 49
3.7 實驗:基于PCA的特征臉提取 49
3.7.1 實驗?zāi)康?49
3.7.2 實驗要求 49
3.7.3 實驗原理 49
3.7.4 實驗步驟 50
3.7.5 實驗結(jié)果 51
習題 53
參考文獻 53
第4章 線性分類模型 55
4.1 線性判別函數(shù) 55
4.1.1 兩類問題 55
4.1.2 多類問題 57
4.2 Fisher線性判別函數(shù) 59
4.3 感知器算法 62
4.4 最小平方誤差算法 64
4.5 Logistic回歸 65
4.6 基于Python實現(xiàn)感知器算法 69
4.6.1 基于sklearn庫實現(xiàn)感知器算法 69
4.6.2 實驗結(jié)果分析 73
4.7 實驗:感知器算法實現(xiàn) 74
4.7.1 實驗?zāi)康?74
4.7.2 實驗要求 75
4.7.3 實驗原理及具體步驟 75
4.7.4 實驗結(jié)果 77
習題 79
參考文獻 79
第5章 非線性分類 81
5.1 分段線性判別函數(shù) 81
5.1.1 最小距離分類器 81
5.1.2 一般的分段線性判別函數(shù) 82
5.2 決策樹和隨機森林 85
5.2.1 樹狀分類過程 85
5.2.2 構(gòu)造決策樹 86
5.2.3 森林分類過程 89
5.3 支持向量機 90
5.3.1 線性可分情況 90
5.3.2 線性不可分情況 91
5.4 貝葉斯分類網(wǎng)絡(luò) 93
5.4.1 貝葉斯決策的相關(guān)概念 93
5.4.2 最小錯誤率貝葉斯決策 94
5.4.3 最小風險貝葉斯決策 95
5.4.4 正態(tài)分布貝葉斯分類 96
5.5 神經(jīng)網(wǎng)絡(luò) 97
5.5.1 神經(jīng)網(wǎng)絡(luò)基本單元 97
5.5.2 前饋神經(jīng)網(wǎng)絡(luò) 98
5.5.3 Hopfield反饋神經(jīng)網(wǎng)絡(luò) 102
5.6 基于Python實現(xiàn)決策樹和隨機森林算法 103
5.6.1 決策樹和隨機森林算法的基本特征 103
5.6.2 實驗結(jié)果分析 106
5.7 實驗:決策樹和隨機森林算法實現(xiàn) 107
5.7.1 實驗?zāi)康?107
5.7.2 實驗要求 107
5.7.3 實驗原理及步驟 107
5.7.4 實驗結(jié)果 111
習題 113
參考文獻 113
第6章 時間序列預(yù)測 115
6.1 時間序列預(yù)測概述 115
6.1.1 時間序列 115
6.1.2 編制時間序列的原則 117
6.1.3 時間序列預(yù)測方法 118
6.1.4 時間序列預(yù)測流程 120
6.1.5 時間序列預(yù)測模型評估 121
6.2 指數(shù)平滑法 122
6.2.1 一次指數(shù)平滑 123
6.2.2 二次指數(shù)平滑 123
6.2.3 三次指數(shù)平滑 124
6.2.4 平滑系數(shù)的選擇 124
6.3 自回歸滑動平均模型 124
6.3.1 自回歸模型 125
6.3.2 移動平均模型 125
6.3.3 自回歸滑動平均模型表示 125
6.3.4 自回歸滑動平均模型建模 126
6.4 自回歸積分滑動平均模型 128
6.4.1 自回歸積分滑動平均模型表示 128
6.4.2 自回歸積分滑動平均模型建模 128
6.4.3 案例分析 129
6.5 長短期記憶網(wǎng)絡(luò)模型 133
6.5.1 循環(huán)神經(jīng)網(wǎng)絡(luò) 134
6.5.2 長短期記憶網(wǎng)絡(luò) 134
6.6 實驗:基于LSTM的股票最高價預(yù)測 135
6.6.1 實驗?zāi)康?135
6.6.2 實驗要求 135
6.6.3 實驗原理 136
6.6.4 實驗步驟 137
6.6.5 實驗結(jié)果 141
習題 143
參考文獻 143
第7章 混合模型 145
7.1 高斯模型與高斯混合模型 145
7.1.1 高斯模型 145
7.1.2 高斯混合模型 146
7.2 貝葉斯混合模型 147
7.3 集成學習 148
7.3.1 Boosting 149
7.3.2 AdaBoost 149
7.4 實驗:基于AdaBoost集成學習的乳腺癌分類 153
7.4.1 實驗?zāi)康?153
7.4.2 實驗要求 154
7.4.3 實驗原理 154
7.4.4 實驗內(nèi)容 156
7.4.5 實驗結(jié)果 162
習題 163
參考文獻 163
第8章 圖像識別 164
8.1 數(shù)字圖像處理系統(tǒng) 164
8.1.1 圖像感知與獲取 164
8.1.2 圖像處理硬件 165
8.1.3 圖像處理軟件 166
8.1.4 圖像的顯示和存儲 166
8.2 圖像特征描述 167
8.2.1 幾何特征 167
8.2.2 形狀特征 170
8.2.3 顏色特征 172
8.2.4 紋理特征 173
8.3 圖像特征提取 175
8.3.1 基于Hu不變矩的形狀特征提取 175
8.3.2 基于聯(lián)合概率矩陣法的紋理特征提取 177
8.3.3 分塊顏色直方圖特征提取 178
8.3.4 基于小波變換的圖像特征提取 179
8.4 目標識別 180
8.4.1 結(jié)構(gòu)判別方法 181
8.4.2 決策理論方法 183
8.5 基于區(qū)域生長法的圖像識別 186
8.5.1 區(qū)域生長法的基本原理 186
8.5.2 基于區(qū)域生長法的裂縫識別系統(tǒng) 188
8.5.3 實驗結(jié)果分析 189
8.6 實驗:水泥面裂縫檢測 191
8.6.1 實驗?zāi)康?191
8.6.2 實驗要求 191
8.6.3 實驗原理 191
8.6.4 實驗步驟 192
8.6.5 實驗結(jié)果 192
習題 193
參考文獻 194
第9章 視頻目標檢測與跟蹤 196
9.1 視頻目標檢測 196
9.1.1 幀間差分法 196
9.1.2 光流法 197
9.1.3 背景減除法 198
9.1.4 目標檢測在復(fù)雜場景中應(yīng)用的困難 202
9.2 運動目標跟蹤 202
9.2.1 MeanShift跟蹤算法 202
9.2.2 卡爾曼濾波跟蹤算法 205
9.2.3 多目標跟蹤算法 208
9.3 運動目標檢測的性能評價 211
9.3.1 主觀評價 212
9.3.2 客觀評價 212
9.4 圖像視頻數(shù)據(jù)集 214
9.4.1 MOT16數(shù)據(jù)集 214
9.4.2 PETS2016數(shù)據(jù)集 215
9.4.3 ChangeDetection.net數(shù)據(jù)集 216
9.4.4 OTCBVS紅外圖像數(shù)據(jù)集 216
9.4.5 KITTI自動駕駛數(shù)據(jù)集 217
9.4.6 Cityscapes Dataset數(shù)據(jù)集 217
9.5 實驗:多目標跟蹤實驗 218
9.5.1 實驗?zāi)康?218
9.5.2 實驗要求 218
9.5.3 實驗原理 218
9.5.4 實驗步驟及實驗結(jié)果 219
習題 222
參考文獻 222
第10章 語音識別 224
10.1 語音識別概述 224
10.1.1 語音識別的研究背景 224
10.1.2 語音識別的現(xiàn)狀與問題 225
10.1.3 語音識別系統(tǒng)的基本結(jié)構(gòu) 226
10.2 聲學模型 227
10.2.1 混合高斯模型 227
10.2.2 隱馬爾可夫模型 228
10.3 語言模型 229
10.3.1 語言模型的基礎(chǔ)理論 229
10.3.2 基于知識的語言模型 229
10.3.3 基于統(tǒng)計方法的語言模型 230
10.3.4 基于知識的語言模型和基于統(tǒng)計方法的語言模型比較 231
10.4 解碼器 232
10.5 深度學習模型 234
10.5.1 深度神經(jīng)網(wǎng)絡(luò) 234
10.5.2 DNN前向傳播算法 235
10.5.3 DNN反向傳播算法 236
10.5.4 DNN中的激活函數(shù) 236
10.6 基于MFCC的語音識別 237
10.6.1 MFCC特征提取 237
10.6.2 MFCC的基本原理 237
10.7 基于DNN-MFCC混合系統(tǒng)的語音識別 242
10.7.1 DNN和MFCC結(jié)合的原理 242
10.7.2 DNN-MFCC混合系統(tǒng) 244
10.8 實驗:基于MFCC特征和THCHS-30數(shù)據(jù)集的語音識別 246
10.8.1 實驗?zāi)康?246
10.8.2 實驗要求 246
10.8.3 實驗原理 247
10.8.4 實驗步驟 248
10.8.5 實驗結(jié)果 248
習題 249
參考文獻 250
第11章 生物特征識別 252
11.1 生物特征識別概述 252
11.1.1 生物特征 252
11.1.2 生物特征識別系統(tǒng) 253
11.1.3 應(yīng)用概況和發(fā)展趨勢 255
11.2 指紋識別 256
11.2.1 指紋特征 257
11.2.2 指紋采集設(shè)備 258
11.2.3 指紋圖像預(yù)處理 259
11.2.4 指紋特征提取 264
11.2.5 指紋特征匹配 266
11.3 人臉識別 267
11.3.1 人臉識別概述 267
11.3.2 人臉檢測 269
11.3.3 人臉特征提取 271
11.3.4 人臉特征匹配 273
11.4 虹膜識別 274
11.4.1 虹膜識別概述 274
11.4.2 虹膜定位 275
11.4.3 虹膜圖像歸一化 277
11.4.4 虹膜特征提取 278
11.4.5 虹膜特征匹配 279
11.5 步態(tài)識別 280
11.5.1 步態(tài)識別概述 280
11.5.2 步態(tài)特征提取 281
11.5.3 步態(tài)特征匹配 282
11.6 實驗:人臉識別 283
11.6.1 實驗?zāi)康?283
11.6.2 實驗要求 283
11.6.3 實驗原理 283
11.6.4 實驗步驟 283
習題 284
參考文獻 285
第12章 醫(yī)學圖像檢索 287
12.1 醫(yī)學圖像檢索概述 287
12.1.1 醫(yī)學圖像的特點 287
12.1.2 基于內(nèi)容的醫(yī)學圖像檢索 288
12.1.3 醫(yī)學圖像檢索框架 290
12.1.4 醫(yī)學圖像檢索中的關(guān)鍵技術(shù) 292
12.2 多媒體內(nèi)容描述標準MPEG-7 292
12.2.1 MPEG-7的基本概念 293
12.2.2 MPEG-7的主要元素 293
12.2.3 MPEG-7的組成 294
12.2.4 MPEG-7視覺描述工具 295
12.3 基于MPEG-7紋理描述子的X射線胸片圖像檢索 297
12.3.1 X射線胸片圖像 297
12.3.2 基于同構(gòu)型紋理描述子的X射線胸片圖像檢索 298
12.4 圖像檢索系統(tǒng)性能評價 301
12.5 實驗:基于顏色直方圖的醫(yī)學圖像檢索 302
12.5.1 實驗?zāi)康?302
12.5.2 實驗要求 302
12.5.3 實驗原理 302
12.5.4 實驗步驟 302
12.5.5 實驗結(jié)果 310
習題 311
參考文獻 312
附錄A 人工智能實驗環(huán)境 314