本書是一本從機器學(xué)習(xí)視角講解計算機視覺的非常好的教材。全書圖文并茂、語言淺顯易懂,算法描述由淺入深,即使是數(shù)學(xué)背景不強的學(xué)生也能輕松理解和掌握。作者展示了如何使用訓(xùn)練數(shù)據(jù)來學(xué)習(xí)觀察到的圖像數(shù)據(jù)和我們希望預(yù)測的現(xiàn)實世界現(xiàn)象之間的聯(lián)系,以及如何如何研究這些聯(lián)系來從新的圖像數(shù)據(jù)中作出新的推理。本書要求少的前導(dǎo)知識,從介紹概率和模型的基礎(chǔ)知識開始,接著給出讓學(xué)生能夠?qū)崿F(xiàn)和修改來構(gòu)建有用的視覺系統(tǒng)的實際示例。適合作為計算機視覺和機器學(xué)習(xí)的高年級本科生或研究生的教材,書中詳細(xì)的方法演示和示例對于計算機視覺領(lǐng)域的專業(yè)人員也非常有用。
目錄
Computer Vision:Models,Learning,and Inference
譯者序
譯者簡介
序
前言
第1章緒論1
11本書結(jié)構(gòu)2
12其他書籍4
第一部分概率
第2章概率概述6
21隨機變量6
22聯(lián)合概率7
23邊緣化7
24條件概率8
25貝葉斯公式9
26獨立性9
27期望10
討論10
備注11
習(xí)題11
第3章常用概率分布12
31伯努利分布13
32貝塔分布13
33分類分布14
34狄利克雷分布14
35一元正態(tài)分布15
36正態(tài)逆伽馬分布15
37多元正態(tài)分布16
38正態(tài)逆維希特分布16
39共軛性17
總結(jié)18
備注18
習(xí)題18
第4章擬合概率模型21
41最大似然法21
42最大后驗法21
43貝葉斯方法22
44算例1:一元正態(tài)分布22
441最大似然估計22
442最大后驗估計24
443貝葉斯方法26
45算例2:分類分布28
451最大似然法28
452最大后驗法29
453貝葉斯方法30
總結(jié)31
備注31
習(xí)題32
第5章正態(tài)分布34
51協(xié)方差矩陣的形式34
52協(xié)方差分解35
53變量的線性變換36
54邊緣分布36
55條件分布37
56正態(tài)分布的乘積38
57變量改變38
總結(jié)38
備注39
習(xí)題39
第二部分機器視覺的機器學(xué)習(xí)
第6章視覺學(xué)習(xí)和推理42
61計算機視覺問題42
62模型的種類42
621判別模型43
622生成模型43
63示例1:回歸43
631判別模型44
632生成模型44
64示例2:二值分類46
641判別模型46
642生成模型46
65應(yīng)該用哪種模型48
66應(yīng)用49
661皮膚檢測49
662背景差分50
總結(jié)51
備注51
習(xí)題52
第7章復(fù)雜數(shù)據(jù)密度建模54
71正態(tài)分類模型54
72隱變量56
73期望最大化57
74混合高斯模型58
741混合高斯邊緣化59
742基于期望最大化的混合模型擬合59
75t分布63
751學(xué)生t分布邊緣化64
752擬合t分布的期望最大化65
76因子分析67
761因子分析的邊緣分布68
762因子分析學(xué)習(xí)的期望最大化68
77組合模型71
78期望最大化算法的細(xì)節(jié)71
781期望最大化算法的下界73
782E步74
783M步74
79應(yīng)用75
791人臉檢測75
792目標(biāo)識別76
793分割77
794正臉識別78
795改變?nèi)四樧藨B(tài)(回歸)78
796作為隱變量的變換79
總結(jié)80
備注80
習(xí)題81
第8章回歸模型82
81線性回歸82
811學(xué)習(xí)83
812線性回歸模型的問題83
82貝葉斯線性回歸84
821實際考慮85
822擬合方差86
83非線性回歸87
831最大似然法87
832貝葉斯非線性回歸89
84核與核技巧89
85高斯過程回歸90
86稀疏線性回歸91
87二元線性回歸93
88相關(guān)向量回歸95
89多變量數(shù)據(jù)回歸96
810應(yīng)用96
8101人體姿勢估計96
8102位移專家97
討論98
備注98
習(xí)題98
第9章分類模型100
91邏輯回歸100
911學(xué)習(xí):最大似然估計102
912邏輯回歸模型的問題103
92貝葉斯邏輯回歸104
921學(xué)習(xí)104
922推理106
93非線性邏輯回歸107
94對偶邏輯回歸模型108
95核邏輯回歸110
96相關(guān)向量分類111
97增量擬合和boosting113
98分類樹116
99多分類邏輯回歸117
910隨機樹、隨機森林和隨機蕨分類器118
911與非概率模型的聯(lián)系119
912應(yīng)用120
9121性別分類120
9122臉部和行人檢測121
9123語義分割122
9124恢復(fù)表面布局123
9125人體部位識別124
討論125
備注125
習(xí)題127
第三部分連接局部模型
第10章圖模型130
101條件獨立性130
102有向圖模型131
1021示例1132
1022示例2132
1023示例3133
1024總結(jié)134
103無向圖模型134
1031示例1135
1032示例2136
104有向圖模型與無向圖模型的對比136
105計算機視覺中的圖模型137
106含有多個未知量的模型推理139
1061求最大后驗概率的解139
1062求后驗概率分布的邊緣分布139
1063最大化邊緣140
1064后驗分布的采樣140
107樣本采樣140
1071有向圖模型的采樣141
1072無向圖模型的采樣141
108學(xué)習(xí)142
1081有向圖模型的學(xué)習(xí)142
1082無向圖模型的學(xué)習(xí)143
討論145
備注145
習(xí)題145
第11章鏈?zhǔn)侥P秃蜆淠P?47
111鏈?zhǔn)侥P?48
1111有向鏈?zhǔn)侥P?48
1112無向鏈?zhǔn)侥P?48
1113模型的等價性148
1114隱馬爾可夫模型在手語中的應(yīng)用149
112鏈?zhǔn)組AP推理149
113樹的MAP推理152
114鏈?zhǔn)竭吘壓篁炌评?55
1141求解邊緣分布155
1142前向后向算法156
1143置信傳播157
1144鏈?zhǔn)侥P偷暮头e算法158
115樹的邊緣后驗推理160
116鏈?zhǔn)侥P秃蜆淠P偷膶W(xué)習(xí)161
117鏈?zhǔn)侥P秃蜆淠P椭獾臇|西161
118應(yīng)用163
1181手勢跟蹤163
1182立體視覺164
1183形象化結(jié)構(gòu)166
1184分割167
討論167
備注168
習(xí)題169
第12章網(wǎng)格模型172
121馬爾可夫隨機場172
1211網(wǎng)格示例173
1212離散成對MRF圖像去噪174
122二值成對馬爾可夫隨機場的MAP推理175
1221最大流/最小割176
1222MAP推理:二值變量177
123多標(biāo)簽成對MRF的MAP推理182
124非凸勢的多標(biāo)簽MRF186
125條件隨機場189
126高階模型190
127網(wǎng)格有向模型190
128應(yīng)用191
1281背景差分191
1282交互式分割192
1283立體視覺193
1284圖像重排193
1285超分辨率195
1286紋理合成196
1287合成新面孔197
討論198
備注198
習(xí)題200
第四部分預(yù)處理
第13章圖像預(yù)處理與特征提取204
131逐像素變換204
1311白化204
1312直方圖均衡化205
1313線性濾波206
1314局部二值模式210
1315紋理基元映射211
132邊緣、角點和興趣點212
1321Canny邊緣檢測器212
1322Harris角點檢測器214
1323SIFT檢測器215
133描述子216
1331直方圖216
1332SIFT描述子216
1333方向梯度直方圖217
1334詞袋描述子218
1335形狀內(nèi)容描述子218
134降維219
1341單數(shù)值近似220
1342主成分分析221
1343二元主成分分析221
1344K均值算法222
結(jié)論223
備注223
習(xí)題224
第五部分幾何模型
第14章針孔攝像機228
141針孔攝像機簡介228
1411歸一化攝像機229
1412焦距參數(shù)230
1413偏移量和偏移參數(shù)230
1414攝像機的位置與方向231
1415全針孔攝像機模型232
1416徑向畸變232
142三個幾何問題233
1421問題1:學(xué)習(xí)外在參數(shù)233
1422問題2:學(xué)習(xí)內(nèi)在參數(shù)234
1423問題3:推理3D世界點235
1424解決問題235
143齊次坐標(biāo)236
144學(xué)習(xí)外在參數(shù)237
145學(xué)習(xí)內(nèi)在參數(shù)239
146推理3D世界點240
147應(yīng)用241
1471結(jié)構(gòu)光的深度241
1472剪影重構(gòu)243
討論245
備注245
習(xí)題246
第15章變換模型249
151二維變換模型249
1511歐氏變換模型249
1512相似變換模型251
1513仿射變換模型252
1514投影變換模型252
1515增加不確定性254
152變換模型中的學(xué)習(xí)255
1521學(xué)習(xí)歐氏參數(shù)255
1522學(xué)習(xí)相似參數(shù)256
1523學(xué)習(xí)仿射參數(shù)256
1524學(xué)習(xí)投影參數(shù)257
153變換模型中的推理258
154平面的三個幾何問題258
1541問題1:學(xué)習(xí)外在參數(shù)258
1542問題2:學(xué)習(xí)內(nèi)在參數(shù)260
1543問題3:與攝像機相關(guān)的3D位置推理261
155圖像間的變換261
1551單應(yīng)性的幾何特征262
1552計算圖像間的變換263
156變換的魯棒學(xué)習(xí)264
1561RANSAC264
1562連續(xù)RANSAC265
1563PEaRL266
157應(yīng)用268
1571增強現(xiàn)實追蹤268
1572視覺全景269
討論270
備注270
習(xí)題271
第16章多攝像機系統(tǒng)273
161雙視圖幾何學(xué)理論273
1611極線約束274
1612極點274
162實矩陣275
1621實矩陣的屬性276
1622實矩陣的分解277
163基礎(chǔ)矩陣279
1631基礎(chǔ)矩陣的估計279
16328點算法280
164雙視圖重構(gòu)的流程281
165校正284
1651平面校正284
1652極面校正286
1653校正后處理287
166多視圖重構(gòu)287
167應(yīng)用290
1671三維重構(gòu)290
1672圖片瀏覽291
1673立體圖割292
討論293
備注293
習(xí)題294
第六部分視覺模型
第17章形狀模型298
171形狀及其表示298
172snake模型299
1721推理301
1722snake模型中存在的問題301
173形狀模板302
1731推理303
1732用迭代最近點算法進(jìn)行推理304
174統(tǒng)計形狀模型304
1741學(xué)習(xí)305
1742推理306
175子空間形狀模型306
1751概率主成分分析307
1752學(xué)習(xí)308
1753推理309
176三維形狀模型311
177形狀和外觀的統(tǒng)計模型311
1771學(xué)習(xí)313
1772推理314
178非高斯統(tǒng)計形狀模型315
1781回歸PPCA315
1782高斯過程隱變量模型316
179鉸接式模型317
1710應(yīng)用319
17101三維形變模型319
17102三維人體模型321
討論322
備注322
習(xí)題324
第18章身份與方式模型326
181子空間身份模型328
1811學(xué)習(xí)329
1812推理331
1813在其他識別任務(wù)中的推理332
1814身份子空間模型的局限性333
182概率線性判別分析334
1821學(xué)習(xí)335
1822推理335
183非線性身份模型336
184非對稱雙線性模型337
1841學(xué)習(xí)339
1842推理339
185對稱雙線性和多線性模型341
1851學(xué)習(xí)342
1852推理343
1853多線性模型344
186應(yīng)用344
1861人臉識別344
1862紋理建模345
1863動畫合成346
討論346
備注346
習(xí)題348
第19章時序模型349
191時序估計框架349
1911推理350
1912學(xué)習(xí)350
192卡爾曼濾波器351
1921推理351
1922改寫測量合并階段352
1923推理總結(jié)353
1924示例1353
1925示例2354
1926濾波355
1927時序和測量模型356
1928卡爾曼濾波器的問題358
193擴展卡爾曼濾波器358
194無損卡爾曼濾波器360
1941狀態(tài)演化361
1942測量合并過程362
195粒