視覺人體動(dòng)作識(shí)別技術(shù)
定 價(jià):98 元
叢書名:前沿科技·人工智能系列
- 作者:李侃
- 出版時(shí)間:2024/1/1
- ISBN:9787121467608
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP391.41
- 頁碼:204
- 紙張:
- 版次:01
- 開本:16開
人體動(dòng)作識(shí)別是計(jì)算機(jī)視覺以及相關(guān)領(lǐng)域的重要研究?jī)?nèi)容,旨在識(shí)別出具有高層語義的人體動(dòng)作。客觀環(huán)境的復(fù)雜性以及運(yùn)動(dòng)的多樣性使基于視覺的人體姿態(tài)估計(jì)和動(dòng)作識(shí)別極具挑戰(zhàn)性,因此研究人體動(dòng)作識(shí)別方法具有十分重要的理論意義和應(yīng)用價(jià)值。本書在總結(jié)分析人體動(dòng)作識(shí)別研究現(xiàn)狀的基礎(chǔ)上,從單人動(dòng)作和群組動(dòng)作兩個(gè)層面研究人體動(dòng)作識(shí)別技術(shù),即人體2D姿態(tài)估計(jì)、人體3D姿態(tài)估計(jì)、單人動(dòng)作識(shí)別,以及群體動(dòng)作識(shí)別。本書結(jié)構(gòu)合理,內(nèi)容全面,既有嚴(yán)格的理論基礎(chǔ),又有實(shí)際的應(yīng)用。。
李侃,教授,博士生導(dǎo)師,副所長(zhǎng)。國(guó)家重點(diǎn)研發(fā)計(jì)劃評(píng)審專家、國(guó)家863項(xiàng)目評(píng)審專家,北京市自然科學(xué)基金/重點(diǎn)基金評(píng)審專家、博士點(diǎn)基金/博士后基金評(píng)審專家,國(guó)際期刊NLPR主編,以及其它期刊的編委。在澳大利亞、加拿大、中國(guó)香港等國(guó)家、地區(qū)任職或?qū)W術(shù)研究。目前主要從事機(jī)器學(xué)習(xí)、模式識(shí)別及大數(shù)據(jù)分析方面的研究。主持了國(guó)家重點(diǎn)研發(fā)專項(xiàng)課題、國(guó)家973課題、863重大和和國(guó)家自然科學(xué)基金等多項(xiàng)國(guó)家級(jí)和部級(jí)項(xiàng)目,獲得了多項(xiàng)國(guó)防科技進(jìn)步獎(jiǎng)和校科技成果一等獎(jiǎng)等科研獎(jiǎng)勵(lì)。在TKDE等國(guó)內(nèi)外期刊、IJCAI、ACM MM等學(xué)術(shù)會(huì)議上發(fā)表SCI/EI檢索論文近百篇,發(fā)明專利20余項(xiàng)。出版了教育部和北京市精品教材、獲得了全國(guó)高校人工智能與大數(shù)據(jù)教學(xué)創(chuàng)新獎(jiǎng)、T-more優(yōu)秀教師獎(jiǎng)、迪文優(yōu)秀教師獎(jiǎng)、教學(xué)成果獎(jiǎng)一等獎(jiǎng)等教學(xué)獎(jiǎng)勵(lì)。
第1章 緒論 001
1.1 研究目的和意義 001
1.2 國(guó)內(nèi)外研究現(xiàn)狀 005
1.2.1 人體姿態(tài)估計(jì) 005
1.2.2 基于視頻的人體動(dòng)作識(shí)別 011
1.2.3 基于骨架序列的人體動(dòng)作識(shí)別 014
1.2.4 基于互動(dòng)關(guān)系的視覺人體動(dòng)作識(shí)別 015
1.2.5 視頻群體動(dòng)作識(shí)別 027
1.3 研究?jī)?nèi)容 032
1.4 本書結(jié)構(gòu)安排 034
第2章 基于時(shí)序一致性探索的人體2D姿態(tài)估計(jì) 036
2.1 引言 036
2.2 相關(guān)工作 038
2.2.1 基于深度學(xué)習(xí)的視頻人體2D姿態(tài)估計(jì) 038
2.2.2 卷積長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和可變形卷積 038
2.3 問題定義 039
2.4 圖像人體2D姿態(tài)估計(jì)網(wǎng)絡(luò) 040
2.5 視頻時(shí)序一致性探索 041
2.5.1 變形操作 042
2.5.2 聚合操作 043
2.5.3 雙向時(shí)序一致性探索 043
2.5.4 多尺度時(shí)序一致性探索 044
2.6 視頻人體2D姿態(tài)估計(jì)網(wǎng)絡(luò) 044
2.7 實(shí)驗(yàn)結(jié)果 046
2.7.1 實(shí)驗(yàn)設(shè)置 046
2.7.2 性能比較 048
2.7.3 模型控制變量分析與實(shí)驗(yàn)結(jié)果 051
2.8 本章小結(jié) 055
第3章 多視角幾何驅(qū)動(dòng)的自監(jiān)督人體3D姿態(tài)估計(jì) 057
3.1 引言 057
3.2 相關(guān)工作 059
3.2.1 基于深度學(xué)習(xí)的單目人體3D姿態(tài)估計(jì) 060
3.2.2 弱/自監(jiān)督單目人體3D姿態(tài)估計(jì) 060
3.3 自監(jiān)督人體3D姿態(tài)估計(jì)方法 061
3.3.1 雙分支自監(jiān)督訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu) 061
3.3.2 損失函數(shù) 062
3.3.3 訓(xùn)練 064
3.4 實(shí)驗(yàn)結(jié)果 065
3.4.1 實(shí)驗(yàn)設(shè)置 065
3.4.2 模型控制變量分析與實(shí)驗(yàn)結(jié)果 066
3.4.3 性能比較 070
3.5 本章小結(jié) 071
第4章 基于人體形狀與相機(jī)視角一致分解的人體3D姿態(tài)估計(jì) 072
4.1 引言 072
4.2 相關(guān)工作 074
4.2.1 基于字典學(xué)習(xí)的單目人體3D姿態(tài)估計(jì)方法 074
4.2.2 運(yùn)動(dòng)恢復(fù)非剛體結(jié)構(gòu) 075
4.3 問題定義 075
4.4 一致分解網(wǎng)絡(luò) 076
4.5 層次化字典學(xué)習(xí) 077
4.6 模型訓(xùn)練 079
4.7 實(shí)驗(yàn)結(jié)果 079
4.7.1 實(shí)驗(yàn)設(shè)置 079
4.7.2 模型控制變量分析與實(shí)驗(yàn)結(jié)果 080
4.7.3 性能比較 083
4.8 本章小結(jié) 084
第5章 基于多時(shí)空特征的人體動(dòng)作識(shí)別 086
5.1 引言 086
5.2 相關(guān)工作 088
5.2.1 基于表觀的時(shí)空表示學(xué)習(xí) 088
5.2.2 基于骨架序列的時(shí)空表示學(xué)習(xí) 089
5.3 多時(shí)空特征人體動(dòng)作識(shí)別方法概述 089
5.4 多層級(jí)表觀特征聚合 090
5.4.1 局部演化描述符提取 090
5.4.2 局部演化描述符編碼 092
5.4.3 深度監(jiān)督的多層級(jí)特征聚合 092
5.5 時(shí)空?qǐng)D卷積網(wǎng)絡(luò) 093
5.5.1 時(shí)空?qǐng)D卷積 094
5.5.2 網(wǎng)絡(luò)細(xì)節(jié) 095
5.6 實(shí)驗(yàn)結(jié)果 096
5.6.1 實(shí)驗(yàn)設(shè)置 096
5.6.2 模型控制變量分析與實(shí)驗(yàn)結(jié)果 097
5.6.3 性能比較 099
5.7 本章小結(jié) 100
第6章 基于扁平式互動(dòng)關(guān)系分析的多人動(dòng)作識(shí)別 101
6.1 引言 101
6.2 相關(guān)工作 109
6.3 特征表征 111
6.3.1 肢體角度描述符特征 113
6.3.2 空間布局特征 114
6.3.3 基于融合受限玻爾茲曼機(jī)的特征融合 116
6.4 線索互動(dòng)關(guān)系模型 126
6.5 扁平式動(dòng)作識(shí)別方法 127
6.6 局部線索與局部識(shí)別 129
6.7 基于目標(biāo)子空間度量的動(dòng)作相關(guān)性分析 130
6.8 全局線索整合與動(dòng)作識(shí)別 131
6.8.1 全局-局部線索整合算法 131
6.8.2 改進(jìn)全局-局部線索整合算法 132
6.9 實(shí)驗(yàn)結(jié)果與分析 136
6.9.1 數(shù)據(jù)集及實(shí)驗(yàn)設(shè)置 136
6.9.2 算法結(jié)果與分析 138
6.9.3 與現(xiàn)有方法的對(duì)比 146
6.10 本章小結(jié) 149
第7章 基于層級(jí)式互動(dòng)關(guān)系分析的群組動(dòng)作識(shí)別 150
7.1 引言 150
7.2 相關(guān)工作 152
7.3 混合群組動(dòng)作模型 154
7.4 混合群組動(dòng)作模型的概率分布 157
7.5 基于混合群組動(dòng)作模型的動(dòng)作識(shí)別算法 161
7.6 實(shí)驗(yàn)與算法分析 162
7.6.1 數(shù)據(jù)集和實(shí)驗(yàn)設(shè)置 162
7.6.2 算法結(jié)果和分析 163
7.6.3 與現(xiàn)有方法的對(duì)比 168
7.7 本章小結(jié) 170
第8章 融合動(dòng)作相關(guān)性的群體動(dòng)作識(shí)別 171
8.1 引言 171
8.2 相關(guān)工作 172
8.3 問題定義 173
8.4 動(dòng)作表示 173
8.4.1 多尺度特征 174
8.4.2 動(dòng)作表示提取 175
8.5 動(dòng)作關(guān)系推理 177
8.5.1 動(dòng)作相關(guān)性 177
8.5.2 關(guān)系推理 179
8.5.3 算法描述 180
8.6 時(shí)空表示 181
8.7 模型訓(xùn)練 184
8.8 實(shí)驗(yàn)分析 185
8.8.1 數(shù)據(jù)集與評(píng)價(jià)指標(biāo) 185
8.8.2 實(shí)驗(yàn)設(shè)置 187
8.8.3 實(shí)驗(yàn)結(jié)果分析 187
8.9 本章小結(jié) 193
第9章 結(jié)論與展望 194