AI視覺(jué)算法入門與調(diào)優(yōu)
定 價(jià):69 元
- 作者:董董燦 編著
- 出版時(shí)間:2025/3/1
- ISBN:9787122468680
- 出 版 社:化學(xué)工業(yè)出版社
- 中圖法分類:TP302.7
- 頁(yè)碼:184
- 紙張:
- 版次:01
- 開本:小16開
本書通過(guò)具體的案例,循序漸進(jìn)地講解了計(jì)算機(jī)視覺(jué)和模型調(diào)優(yōu)的相關(guān)內(nèi)容。首先介紹基礎(chǔ)知識(shí),包括人工智能基礎(chǔ)、計(jì)算機(jī)視覺(jué)基礎(chǔ)、圖像基礎(chǔ)和編程基礎(chǔ)相關(guān)知識(shí)。然后講解傳統(tǒng)計(jì)算機(jī)視覺(jué)和基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué),如卷積神經(jīng)網(wǎng)絡(luò)等。接著深入探討算法原理,包括卷積、池化、批歸一化、激活函數(shù)、殘差結(jié)構(gòu)、全連接、SoftMax等,并提供手寫算法示例。最后介紹了模型在 Python 和 C++中的實(shí)際應(yīng)用以及性能優(yōu)化技巧,如計(jì)算向量化、權(quán)值預(yù)加載和多線程等。
本書內(nèi)容實(shí)用,由淺入深,案例典型,講解通俗易懂,隨書提供全部程序代碼,且代碼注釋詳細(xì),方便讀者理解,并上手實(shí)踐。
本書非常適合人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)初學(xué)者學(xué)習(xí)使用,也可用作高等院校中相關(guān)專業(yè)的教材及參考書。
第一章 基礎(chǔ)知識(shí) 001~018
1.1 人工智能基礎(chǔ) 002
1.2 計(jì)算機(jī)視覺(jué)基礎(chǔ) 005
1.2.1 算法 006
1.2.2 性能 007
1.3 編程基礎(chǔ) 008
1.3.1 Python簡(jiǎn)介 008
1.3.2 C++簡(jiǎn)介 009
1.4 圖像基礎(chǔ) 010
1.4.1 像素 010
1.4.2 圖像特征 011
1.4.3 RGB圖 012
1.4.4 灰度圖 015
1.5 本章小結(jié) 016
第二章 傳統(tǒng)計(jì)算機(jī)視覺(jué) 019~034
2.1 概述 020
2.2 均值濾波 020
2.2.1 算法解析 020
2.2.2 代碼實(shí)戰(zhàn) 022
2.3 高斯濾波 024
2.3.1 算法解析 024
2.3.2 代碼實(shí)戰(zhàn) 025
2.4 邊緣檢測(cè) 027
2.5 圖像分割 029
2.6 本章小結(jié) 032
第三章 基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué) 035~050
3.1 基礎(chǔ)概念 036
3.1.1 人工神經(jīng)網(wǎng)絡(luò) 036
3.1.2 訓(xùn)練和推理 037
3.1.3 正向傳播和反向傳播 039
3.2 卷積神經(jīng)網(wǎng)絡(luò) 042
3.2.1 ResNet50模型 042
3.2.2 ResNet50中的算法 044
3.3 訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)絡(luò) 044
第四章 算法詳解與實(shí)戰(zhàn) 051~110
4.1 卷積 053
4.1.1 初識(shí)卷積 053
4.1.2 特征圖 055
4.1.3 感受野 056
4.1.4 乘累加運(yùn)算 058
4.1.5 多維卷積公式 060
4.1.6 填充 063
4.1.7 步長(zhǎng) 064
4.1.8 膨脹率 067
4.1.9 輸出尺寸公式 068
4.1.10 手寫卷積 071
4.1.11 卷積總結(jié) 073
4.2 池化 074
4.2.1 什么是池化 074
4.2.2 池化的作用 076
4.2.3 全局平均池化 077
4.2.4 手寫池化算法 079
4.3 Batch Normalization 080
4.3.1 BN的作用 080
4.3.2 訓(xùn)練和推理中的BN 081
4.3.3 手寫B(tài)N 083
4.3.4 卷積與BN的融合 085
4.4 激活函數(shù) 087
4.4.1 非線性 088
4.4.2 ReLU 089
4.4.3 Sigmoid 091
4.5 殘差結(jié)構(gòu) 093
4.5.1 殘差結(jié)構(gòu)的作用 093
4.5.2 手寫殘差結(jié)構(gòu) 094
4.6 全連接 097
4.6.1 全連接的作用 098
4.6.2 手寫全連接 100
4.7 SoftMax與交叉熵?fù)p失 101
4.7.1 SoftMax 102
4.7.2 交叉熵?fù)p失 105
4.8 本章小結(jié) 108
第五章 基于Python從零手寫模型 111~134
5.1 Python環(huán)境配置 112
5.2 Python目錄簡(jiǎn)介 113
5.3 圖像加載 115
5.4 圖像預(yù)處理 116
5.4.1 圖像縮放和裁剪 116
5.4.2 圖像標(biāo)準(zhǔn)化 118
5.4.3 實(shí)戰(zhàn)代碼 119
5.5 模型準(zhǔn)備 119
5.5.1 模型下載 119
5.5.2 權(quán)值保存 121
5.5.3 權(quán)值加載 123
5.6 手寫算法 126
5.7 搭建模型 126
5.8 模型預(yù)測(cè) 129
5.9 性能指標(biāo) 131
5.10 卷積計(jì)算優(yōu)化 133
第六章 基于C++優(yōu)化模型 135~164
6.1 C++環(huán)境配置 137
6.2 C++目錄簡(jiǎn)介 137
6.3 C++代碼使用 138
6.4 計(jì)算向量化 139
6.4.1 什么是向量計(jì)算 139
6.4.2 AVX2指令集 141
6.4.3 向量寄存器 141
6.4.4 向量數(shù)據(jù)加載 143
6.4.5 利用AVX2優(yōu)化卷積 145
6.4.6 性能評(píng)估 146
6.5 權(quán)值預(yù)加載優(yōu)化 147
6.5.1 權(quán)值加載 148
6.5.2 預(yù)加載操作 149
6.5.3 性能評(píng)估 152
6.6 內(nèi)存優(yōu)化 153
6.6.1 內(nèi)存申請(qǐng)機(jī)制 153
6.6.2 字符串優(yōu)化 154
6.6.3 動(dòng)態(tài)內(nèi)存優(yōu)化 155
6.6.4 性能評(píng)估 157
6.7 多線程優(yōu)化 157
6.7.1 多線程簡(jiǎn)介 158
6.7.2 卷積的多線程拆分 159
6.7.3 性能評(píng)估 161
6.8 性能優(yōu)化總結(jié) 162
后記 165~170
附錄 171~183
1.1 One-hot編碼 172
1.2 快速搭建Ubuntu環(huán)境 174
1.2.1 安裝步驟 175
1.2.2 軟件管理 180
1.3 OpenCV介紹 181
1.3.1 什么是OpenCV 181
1.3.2 OpenCV環(huán)境搭建 182
參考文獻(xiàn) 184