Python計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)實(shí)戰(zhàn)
定 價(jià):99.8 元
- 作者:郭卡 戴亮
- 出版時(shí)間:2021/8/1
- ISBN:9787115567239
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:292
- 紙張:
- 版次:01
- 開(kāi)本:16K
《Python計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)實(shí)戰(zhàn)》立足實(shí)踐,從機(jī)器學(xué)習(xí)的基礎(chǔ)技能出發(fā),深入淺出地介紹了如何使用 Python 進(jìn)行基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)項(xiàng)目開(kāi)發(fā)。開(kāi)篇介紹了基于傳統(tǒng)機(jī)器學(xué)習(xí)及圖像處理方法的計(jì)算機(jī)視覺(jué)技術(shù);然后重點(diǎn)就圖像分類、目標(biāo)檢測(cè)、圖像分割、圖像搜索、圖像壓縮及文本識(shí)別等常見(jiàn)的計(jì)算機(jī)視覺(jué)項(xiàng)目做了理論結(jié)合實(shí)踐的講解;最后探索了深度學(xué)習(xí)項(xiàng)目落地時(shí)會(huì)用到的量化、剪枝等技術(shù),并提供了模型服務(wù)端部署案例。
《Python計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)實(shí)戰(zhàn)》適合有一定的Python 編程基礎(chǔ),初學(xué)深度學(xué)習(xí)的讀者閱讀。
1.基于sklearn+PyTorch,理論+實(shí)踐方式介紹計(jì)算機(jī)視覺(jué)項(xiàng)目
2.圖文并茂,豐富項(xiàng)目實(shí)例助力搭建計(jì)算機(jī)視覺(jué)模型
3.編程實(shí)驗(yàn)展示深度學(xué)習(xí)理論,直觀理解深度學(xué)習(xí)領(lǐng)域晦澀原理
4.實(shí)例項(xiàng)目采用項(xiàng)目文件形式編寫(xiě),貼合軟件工程開(kāi)發(fā)實(shí)際應(yīng)用場(chǎng)景
郭卡,安徽外國(guó)語(yǔ)學(xué)院計(jì)算機(jī)講師,省級(jí)自然科學(xué)基金重點(diǎn)項(xiàng)目“基于大數(shù)據(jù)與人工智能技術(shù)的在線學(xué)習(xí)評(píng)價(jià)系統(tǒng)”主持人,《Python 數(shù)據(jù)爬取技術(shù)與實(shí)戰(zhàn)手冊(cè)》主編,參與多項(xiàng)人工智能研究項(xiàng)目并發(fā)表相關(guān)論文兩篇。
戴亮,科大訊飛算法工程師,GiantPandaCV 作者之一,主要研究方向?yàn)楣鈱W(xué)字符識(shí)別與語(yǔ)音識(shí)別,熱衷于 PyTorch 技術(shù)分享,對(duì)深度學(xué)習(xí)相關(guān)技術(shù)有深入了解。
第 1章 機(jī)器學(xué)習(xí)與sklearn 1
1.1 sklearn 環(huán)境配置 2
1.1.1 環(huán)境要求 2
1.1.2 安裝方法 2
1.1.3 修改pip 源 3
1.1.4 安裝Jupyter Notebook 4
1.2 數(shù)據(jù)集 5
1.2.1 自帶的小型數(shù)據(jù)集 6
1.2.2 在線下載的數(shù)據(jù)集 8
1.2.3 計(jì)算機(jī)生成的數(shù)據(jù)集 8
1.3 分類 9
1.3.1 加載數(shù)據(jù)與模型 10
1.3.2 建立分類模型 11
1.3.3 模型的訓(xùn)練及預(yù)測(cè) 12
1.3.4 模型評(píng)價(jià) 12
1.4 回歸 14
1.4.1 線性回歸 15
1.4.2 回歸模型評(píng)價(jià) 16
1.5 聚類 17
1.5.1 K-means 17
1.5.2 DBSCAN 17
1.5.3 聚類實(shí)例 18
1.6 降維 19
1.6.1 PCA 降維 19
1.6.2 LDA 降維 22
1.7 模型驗(yàn)證 23
1.8 模型持久化 27
1.8.1 joblib 27
1.8.2 pickle 28
1.9 小結(jié) 28
第 2章 傳統(tǒng)圖像處理方法 29
2.1 圖像分類 29
2.1.1 HOG 的原理 29
2.1.2 工具介紹 30
2.1.3 CIFAR-10 分類 31
2.1.4 手寫(xiě)字符分類 33
2.2 目標(biāo)檢測(cè) 36
2.3 圖像分割 40
2.4 圖像搜索 41
2.5 小結(jié) 43
第3章 深度學(xué)習(xí)與PyTorch 44
3.1 框架介紹 44
3.2 環(huán)境配置 46
3.3 運(yùn)算基本單元 48
3.3.1 Tensor 數(shù)據(jù)類型 48
3.3.2 Tensor 與ndarray 49
3.3.3 CPU 與GPU 運(yùn)算 49
3.3.4 PyTorch 實(shí)現(xiàn)K-means 51
3.4 自動(dòng)求導(dǎo) 55
3.5 數(shù)據(jù)加載 57
3.5.1 Dataset 58
3.5.2 DataLoader 59
3.6 神經(jīng)網(wǎng)絡(luò)工具包 60
3.6.1 Module 模塊 61
3.6.2 線性層 62
3.6.3 卷積層 62
3.6.4 池化層 64
3.6.5 BatchNorm 層 65
3.6.6 激活層 65
3.6.7 神經(jīng)網(wǎng)絡(luò)各層輸出的可視化 72
3.6.8 循環(huán)神經(jīng)網(wǎng)絡(luò) 76
3.6.9 Sequential 和ModuleList 78
3.6.10 損失函數(shù) 79
3.7 模型優(yōu)化器optim 82
3.7.1 optim 用法 82
3.7.2 優(yōu)化器的選擇 82
3.7.3 學(xué)習(xí)率的選擇 86
3.8 參數(shù)初始化init 94
3.9 模型持久化 96
3.10 JIT 編譯器 98
3.11 模型遷移ONNX 99
3.12 數(shù)據(jù)可視化TensorBoard 101
3.13 機(jī)器視覺(jué)工具包torchvision 103
3.13.1 數(shù)據(jù) 103
3.13.2 模型 104
3.13.3 圖像處理 106
3.14 小結(jié) 110
第4章 卷積神經(jīng)網(wǎng)絡(luò)中的分類與回歸 111
4.1 卷積神經(jīng)網(wǎng)絡(luò)中的分類問(wèn)題 112
4.1.1 CIFAR-10 圖像分類 112
4.1.2 卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展 117
4.1.3 分類網(wǎng)絡(luò)的實(shí)現(xiàn) 121
4.1.4 模型訓(xùn)練 127
4.1.5 模型展示 132
4.1.6 多標(biāo)簽分類 134
4.2 卷積神經(jīng)網(wǎng)絡(luò)中的回歸問(wèn)題 142
4.2.1 生成數(shù)據(jù)集 142
4.2.2 模型訓(xùn)練 145
4.2.3 模型展示 146
4.3 小結(jié) 148
第5章 目標(biāo)檢測(cè) 149
5.1 深度學(xué)習(xí)物體檢測(cè)算法 149
5.1.1 兩段式檢測(cè) 150
5.1.2 一段式檢測(cè) 153
5.2 數(shù)據(jù)集構(gòu)建 155
5.2.1 選擇目標(biāo)物體圖片 155
5.2.2 背景圖片下載 156
5.2.3 圖片合成 156
5.3 數(shù)據(jù)加載 162
5.4 數(shù)據(jù)標(biāo)記與損失函數(shù)構(gòu)建 166
5.4.1 數(shù)據(jù)標(biāo)記 167
5.4.2 損失函數(shù) 167
5.5 模型搭建與訓(xùn)練 172
5.6 模型預(yù)測(cè) 175
5.7 小結(jié) 180
第6章 圖像分割 181
6.1 數(shù)據(jù)加載 184
6.2 模型搭建 189
6.3 模型訓(xùn)練 191
6.4 模型展示 194
6.5 智能彈幕 195
6.6 像素級(jí)回歸問(wèn)題:超分辨率重建 196
6.6.1 超分辨率重建算法的發(fā)展 197
6.6.2 數(shù)據(jù)加載 198
6.6.3 模型搭建與訓(xùn)練 202
6.6.4 模型展示 205
6.7 小結(jié) 206
第7章 圖像搜索 207
7.1 分類網(wǎng)絡(luò)的特征 208
7.2 深度學(xué)習(xí)人臉識(shí)別技術(shù) 208
7.2.1 FaceNet 209
7.2.2 CosFace 和ArcFace 209
7.3 數(shù)據(jù)處理 210
7.3.1 數(shù)據(jù)下載 210
7.3.2 數(shù)據(jù)檢查 212
7.3.3 數(shù)據(jù)提取 213
7.4 模型訓(xùn)練 214
7.4.1 普通分類模型 214
7.4.2 CosFace 218
7.5 圖像搜索 219
7.5.1 圖像比對(duì) 219
7.5.2 KD-Tree 搜索 221
7.6 小結(jié) 224
第8章 圖像壓縮 225
8.1 AutoEncoder 226
8.1.1 AutoEncoder 的原理 226
8.1.2 AutoEncoder 模型搭建 226
8.1.3 數(shù)據(jù)加載 229
8.1.4 模型訓(xùn)練 230
8.1.5 結(jié)果展示 232
8.2 GAN 234
8.2.1 GAN 原理 234
8.2.2 GAN 訓(xùn)練流程 235
8.2.3 GAN 隨機(jī)生成人臉圖片 235
8.2.4 GAN 與AutoEncoder 的結(jié)合 242
8.2.5 圖像修復(fù) 247
8.3 小結(jié) 250
第9章 不定長(zhǎng)文本識(shí)別 251
9.1 循環(huán)神經(jīng)網(wǎng)絡(luò)概述 251
9.2 時(shí)間序列預(yù)測(cè) 252
9.2.1 創(chuàng)建模型 253
9.2.2 生成數(shù)據(jù) 253
9.2.3 模型訓(xùn)練 255
9.2.4 模型預(yù)測(cè) 256
9.3 CRNN 模型 257
9.3.1 CRNN 算法簡(jiǎn)介 257
9.3.2 CTCLoss 函數(shù) 258
9.3.3 模型結(jié)構(gòu) 259
9.3.4 數(shù)據(jù)預(yù)處理 261
9.3.5 模型訓(xùn)練 264
9.3.6 模型預(yù)測(cè) 266
9.4 小結(jié) 267
第 10章 神經(jīng)網(wǎng)絡(luò)壓縮與部署 268
10.1 剪枝 268
10.1.1 模型設(shè)計(jì) 269
10.1.2 訓(xùn)練基礎(chǔ)模型 271
10.1.3 模型稀疏化 273
10.1.4 壓縮模型通道 276
10.2 量化 283
10.3 混合精度訓(xùn)練 287
10.4 深度學(xué)習(xí)模型的服務(wù)端部署 289
10.4.1 創(chuàng)建接口 289
10.4.2 訪問(wèn)接口 291
10.5 小結(jié) 292