本書主要介紹了圖像畫質(zhì)相關(guān)的各類底層視覺任務(wù)及其相關(guān)算法,重點講解了去噪、超分辨率、去霧、高動態(tài)范圍、圖像合成與圖像和諧化、圖像增強(qiáng)與圖像修飾等多種類型的基礎(chǔ)任務(wù)的設(shè)定及其對應(yīng)的經(jīng)典算法和模型。本書討論了底層視覺任務(wù)的基本特征,并從成像過程及圖像處理的基礎(chǔ)知識出發(fā),系統(tǒng)分析了不同任務(wù)下的退化機(jī)制,以及對應(yīng)的算法設(shè)計原則。本書在算法選擇上兼顧了經(jīng)典的傳統(tǒng)圖像算法及當(dāng)前較新的人工智能模型算法,可以作為從圖像處理領(lǐng)域或者深度學(xué)習(xí)領(lǐng)域進(jìn)入底層計算機(jī)視覺領(lǐng)域進(jìn)行學(xué)習(xí)的讀者的基礎(chǔ)讀物。本書主要面向的讀者群體包括深度學(xué)習(xí)與計算機(jī)視覺行業(yè)的從業(yè)人員,計算機(jī)、人工智能及其相關(guān)專業(yè)方向的學(xué)生,圖像處理相關(guān)技術(shù)的愛好者與學(xué)習(xí)者。
賈壯,計算機(jī)視覺算法工程師,畢業(yè)于清華大學(xué)自動化系,模式識別與智能系統(tǒng)方向碩士,曾在百度、華為等單位從事多項視覺相關(guān)算法項目的研發(fā)與交付,在相關(guān)期刊和會議發(fā)表多篇論文,并在視覺相關(guān)國際競賽中獲得獎項,編著有《機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法基礎(chǔ)》等技術(shù)書籍。
第1章 畫質(zhì)算法與底層視覺概述 1
1.1 畫質(zhì)算法的主要任務(wù) 1
1.1.1 畫質(zhì)算法定義及其主要類別 1
1.1.2 畫質(zhì)問題的核心:退化 3
1.2 基于深度學(xué)習(xí)的底層視覺技術(shù) 4
1.2.1 深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò) 4
1.2.2 底層視覺任務(wù)的特點 5
第2章 畫質(zhì)處理的基礎(chǔ)知識 7
2.1 光照與成像 7
2.1.1 視覺與光學(xué)成像 7
2.1.2 Bayer陣列與去馬賽克 15
2.1.3 相機(jī)圖像信號處理的基本流程 20
2.2 色彩與顏色空間 25
2.2.1 人眼色覺與色度圖 25
2.2.2 常見的顏色空間 28
2.3 圖像的影調(diào)調(diào)整方法 32
2.3.1 直方圖與對比度 32
2.3.2 對比度拉伸與直方圖均衡 35
2.3.3 對比度增強(qiáng)算法的改進(jìn)策略 39
2.4 圖像常見的空間操作 42
2.4.1 基本圖像變換:仿射變換與透視變換 42
2.4.2 光流與幀間對齊 50
2.5 圖像的頻域分析與圖像金字塔 54
2.5.1 傅里葉變換與頻域分析 54
2.5.2 自然圖像的頻域統(tǒng)計特性 60
2.5.3 圖像金字塔:高斯金字塔與拉普拉斯金字塔 61
第3章 圖像與視頻去噪算法 66
3.1 噪聲的來源與數(shù)學(xué)模型 66
3.1.1 圖像噪聲的物理來源 66
3.1.2 噪聲的數(shù)學(xué)模型 68
3.2 去噪算法的難點與策略 76
3.2.1 去噪算法的難點 76
3.2.2 盲去噪與非盲去噪 77
3.2.3 高斯去噪與真實噪聲去噪 77
3.2.4 去噪算法的評價指標(biāo) 78
3.3 傳統(tǒng)去噪算法 84
3.3.1 空域濾波:均值、高斯與中值濾波器 84
3.3.2 非局部均值算法 87
3.3.3 小波變換去噪算法 90
3.3.4 雙邊濾波與導(dǎo)向濾波 96
3.3.5 BM3D濾波算法 104
3.4 深度學(xué)習(xí)去噪算法 106
3.4.1 深度殘差去噪網(wǎng)絡(luò)DnCNN和FFDNet 106
3.4.2 噪聲估計網(wǎng)絡(luò)去噪:CBDNet 115
3.4.3 小波變換與神經(jīng)網(wǎng)絡(luò)的結(jié)合:MWCNN 119
3.4.4 視頻去噪:DVDNet和FastDVDNet 125
3.4.5 基于Transformer的去噪方法:IPT與SwinIR 132
3.4.6 自監(jiān)督去噪算法:Noise2Noise、Noise2Void與DIP 138
3.4.7 Raw域去噪策略與算法:Unprocess與CycleISP 142
第4章 圖像與視頻超分辨率 145
4.1 超分辨率任務(wù)概述 146
4.1.1 分辨率與超分辨率任務(wù) 146
4.1.2 超分辨率的任務(wù)設(shè)定與特點 147
4.1.3 超分辨率的評價指標(biāo) 150
4.2 超分辨率的傳統(tǒng)算法 156
4.2.1 上采樣插值算法與圖像銳化處理 156
4.2.2 基于自相似性的超分辨率 162
4.2.3 基于稀疏編碼的超分辨率 164
4.3 經(jīng)典深度學(xué)習(xí)超分辨率算法 166
4.3.1 神經(jīng)網(wǎng)絡(luò)超分辨率開端:SRCNN和FSRCNN 167
4.3.2 無參的高效上采樣:ESPCN 171
4.3.3 無BN層的殘差網(wǎng)絡(luò):EDSR 173
4.3.4 殘差稠密網(wǎng)絡(luò) 176
4.3.5 針對視覺畫質(zhì)的優(yōu)化:SRGAN與ESRGAN 178
4.3.6 注意力機(jī)制超分辨率網(wǎng)絡(luò):RCAN 183
4.3.7 盲超分辨率中的退化估計:ZSSR與KernelGAN 187
4.4 真實世界的超分辨率模型 189
4.4.1 復(fù)雜退化模擬:BSRGAN與Real-ESRGAN 189
4.4.2 圖像域遷移:CycleGAN類網(wǎng)絡(luò)與無監(jiān)督超分辨率 193
4.4.3 擴(kuò)散模型的真實世界超分辨率:StableSR 196
4.5 超分辨率模型的輕量化 199
4.5.1 多分支信息蒸餾:IMDN與RFDN 199
4.5.2 重參數(shù)化策略:ECBSR 206
4.5.3 消除特征冗余:GhostSR 214
4.5.4 單層極輕量化模型:edgeSR 217
4.6 視頻超分辨率模型簡介 221
4.6.1 視頻超分辨率的特點 221
4.6.2 BasicVSR、BasicVSR++與RealBasicVSR 223
4.7 超分辨率模型的優(yōu)化策略 227
4.7.1 基于分頻分區(qū)域處理的模型設(shè)計 227
4.7.2 針對細(xì)節(jié)紋理的恢復(fù)策略 228
4.7.3 可控可解釋的畫質(zhì)恢復(fù)與超分辨率 231
第5章 圖像去霧 235
5.1 圖像去霧任務(wù)概述 235
5.1.1 有霧圖像的形成與影響 235
5.1.2 有霧圖像的退化:大氣散射模型 236
5.1.3 去霧算法的主要思路 237
5.2 基于物理模型的去霧算法 238
5.2.1 基于反照系數(shù)分解的Fattal去霧算法 238
5.2.2 暗通道先驗去霧算法 243
5.2.3 顏色衰減先驗去霧算法 248
5.3 深度學(xué)習(xí)去霧算法 255
5.3.1 端到端的透射圖估計:DehazeNet 255
5.3.2 輕量級去霧網(wǎng)絡(luò)模型:AOD-Net 260
5.3.3 基于GAN的去霧模型:Dehaze cGAN和Cycle-Dehaze 262
5.3.4 金字塔稠密連接網(wǎng)絡(luò):DCPDN 264
5.3.5 特征融合注意力去霧模型:FFA-Net 265
第6章 圖像高動態(tài)范圍 277
6.1 圖像HDR任務(wù)簡介 277
6.1.1 動態(tài)范圍的概念 277
6.1.2 HDR任務(wù)分類與關(guān)鍵問題 279
6.2 傳統(tǒng)HDR相關(guān)算法 280
6.2.1 多曝融合算法 280
6.2.2 局部拉普拉斯濾波算法 285
6.2.3 Reinhard攝影色調(diào)重建算法 295
6.2.4 快速雙邊濾波色調(diào)映射算法 301
6.3 基于神經(jīng)網(wǎng)絡(luò)模型的HDR算法 306
6.3.1 網(wǎng)絡(luò)模型的訓(xùn)練目標(biāo):MEF-SSIM 306
6.3.2 端到端多曝融合算法:DeepFuse 310
6.3.3 多曝權(quán)重的網(wǎng)絡(luò)計算:MEF-Net 313
6.3.4 注意力機(jī)制HDR網(wǎng)絡(luò):AHDRNet 317
6.3.5 單圖動態(tài)范圍擴(kuò)展:ExpandNet 327
第7章 圖像合成與圖像和諧化 331
7.1 圖像合成任務(wù)簡介 331
7.2 經(jīng)典圖像合成算法 332
7.2.1 alpha通道混合算法 332
7.2.2 多尺度融合:拉普拉斯金字塔融合 334
7.2.3 梯度域的無縫融合:泊松融合 337
7.3 深度學(xué)習(xí)圖像合成與圖像和諧化 343
7.3.1 空間分離注意力:S2AM模型 344
7.3.2 域驗證的和諧化:DoveNet 348
7.3.3 背景引導(dǎo)的域轉(zhuǎn)換:BargainNet 354
7.3.4 前景到背景的風(fēng)格遷移:RainNet 357
第8章 圖像增強(qiáng)與圖像修飾 360
8.1 圖像增強(qiáng)任務(wù)概述 360
8.2 傳統(tǒng)低光增強(qiáng)算法 361
8.2.1 基于反色去霧的低光增強(qiáng)算法 361
8.2.2 多尺度Retinex算法 364
8.3 神經(jīng)網(wǎng)絡(luò)模型的增強(qiáng)與顏色調(diào)整 369
8.3.1 Retinex理論的模型實現(xiàn):RetinexNet 370
8.3.2 雙邊實時增強(qiáng)算法:HDRNet 374
8.3.3 無參考圖的低光增強(qiáng):Zero-DCE 376
8.3.4 可控的修圖模型:CSRNet 380
8.3.5 3D LUT類模型:圖像自適應(yīng)3D LUT和NILUT 383
8.3.6 色域擴(kuò)展:GamutNet和GamutMLP 388