深度學習在數(shù)字圖像處理中的應(yīng)用
定 價:89 元
- 作者:馬龍華
- 出版時間:2022/6/1
- ISBN:9787121437083
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TN911.73
- 頁碼:304
- 紙張:
- 版次:01
- 開本:16開
深度學習憑借其在識別應(yīng)用領(lǐng)域中超高的預測準確率,在圖像處理領(lǐng)域獲得了極大關(guān)注,這勢必將提升現(xiàn)有圖像處理系統(tǒng)的性能并開創(chuàng)新的應(yīng)用領(lǐng)域。利用卷積神經(jīng)網(wǎng)絡(luò)等深層神經(jīng)網(wǎng)絡(luò)的解決方案,可以逐漸取代基于算法可解釋的傳統(tǒng)圖像處理工作。盡管圖像預處理、后期處理和信號處理仍在大量采用現(xiàn)有方法,但在圖像分類應(yīng)用中,深度學習變得愈加重要。在該背景下,本書系統(tǒng)介紹了深度學習在數(shù)字圖像處理各個研究分支的應(yīng)用,包括圖像增強、圖像復原、圖像檢索、圖像壓縮、圖像分割、目標檢測、動作識別和圖像配準等。每一部分都對傳統(tǒng)方法做了概述,并穿插介紹本書作者的研究成果,反映了深度學習在數(shù)字圖像處理各個研究分支的發(fā)展現(xiàn)狀。本書可作為高等院校具有一定計算機基礎(chǔ)的人工智能、自動化、信號與信息處理、電子信息工程、計算機科學與技術(shù)、通信工程等專業(yè)的研究生或高年級本科生的教材或參考書,也可作為科研院所相關(guān)專業(yè)的科技工作者的參考書。
馬龍華,浙江大學寧波理工學院教授,主持和承擔國家自然科學基金面上項目3項、重點項目1項,工信部"中國制造2025”新模式重大專項2項,浙江省杰出青年基金和重點基金各1項;獲省部級科技進步獎6項,其中省部級二等獎3項。
第1章 數(shù)字圖像處理概述 1
1.1 數(shù)字圖像的基本概念 1
1.1.1 數(shù)字圖像 1
1.1.2 獲取靜態(tài)數(shù)字圖像的方式 7
1.1.3 色彩及色彩模型 10
1.2 數(shù)字圖像的獲取與描述 15
1.2.1 圖像數(shù)字化 15
1.2.2 圖像灰度直方圖 17
1.2.3 圖像處理算法的形式 20
1.2.4 圖像的數(shù)據(jù)結(jié)構(gòu)與特征 21
1.3 數(shù)字圖像處理的研究內(nèi)容和應(yīng)用領(lǐng)域 25
1.3.1 數(shù)字圖像處理的基本流程 25
1.3.2 數(shù)字圖像處理的研究分支 26
1.3.3 傳統(tǒng)數(shù)字圖像處理常用的理論工具 30
1.3.4 數(shù)字圖像處理的應(yīng)用領(lǐng)域 30
參考文獻 32
第2章 深度學習概述 33
2.1 深度學習的概念 33
2.1.1 深度學習的歷史背景 33
2.1.2 深度學習的基本思想 33
2.1.3 深度學習的本質(zhì)和優(yōu)勢 34
2.2 國內(nèi)外研究現(xiàn)狀 35
2.2.1 深度學習在語音識別領(lǐng)域的研究現(xiàn)狀 35
2.2.2 深度學習在圖像識別領(lǐng)域的研究現(xiàn)狀 37
2.2.3 深度學習在自然語言處理領(lǐng)域的研究現(xiàn)狀 40
2.3 深度學習典型模型結(jié)構(gòu)和訓練算法 41
2.3.1 感知機 42
2.3.2 前饋神經(jīng)網(wǎng)絡(luò)之多層感知機 43
2.3.3 前饋神經(jīng)網(wǎng)絡(luò)之卷積神經(jīng)網(wǎng)絡(luò) 45
2.3.4 反饋深度網(wǎng)絡(luò) 48
2.3.5 雙向深度網(wǎng)絡(luò) 50
2.3.6 深度學習訓練算法 55
2.4 深度學習的優(yōu)點和已有的應(yīng)用 57
2.4.1 深度學習的優(yōu)點 57
2.4.2 深度學習已有的典型應(yīng)用 57
2.5 深度學習存在的問題及未來研究方向 60
2.5.1 深度學習目前存在的問題 60
2.5.2 深度學習未來研究方向 61
參考文獻 62
第3章 基于深度學習的圖像增強與圖像恢復 66
3.1 圖像去噪 66
3.1.1 傳統(tǒng)圖像去噪方法概述 66
3.1.2 基于DnCNN的圖像去噪 69
3.1.3 基于CBDNet的圖像去噪 72
3.2 圖像去霧 74
3.2.1 傳統(tǒng)圖像去霧方法概述 74
3.2.2 基于DehazeNet的圖像去霧 77
3.2.3 基于EPDN的圖像去霧 79
3.2.4 基于PMS-Net的圖像去霧 80
3.3 圖像去模糊 82
3.3.1 傳統(tǒng)圖像去模糊方法概述 82
3.3.2 基于ResBlock的圖像去模糊 85
3.3.3 基于DAVANet的圖像去模糊 86
3.4 圖像增強 91
3.4.1 傳統(tǒng)圖像增強方法概述 91
3.4.2 基于Deep Bilateral Learning的圖像增強 94
3.4.3 基于Deep Photo Enhancer的圖像增強 96
3.4.4 基于Deep Illumination Estimation的圖像增強 97
參考文獻 99
第4章 基于深度學習的圖像檢索 105
4.1 圖像檢索的研究背景和研究現(xiàn)狀 105
4.1.1 圖像檢索的研究背景 105
4.1.2 為什么要引入深度學習 106
4.1.3 圖像檢索的研究現(xiàn)狀 106
4.2 圖像特征和相似性度量 108
4.2.1 原始數(shù)據(jù)層特征 108
4.2.2 物理層特征 109
4.2.3 語義層特征 110
4.2.4 圖像相似性度量 110
4.3 基于內(nèi)容的圖像檢索 111
4.3.1 基于顏色特征的圖像檢索 111
4.3.2 基于紋理特征的圖像檢索 113
4.3.3 基于形狀特征的圖像檢索 114
4.3.4 基于多特征的圖像檢索 115
4.3.5 基于視覺詞袋的圖像檢索 119
4.4 基于注意力機制和卷積神經(jīng)網(wǎng)絡(luò)的圖像檢索 122
4.4.1 注意力機制簡介 122
4.4.2 圖像檢索中的注意力機制 123
4.4.3 基于注意力機制和卷積神經(jīng)網(wǎng)絡(luò)模型的圖像檢索 124
4.4.4 實驗結(jié)果 127
4.5 基于深度信念網(wǎng)絡(luò)的人臉圖像檢索 130
4.5.1 局部二值模式 130
4.5.2 DBN訓練模型 130
4.5.3 融合LBP算子與DBN網(wǎng)絡(luò)模型的圖像檢索 131
4.5.4 實驗結(jié)果 131
參考文獻 132
第5章 基于深度學習的圖像壓縮 136
5.1 圖像壓縮概述 136
5.1.1 圖像壓縮的目的和意義 136
5.1.2 傳統(tǒng)圖像壓縮的方法分類和簡介 137
5.1.3 為什么要引入深度學習 139
5.1.4 基于深度學習的圖像壓縮技術(shù)現(xiàn)狀 139
5.2 基于矢量量化的圖像壓縮方法 140
5.2.1 基于矢量量化的圖像壓縮概述 140
5.2.2 基于邊緣分類和范數(shù)排序的K-means算法的碼書設(shè)計 142
5.2.3 基于特征分類和分組初始化的改進K-means算法的碼書設(shè)計 146
5.3 基于深度學習的圖像壓縮方法 151
5.3.1 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法概述 151
5.3.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法概述 153
5.3.3 基于生成對抗網(wǎng)絡(luò)的圖像壓縮方法概述 154
5.3.4 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)方法的圖像壓縮 155
5.3.5 實驗結(jié)果與分析 159
參考文獻 161
第6章 基于深度學習的圖像分割 167
6.1 圖像分割概述 167
6.1.1 圖像分割的目的和意義 167
6.1.2 傳統(tǒng)圖像分割方法分類 168
6.1.3 典型傳統(tǒng)圖像分割方法簡介 170
6.1.4 為什么引入深度學習 175
6.2 復雜背景下毛坯輪轂圖像分割及圓心精確定位 176
6.2.1 引言 176
6.2.2 基于超像素能量譜的輪轂分割 177
6.2.3 精確圓擬合算法 178
6.2.4 圓擬合結(jié)果分析 179
6.3 基于深度學習的圖像分割概述 181
6.3.1 研究現(xiàn)狀 181
6.3.2 幾種典型實現(xiàn)方案 182
6.3.3 基于全卷積神經(jīng)網(wǎng)絡(luò)的圖像分割實驗結(jié)果 185
6.4 基于深度生成對抗網(wǎng)絡(luò)的超聲圖像分割 186
6.4.1 引言 186
6.4.2 相關(guān)工作 187
6.4.3 基于深度生成對抗網(wǎng)絡(luò)的臂叢分割 188
6.4.4 實驗 190
參考文獻 193
第7章 基于深度學習的人臉檢測與行人檢測 198
7.1 基于深度學習的人臉檢測 198
7.1.1 人臉檢測概述 198
7.1.2 基于深度學習的人臉檢測算法分類和數(shù)據(jù)集 200
7.1.3 多任務(wù)級聯(lián)卷積網(wǎng)絡(luò)的加速 203
7.1.4 實驗結(jié)果 209
7.2 行人檢測概述 212
7.2.1 行人檢測基本框架 212
7.2.2 基于傳統(tǒng)機器學習的方法 212
7.2.3 基于深度學習的方法 213
7.2.4 行人檢測評判標準 216
7.3 基于ViBe結(jié)合HOG+SVM的快速行人檢測與跟蹤 216
7.3.1 引言 216
7.3.2 ViBe算法 217
7.3.3 基于HOG+SVM的行人檢測 218
7.3.4 基于ViBe結(jié)合HOG+SVM方案 220
7.3.5 實驗結(jié)果與分析 222
參考文獻 227
第8章 基于深度學習的動作識別 232
8.1 人體動作識別技術(shù)概述 232
8.1.1 引言 232
8.1.2 國內(nèi)外研究現(xiàn)狀 233
8.1.3 研究難點 236
8.2 動作識別相關(guān)技術(shù) 237
8.2.1 圖卷積網(wǎng)絡(luò) 237
8.2.2 用于骨骼動作識別的空時圖卷積網(wǎng)絡(luò) 239
8.2.3 用于視頻動作識別的雙流卷積網(wǎng)絡(luò) 240
8.2.4 動作識別相關(guān)數(shù)據(jù)集 241
8.3 人體姿態(tài)估計 244
8.3.1 人體姿態(tài)估計的分類 244
8.3.2 OpenPose算法 245
8.3.3 AlphaPose算法 248
8.3.4 實驗結(jié)果比較分析 251
8.4 基于圖卷積網(wǎng)絡(luò)的骨骼序列動作識別算法 253
8.4.1 引言 253
8.4.2 注意力機制和共現(xiàn)特征學習 253
8.4.3 基于圖卷積網(wǎng)絡(luò)的多任務(wù)框架 254
8.4.4 實驗結(jié)果及分析 257
8.5 一種替代光流的視頻動作識別算法 261
8.5.1 基于光流估計的雙流卷積網(wǎng)絡(luò) 261
8.5.2 時間軌跡濾波器 262
8.5.3 隨機跨幀融合 264
8.5.4 實驗結(jié)果及分析 265
參考文獻 266
第9章 基于深度學習的醫(yī)學圖像配準 270
9.1 醫(yī)學圖像配準概述 270
9.1.1 基本概念 270
9.1.2 基本變換 270
9.1.3 方法分類 272
9.1.4 典型配準方法 272
9.1.5 評估方法 273
9.2 基于分形沙漏網(wǎng)絡(luò)由MV-DR合成kV-DRR 274
9.2.1 引言 274
9.2.2 分形沙漏網(wǎng)絡(luò) 274
9.2.3 實驗 276
9.3 基于公共表征學習和幾何約束的多模態(tài)醫(yī)學圖像配準 278
9.3.1 引言 278
9.3.2 方法 279
9.3.3 實驗及算法比較 280
9.4 基于信息瓶頸條件生成對抗網(wǎng)絡(luò)的MV-DR和kV-DRR配準 281
9.4.1 引言 281
9.4.2 材料和方法 282
9.4.3 結(jié)果 287
參考文獻 290