計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)實(shí)戰(zhàn):以MATLAB、Python為工具
定 價(jià):109 元
- 作者:劉衍琦
- 出版時(shí)間:2019/10/1
- ISBN:9787121374838
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP302.7;TP181
- 頁(yè)碼:496
- 紙張:
- 版次:01
- 開本:16開
本書詳細(xì)講解了36個(gè)計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)實(shí)戰(zhàn)案例(含可運(yùn)行程序),涉及霧霾去噪、答題卡自動(dòng)閱卷、肺部圖像分割、小波數(shù)字水印、圖像檢索、人臉二維碼識(shí)別、車牌定位及識(shí)別、霍夫曼圖像壓縮、手寫數(shù)字識(shí)別、英文字符文本識(shí)別、眼前節(jié)組織提取、全景圖像拼接、小波圖像融合、基于語(yǔ)音識(shí)別的音頻信號(hào)模擬燈控、路面裂縫檢測(cè)識(shí)別、視頻運(yùn)動(dòng)估計(jì)追蹤、Simulink圖像處理、胸片及肝臟分割、基于深度學(xué)習(xí)的汽車目標(biāo)檢測(cè)、基于計(jì)算機(jī)視覺(jué)的自動(dòng)駕駛應(yīng)用、基于深度學(xué)習(xí)的視覺(jué)場(chǎng)景識(shí)別、基于深度特征的以圖搜畫、基于CNN的字符識(shí)別、基于CNN的物體識(shí)別、基于CNN的圖像矯正、基于LSTM的時(shí)間序列分析、基于深度學(xué)習(xí)的以圖搜圖技術(shù)、基于YOLO的智能交通目標(biāo)檢測(cè)等多項(xiàng)重要技術(shù)及應(yīng)用,涵蓋了數(shù)字圖像處理中幾乎所有的基本模塊,并延伸到了深度學(xué)習(xí)理論及其應(yīng)用方面。工欲善其事,必先利其器,本書對(duì)每個(gè)數(shù)字圖像處理的知識(shí)點(diǎn)都提供了豐富、生動(dòng)的案例素材,并以MATLAB、Python為工具詳細(xì)講解了實(shí)驗(yàn)的核心程序。通過(guò)對(duì)這些程序的閱讀、理解和仿真運(yùn)行,讀者可以更加深刻地理解圖像處理的內(nèi)容,并且更加熟練地掌握計(jì)算機(jī)視覺(jué)及深度學(xué)習(xí)在不同實(shí)際領(lǐng)域中的用法。本書以案例為基礎(chǔ),結(jié)構(gòu)布局緊湊,內(nèi)容深入淺出,實(shí)驗(yàn)簡(jiǎn)捷高效,適合計(jì)算機(jī)、信號(hào)通信和自動(dòng)化等相關(guān)專業(yè)的教師、本科生、研究生,以及廣大從事數(shù)字圖像處理的工程研發(fā)人員閱讀參考。
劉衍琦,機(jī)器學(xué)習(xí)算法專家及視覺(jué)AI課程講師,擅長(zhǎng)視覺(jué)智能分析、多源異構(gòu)數(shù)據(jù)采集和挖掘等工程化應(yīng)用,并長(zhǎng)期從事視覺(jué)大數(shù)據(jù)工程相關(guān)工作,涉及互聯(lián)網(wǎng)海量圖像、聲紋、視頻檢索,以及OCR圖文檢索、手繪草圖智能識(shí)別、特殊通道數(shù)據(jù)分析等應(yīng)用的算法架構(gòu)與研發(fā),對(duì)圖文識(shí)別、大規(guī)模以圖搜圖、數(shù)據(jù)感知和采集等進(jìn)行過(guò)深入研究,并結(jié)合行業(yè)背景推動(dòng)了一系列工程化應(yīng)用。曾主編和參與編寫多本書籍。詹福宇,博士,資深飛行控制算法專家,畢業(yè)于西北工業(yè)大學(xué)航空學(xué)院飛行器設(shè)計(jì)專業(yè)。擁有近10年仿真控制開發(fā)經(jīng)驗(yàn),熟悉Simulink基于模型設(shè)計(jì)的流程,曾主編和參與編寫多本書籍。王德建,檔案管理副研究館員,畢業(yè)于西安建筑科技大學(xué)系統(tǒng)工程專業(yè),從事檔案數(shù)字化、智能化分類、OCR圖文檢索、圖像智能識(shí)別相關(guān)工作。陳峰蔚,熟悉機(jī)器學(xué)習(xí)、深度學(xué)習(xí)及計(jì)算機(jī)視覺(jué)在智能交通、智能駕駛領(lǐng)域的應(yīng)用,長(zhǎng)期從事汽車品牌識(shí)別、車型細(xì)粒度分類、目標(biāo)檢測(cè)與分割方面的相關(guān)工作,精通MATLAB、Python編程及TensorFlow深度學(xué)習(xí)框架,參與了多項(xiàng)專利的設(shè)計(jì)與開發(fā)。蔣獻(xiàn)文,資深專業(yè)醫(yī)事放射師,畢業(yè)于中國(guó)醫(yī)藥大學(xué)醫(yī)學(xué)院臨床醫(yī)學(xué)研究所。擅長(zhǎng)醫(yī)學(xué)圖像處理技術(shù)、放射線射影技術(shù)及手術(shù)房計(jì)算機(jī)斷層與血管攝影技術(shù),在臨床放射技術(shù)學(xué)與圖像處理方面進(jìn)行過(guò)深入研究并發(fā)表了相關(guān)醫(yī)學(xué)論文。周華英,新能源汽車高級(jí)工程師,畢業(yè)于北京交通大學(xué)交通運(yùn)輸規(guī)劃與管理專業(yè)。長(zhǎng)期進(jìn)行純電動(dòng)及混合動(dòng)力汽車系統(tǒng)建模與控制、汽車動(dòng)力系統(tǒng)與控制、電動(dòng)汽車能量管理和控制優(yōu)化等研究,曾主編和參與編寫多本書籍。
第1章 基于直方圖優(yōu)化的圖像去霧技術(shù) 1
1.1 案例背景 1
1.2 理論基礎(chǔ) 1
1.2.1 空域圖像增強(qiáng) 1
1.2.2 直方圖均衡化 2
1.3 程序?qū)崿F(xiàn) 3
1.3.1 設(shè)計(jì)GUI界面 4
1.3.2 全局直方圖處理 4
1.3.3 局部直方圖處理 6
1.3.4 Retinex增強(qiáng)處理 8
1.4 延伸閱讀 12
第2章 基于形態(tài)學(xué)的權(quán)重自適應(yīng)圖像去噪 13
2.1 案例背景 13
2.2 理論基礎(chǔ) 14
2.2.1 圖像去噪的方法 14
2.2.2 數(shù)學(xué)形態(tài)學(xué)的原理 15
2.2.3 權(quán)重自適應(yīng)的多結(jié)構(gòu)形態(tài)學(xué)去噪 15
2.3 程序?qū)崿F(xiàn) 16
2.4 延伸閱讀 22
第3章 基于多尺度形態(tài)學(xué)提取眼前節(jié)組織 24
3.1 案例背景 24
3.2 理論基礎(chǔ) 25
3.3 程序?qū)崿F(xiàn) 28
3.3.1 多尺度結(jié)構(gòu)設(shè)計(jì) 28
3.3.2 多尺度邊緣提取 29
3.3.3 多尺度邊緣融合 31
3.4 延伸閱讀 33
第4章 基于Hough變化的答題卡識(shí)別 34
4.1 案例背景 34
4.2 理論基礎(chǔ) 34
4.2.1 圖像二值化 35
4.2.2 傾斜校正 35
4.2.3 圖像分割 38
4.3 程序?qū)崿F(xiàn) 40
4.3.1 圖像灰度化 40
4.3.2 灰度圖像二值化 41
4.3.3 圖像平滑濾波 41
4.3.4 圖像矯正 41
4.3.5 完整性核查 42
4.4 延伸閱讀 51
第5章 基于閾值分割的車牌定位識(shí)別 53
5.1 案例背景 53
5.2 理論基礎(chǔ) 53
5.2.1 車牌圖像處理 54
5.2.2 車牌定位原理 58
5.2.3 車牌字符處理 58
5.2.4 車牌字符識(shí)別 60
5.3 程序?qū)崿F(xiàn) 62
5.4 延伸閱讀 69
第6章 基于分水嶺分割進(jìn)行肺癌診斷 71
6.1 案例背景 71
6.2 理論基礎(chǔ) 71
6.2.1 模擬浸水的過(guò)程 72
6.2.2 模擬降水的過(guò)程 72
6.2.3 過(guò)度分割問(wèn)題 72
6.2.4 標(biāo)記分水嶺分割算法 72
6.3 程序?qū)崿F(xiàn) 73
6.4 延伸閱讀 77
第7章 基于主成分分析的人臉二維碼識(shí)別 79
7.1 案例背景 79
7.2 理論基礎(chǔ) 79
7.2.1 QR二維碼簡(jiǎn)介 80
7.2.2 QR二維碼的編碼和譯碼流程 82
7.2.3 主成分分析方法 84
7.3 程序?qū)崿F(xiàn) 85
7.3.1 人臉建庫(kù) 85
7.3.2 人臉識(shí)別 87
7.3.3 人臉二維碼 87
7.4 延伸閱讀 92
第8章 基于知識(shí)庫(kù)的手寫體數(shù)字識(shí)別 94
8.1 案例背景 94
8.2 理論基礎(chǔ) 94
8.2.1 算法流程 94
8.2.2 特征提取 95
8.2.3 模式識(shí)別 96
8.3 程序?qū)崿F(xiàn) 97
8.3.1 圖像處理 97
8.3.2 特征提取 98
8.3.3 模式識(shí)別 101
8.4 延伸閱讀 102
8.4.1 識(shí)別器選擇 102
8.4.2 特征庫(kù)改善 102
第9章 基于特征匹配的英文印刷字符識(shí)別 103
9.1 案例背景 103
9.2 理論基礎(chǔ) 104
9.2.1 圖像預(yù)處理 104
9.2.2 圖像識(shí)別技術(shù) 105
9.3 程序?qū)崿F(xiàn) 106
9.3.1 界面設(shè)計(jì) 106
9.3.2 回調(diào)識(shí)別 111
9.4 延伸閱讀 112
第10章 基于不變矩的數(shù)字驗(yàn)證碼識(shí)別 113
10.1 案例背景 113
10.2 理論基礎(chǔ) 114
10.3 程序?qū)崿F(xiàn) 114
10.3.1 設(shè)計(jì)GUI界面 114
10.3.2 載入驗(yàn)證碼圖像 115
10.3.3 驗(yàn)證碼圖像去噪 116
10.3.4 驗(yàn)證碼數(shù)字定位 118
10.3.5 驗(yàn)證碼歸一化 120
10.3.6 驗(yàn)證碼數(shù)字識(shí)別 121
10.3.7 手動(dòng)確認(rèn)并入庫(kù) 124
10.3.8 重新生成模板庫(kù) 125
10.4 延伸閱讀 128
第11章 基于小波技術(shù)進(jìn)行圖像融合 129
11.1 案例背景 129
11.2 理論基礎(chǔ) 130
11.3 程序?qū)崿F(xiàn) 132
11.3.1 設(shè)計(jì)GUI界面 132
11.3.2 圖像載入 133
11.3.3 小波融合 135
11.4 延伸閱讀 137
第12章 基于塊匹配的全景圖像拼接 138
12.1 案例背景 138
12.2 理論基礎(chǔ) 138
12.2.1 圖像匹配 139
12.2.2 圖像融合 141
12.3 程序?qū)崿F(xiàn) 142
12.3.1 設(shè)計(jì)GUI界面 142
12.3.2 載入圖片 143
12.3.3 圖像匹配 144
12.3.4 圖像拼接 148
12.4 延伸閱讀 153
第13章 基于霍夫曼圖像編碼的圖像壓縮和重建 155
13.1 案例背景 155
13.2 理論基礎(chǔ) 155
13.2.1 霍夫曼編碼的步驟 156
13.2.2 霍夫曼編碼的特點(diǎn) 157
13.3 程序?qū)崿F(xiàn) 158
13.3.1 設(shè)計(jì)GUI界面 158
13.3.2 壓縮和重建 159
13.3.3 效果對(duì)比 164
13.4 延伸閱讀 167
第14章 基于主成分分析的圖像壓縮和重建 168
14.1 案例背景 168
14.2 理論基礎(chǔ) 168
14.2.1 主成分降維分析原理 168
14.2.2 由得分矩陣重建樣本 169
14.2.3 主成分分析數(shù)據(jù)壓縮比 170
14.2.4 基于主成分分析的圖像壓縮 170
14.3 程序?qū)崿F(xiàn) 171
14.3.1 主成分分析的源代碼 171
14.3.2 圖像數(shù)組和樣本矩陣之間的轉(zhuǎn)換 172
14.3.3 基于主成分分析的圖像壓縮 173
14.4 延伸閱讀 176
第15章 基于小波的圖像壓縮技術(shù) 177
15.1 案例背景 177
15.2 理論基礎(chǔ) 178
15.3 程序?qū)崿F(xiàn) 180
15.4 延伸閱讀 188
第16章 基于融合特征的以圖搜圖技術(shù) 189
16.1 案例背景 189
16.2 理論基礎(chǔ) 189
16.3 程序?qū)崿F(xiàn) 191
16.3.1 圖像預(yù)處理 191
16.3.2 計(jì)算特征 191
16.3.3 圖像檢索 194
16.3.4 結(jié)果分析 194
16.4 延伸閱讀 196
第17章 基于Harris的角點(diǎn)特征檢測(cè) 198
17.1 案例背景 198
17.2 理論基礎(chǔ) 199
17.2.1 Harris的基本原理 199
17.2.2 Harris算法的流程 201
17.2.3 Harris角點(diǎn)的性質(zhì) 201
17.3 程序?qū)崿F(xiàn) 202
17.3.1 Harris算法的代碼 202
17.3.2 角點(diǎn)檢測(cè)實(shí)例 204
17.4 延伸閱讀 205
第18章 基于GUI搭建通用視頻處理工具 206
18.1 案例背景 206
18.2 理論基礎(chǔ) 206
18.3 程序?qū)崿F(xiàn) 208
18.3.1 設(shè)計(jì)GUI界面 208
18.3.2 實(shí)現(xiàn)GUI界面 209
18.4 延伸閱讀 220
第19章 基于語(yǔ)音識(shí)別的信號(hào)燈圖像
模擬控制技術(shù) 221
19.1 案例背景 221
19.2 理論基礎(chǔ) 221
19.3 程序?qū)崿F(xiàn) 223
19.4 延伸閱讀 232
第20章 基于幀間差法進(jìn)行視頻目標(biāo)檢測(cè) 234
20.1 案例背景 234
20.2 理論基礎(chǔ) 234
20.2.1 幀間差分法 235
20.2.2 背景差分法 236
20.2.3 光流法 236
20.3 程序?qū)崿F(xiàn) 237
20.4 延伸閱讀 24
第21章 路面裂縫檢測(cè)系統(tǒng)設(shè)計(jì) 247
21.1 案例背景 247
21.2 理論基礎(chǔ) 247
21.2.1 圖像灰度化 248
21.2.2 圖像濾波 250
21.2.3 圖像增強(qiáng) 252
21.2.4 圖像二值化 253
21.3 程序?qū)崿F(xiàn) 255
21.4 延伸閱讀 267
第22章 基于K-means聚類算法的圖像分割 268
22.1 案例背景 268
22.2 理論基礎(chǔ) 268
22.2.1 K-means聚類算法的原理 268
22.2.2 K-means聚類算法的要點(diǎn) 269
22.2.3 K-means聚類算法的缺點(diǎn) 270
22.2.4 基于K-means聚類算法進(jìn)行圖像分割 270
22.3 程序?qū)崿F(xiàn) 271
22.3.1 樣本間的距離 271
22.3.2 提取特征向量 272
22.3.3 圖像聚類分割 273
22.4 延伸閱讀 275
第23章 基于光流場(chǎng)的車流量計(jì)數(shù)應(yīng)用 276
23.1 案例背景 276
23.2 理論基礎(chǔ) 276
23.2.1 基于光流法檢測(cè)運(yùn)動(dòng)的原理 276
23.2.2 光流場(chǎng)的主要計(jì)算方法 277
23.2.3 梯度光流場(chǎng)約束方程 278
23.2.4 Horn-Schunck光流算法 280
23.3 程序?qū)崿F(xiàn) 281
23.3.1 計(jì)算視覺(jué)系統(tǒng)工具箱簡(jiǎn)介 281
23.3.2 基于光流法檢測(cè)汽車運(yùn)動(dòng) 282
23.4 延伸閱讀 287
第24章 基于Simulink進(jìn)行圖像和視頻處理 289
24.1 案例背景 289
24.2 模塊介紹 289
24.2.1 分析和增強(qiáng)模塊庫(kù)(Analysis和Enhancement) 290
24.2.2 轉(zhuǎn)化模塊庫(kù)(Conversions) 291
24.2.3 濾波模塊庫(kù)(Filtering) 292
24.2.4 幾何變換模塊庫(kù)(Geometric Transformations) 292
24.2.5 形態(tài)學(xué)操作模塊庫(kù)(Morphological Operations) 292
24.2.6 輸入模塊庫(kù)(Sources) 293
24.2.7 輸出模塊庫(kù)(Sinks) 293
24.2.8 統(tǒng)計(jì)模塊庫(kù)(Statistics) 294
24.2.9 文本和圖形模塊庫(kù)(Text 和 Graphic) 295
24.2.10 變換模塊庫(kù)(Transforms) 295
24.2.11 其他工具模塊庫(kù)(Utilities) 295
24.3 仿真案例 296
24.3.1 搭建組織模型 296
24.3.2 仿真執(zhí)行模型 298
24.3.3 自動(dòng)生成報(bào)告 299
24.4 延伸閱讀 302
第25章 基于小波變換的數(shù)字水印技術(shù) 304
25.1 案例背景 304
25.2 理論基礎(chǔ) 304
25.2.1 數(shù)字水印技術(shù)的原理 305
25.2.2 典型的數(shù)字水印算法 307
25.2.3 數(shù)字水印攻擊和評(píng)價(jià) 309
25.2.4 基于小波的水印技術(shù) 310
25.3 程序?qū)崿F(xiàn) 312
25.3.1 準(zhǔn)備載體和水印圖像 312
25.3.2 小波數(shù)字水印的嵌入 313
25.3.3 小波數(shù)字水印的提取 317
25.3.4 小波水印的攻擊試驗(yàn) 319
25.4 延伸閱讀 323
第26章 基于最小誤差法的胸片分割技術(shù) 325
26.1 案例背景 325
26.2 理論基礎(chǔ) 325
26.2.1 圖像增強(qiáng) 326
26.2.2 區(qū)域選擇 326
26.2.3 形態(tài)學(xué)濾波 327
26.2.4 基于最小誤差法進(jìn)行胸片分割 328
26.3 程序?qū)崿F(xiàn) 329
26.3.1 設(shè)計(jì)GUI界面 329
26.3.2 圖像預(yù)處理 330
26.3.3 基于最小誤差法進(jìn)行圖像分割 333
26.3.4 形態(tài)學(xué)后處理 335
26.4 延伸閱讀 338
第27章 基于區(qū)域生長(zhǎng)的肝臟影像分割系統(tǒng) 339
27.1 案例背景 339
27.2 理論基礎(chǔ) 340
27.2.1 閾值分割 340
27.2.2 區(qū)域生長(zhǎng) 340
27.2.3 基于閾值預(yù)分割的區(qū)域生長(zhǎng) 341
27.3 程序?qū)崿F(xiàn) 342
27.4 延伸閱讀 346
第28章 基于計(jì)算機(jī)視覺(jué)的自動(dòng)駕駛應(yīng)用 347
28.1 案例背景 347
28.2 理論基礎(chǔ) 348
28.2.1 環(huán)境感知 348
28.2.2 行為決策 348
28.2.3 路徑規(guī)劃 349
28.2.4 運(yùn)動(dòng)控制 349
28.3 程序?qū)崿F(xiàn) 349
28.3.1 傳感器數(shù)據(jù)載入 349
28.3.2 追蹤器創(chuàng)建 351
28.3.3 碰撞預(yù)警 353
28.4 延伸閱讀 358
第29章 基于深度學(xué)習(xí)的汽車目標(biāo)檢測(cè) 359
29.1 案例背景 359
29.2 理論基礎(chǔ) 360
29.2.1 基本架構(gòu) 360
29.2.2 卷積層 360
29.2.3 池化層 362
29.3 程序?qū)崿F(xiàn) 362
29.3.1 加載數(shù)據(jù) 362
29.3.2 構(gòu)建CNN 364
29.3.3 訓(xùn)練CNN 365
29.3.4 評(píng)估訓(xùn)練效果 367
29.4 延伸閱讀 368
第30章 基于深度學(xué)習(xí)的視覺(jué)場(chǎng)景
識(shí)別 370
30.1 案例背景 370
30.2 理論基礎(chǔ) 371
30.3 程序?qū)崿F(xiàn) 371
30.3.1 環(huán)境配置 372
30.3.2 數(shù)據(jù)集制作 373
30.3.3 網(wǎng)絡(luò)訓(xùn)練 375
30.3.4 網(wǎng)絡(luò)測(cè)試 381
30.4 延伸閱讀 383
第31章 深度學(xué)習(xí)綜合應(yīng)用 385
31.1 應(yīng)用背景 385
31.2 理論基礎(chǔ) 387
31.2.1 分類識(shí)別 387
31.2.2 目標(biāo)檢測(cè) 391
31.3 案例實(shí)現(xiàn)1:基于CNN的數(shù)字識(shí)別 395
31.3.1 自定義CNN 397
31.3.2 AlexNet 399
31.3.3 基于MATLAB進(jìn)行實(shí)驗(yàn)設(shè)計(jì) 405
31.3.4 基于TensorFlow進(jìn)行實(shí)驗(yàn)設(shè)計(jì) 413
31.3.5 實(shí)驗(yàn)小結(jié) 418
31.4 案例實(shí)現(xiàn)2:基于CNN的物體識(shí)別 418
31.4.1 CIFAR-10數(shù)據(jù)集 418
31.4.2 VggNet 421
31.4.3 ResNet 422
31.4.4 實(shí)驗(yàn)設(shè)計(jì) 424
31.4.5 實(shí)驗(yàn)小結(jié) 432
31.5 案例實(shí)現(xiàn)3:基于CNN的圖像矯正 432
31.5.1 傾斜數(shù)據(jù)集 432
31.5.2 自定義CNN回歸網(wǎng)絡(luò) 434
31.5.3 AlexNet回歸網(wǎng)絡(luò) 436
31.5.4 實(shí)驗(yàn)設(shè)計(jì) 437
31.5.5 實(shí)驗(yàn)小結(jié) 445
31.6 案例實(shí)現(xiàn)4:基于LSTM的時(shí)間序列分析 445
31.6.1 厄爾尼諾南方濤動(dòng)指數(shù)數(shù)據(jù) 446
31.6.2 樣條擬合分析 446
31.6.3 基于MATLAB進(jìn)行LSTM分析 448
31.6.4 基于Keras進(jìn)行LSTM分析 451
31.6.5 實(shí)驗(yàn)小結(jié) 455
31.7 案例實(shí)現(xiàn)5:基于深度學(xué)習(xí)的以圖搜圖技術(shù) 455
31.7.1 人臉的深度特征 455
31.7.2 AlexNet的特征 460
31.7.3 GoogleNet的特征 461
31.7.4 深度特征融合計(jì)算 462
31.7.5 實(shí)驗(yàn)設(shè)計(jì) 462
31.7.6 實(shí)驗(yàn)小結(jié) 46731.8 案例實(shí)現(xiàn)6:基于YOLO的交通目標(biāo)檢測(cè)應(yīng)用 467
31.8.1 車輛目標(biāo)的YOLO檢測(cè) 468
31.8.2 交通標(biāo)志的YOLO檢測(cè) 475
31.9 延伸閱讀 481