本書是以MATLAB R2020a為平臺編寫的,概括地介紹了計算機視覺在各領域中的應用。每章均先對相關概念進行介紹,然后通過實例鞏固概念,做到理論與實踐相結合,使讀者可以舉一反三,領略計算機視覺在各領域中的廣泛應用。 全書共9章,第1章簡單介紹了MATLAB R2020a軟件;第2章引出了計算機視覺的相關概念;第3~9章分別介紹了計算機視覺在圖像處理、形態(tài)學、字符識別、拼接、目標匹配、遙感、人臉識別中的應用。
丁偉雄(1971年生),男,北京航空航天大學畢業(yè),佛山科學技術學院創(chuàng)業(yè)學院副院長,高級實驗師。研究方向:計算機應用技術。編寫的圖書實例豐富,實用性強。
目錄
第1章 MATLAB R2020a入門與提升 1
1.1 MATLAB R2020a的功能特點 1
1.2 MATLAB R2020a的新功能 2
1.3 MATLAB R2020a運行界面 5
1.4 MATLAB R2020a命令行窗口 5
1.5 幫助系統(tǒng) 7
1.6 數(shù)據(jù)類型 9
1.6.1 常量與變量 9
1.6.2 矩陣與數(shù)組 10
1.7 結構化程序設計 12
1.7.1 選擇結構 12
1.7.2 循環(huán)結構 15
1.8 M文件 15
1.9 矩陣的操作 17
1.9.1 矩陣的擴展 17
1.9.2 索引擴展 20
1.9.3 改變形狀 20
第2章 計算機視覺概述 24
2.1 計算機視覺是什么 24
2.2 計算機視覺的發(fā)展 25
2.3 計算機視覺的相關概念 26
2.3.1 圖像和視頻 26
2.3.2 攝像機 27
2.3.3 CPU和GPU 28
2.4 計算機視覺的應用 28
2.4.1 物體的識別和檢測 29
2.4.2 語義分割 29
2.4.3 運動和跟蹤 29
2.4.4 視覺問答 30
2.4.5 三維重建 31
2.5 計算機視覺的相關學科 32
第3章 計算機視覺在圖像處理中的
應用 33
3.1 圖像處理基礎 33
3.1.1 圖像表達式 33
3.1.2 MATLAB支持的圖像
文件格式 35
3.1.3 圖像的類型 35
3.2 圖像抖動 38
3.3 圖像去霧處理 39
3.3.1 空域圖像增強 39
3.3.2 直方圖均衡化 40
3.3.3 Retinex圖像增強 42
3.3.4 平滑濾波 46
3.3.5 中值濾波器 48
3.3.6 自適應濾波 49
3.3.7 銳化濾波器 50
3.4 圖像的鏡像變換 68
3.5 圖像的空間變換 70
3.5.1 仿射變換 70
3.5.2 投影變換 71
3.6 圖像退化 72
3.7 圖像復原 75
3.7.1 維納濾波復原法 75
3.7.2 Lucy-Richardson復原法 77
3.8 圖像識別 79
3.8.1 圖像識別的大致流程 79
3.8.2 圖像模糊識別的實現(xiàn) 80
第4章 計算機視覺在形態(tài)學中的應用 84
4.1 形態(tài)學去噪處理概述 84
4.1.1 形態(tài)學的權重實現(xiàn)
圖像去噪 84
4.1.2 圖像去噪的方法 84
4.2 形態(tài)學的原理 85
4.2.1 膨脹 86
4.2.2 腐蝕 87
4.2.3 開運算和閉運算 88
4.3 權值自適應的多結構形態(tài)學 89
4.4 形態(tài)學去噪的實現(xiàn) 90
4.5 結構元素 95
4.6 邊緣檢測 96
4.6.1 邊緣檢測算子概述 96
4.6.2 邊緣檢測的實現(xiàn) 97
4.7 多尺度形態(tài)學 98
第5章 計算機視覺在字符識別中的
應用 105
5.1 卷積神經(jīng)網(wǎng)絡 105
5.1.1 卷積神經(jīng)網(wǎng)絡的概念 105
5.1.2 卷積神經(jīng)網(wǎng)絡實現(xiàn)
圖像分類 108
5.2 測手寫數(shù)字的旋轉角度 111
5.3 將分類網(wǎng)絡轉換為回歸網(wǎng)絡 117
5.4 卷積自編碼 121
5.4.1 卷積自編碼概述 121
5.4.2 卷積自編碼實現(xiàn)
去噪處理 121
5.5 殘差網(wǎng)絡 127
5.5.1 殘差網(wǎng)絡概述 127
5.5.2 殘差網(wǎng)絡實現(xiàn)圖像分類 129
5.6 LSTM網(wǎng)絡實現(xiàn)字符嵌入
生成文本 136
5.7 LSTM網(wǎng)絡逐單詞生成文本 140
5.8 RNN網(wǎng)絡 144
5.8.1 RNN概述 144
5.8.2 RNN實現(xiàn)文本分類 146
5.9 HOG特征與SVM分類器 152
5.9.1 HOG 152
5.9.2 SVM 155
5.9.3 HOG實現(xiàn)數(shù)據(jù)分類 158
5.10 OCR實現(xiàn)字符識別 163
5.10.1 OCR算法 163
5.10.2 OCR實現(xiàn)自然圖像中
文本的識別 165
第6章 計算機視覺在拼接中的應用 172
6.1 全景拼接 172
6.1.1 理論部分 172
6.1.2 圖像配準技術拼接
全景圖 174
6.2 ICP拼接 178
6.2.1 ICP算法的原理與步驟 178
6.2.2 利用ICP算法實現(xiàn)圖像
拼接 179
第7章 計算機視覺在目標匹配中的
應用 183
7.1 點特征匹配目標 183
7.1.1 點特征的概念 183
7.1.2 仿射變換 183
7.1.3 在一個雜亂的場景中實現(xiàn)
匹配目標檢測 184
7.1.4 使用點特征匹配捕獲
視頻 190
7.2 未標定立體圖像校正 197
7.2.1 外極線約束原理 197
7.2.2 平行光軸相機的極限
約束 198
7.2.3 立體匹配概述 198
7.2.4 立體匹配的具體步驟 199
7.2.5 立體匹配實現(xiàn)圖像校正 200
7.3 高斯混合模型 205
7.3.1 高斯混合模型概述 205
7.3.2 高斯混合模型實現(xiàn)
車輛檢測 210
第8章 計算機視覺在遙感中的應用 214
8.1 多光譜技術分割圖像 214
8.2 K均值聚類算法 224
8.2.1 K均值聚類算法的原理 225
8.2.2 K均值聚類算法的要點 225
8.2.3 K均值聚類算法的缺點 226
8.2.4 K均值聚類算法實現(xiàn)
圖像分割 226
8.3 紋理濾波和空間信息 228
8.3.1 紋理濾波概述 228
8.3.2 空間信息概述 230
8.3.3 紋理濾波和空間信息
實現(xiàn)圖像分割 231
8.4 測量圖像中的距離 234
第9章 計算機視覺在人臉識別中的
應用 240
9.1 KLT算法 240
9.1.1 光流的概念 240
9.1.2 KLT算法概述 241
9.1.3 KTL算法實現(xiàn)人臉追蹤 241
9.1.4 在場景中追蹤人臉 244
9.2 CAMShift算法 246
9.2.1 CAMShift算法概述 246
9.2.2 CAMShift算法實現(xiàn)人臉
檢測與追蹤 248
參考文獻 251