計算機(jī)視覺40例從入門到深度學(xué)習(xí)(OpenCV-Python)
定 價:129 元
當(dāng)前圖書已被 80 所學(xué)校薦購過!
查看明細(xì)
- 作者:李立宗
- 出版時間:2022/6/1
- ISBN:9787121436857
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP302.7
- 頁碼:540
- 紙張:
- 版次:01
- 開本:16開
本書以O(shè)penCV-Python(the Python API for OpenCV)為工具,以案例為載體,系統(tǒng)介紹了計算機(jī)視覺從入門到深度學(xué)習(xí)的相關(guān)知識點。本書從基礎(chǔ)知識、基礎(chǔ)案例、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人臉識別5個方面對計算機(jī)視覺的相關(guān)知識點進(jìn)行了全面、系統(tǒng)、深入的介紹。書中共介紹了40余個經(jīng)典的計算機(jī)視覺案例,其中既有圖像加密、指紋識別、車牌識別、缺陷檢測等基于傳統(tǒng)技術(shù)的計算機(jī)視覺經(jīng)典案例,也有圖像分類、目標(biāo)檢測、語義分割、實例分割、風(fēng)格遷移、姿勢識別等基于深度學(xué)習(xí)的計算機(jī)視覺案例,還有表情識別、駕駛員疲勞檢測、易容術(shù)、性別和年齡識別等基于人臉識別的計算機(jī)視覺案例。在介紹具體的算法原理時,本書盡量使用通俗易懂的語言和貼近生活的示例來說明問題,避免使用復(fù)雜抽象的公式來介紹。本書適合計算機(jī)視覺領(lǐng)域的初學(xué)者閱讀,也適合學(xué)生、教師、專業(yè)技術(shù)人員、圖像處理愛好者閱讀。
李立宗,天津職業(yè)技術(shù)師范大學(xué)信息技術(shù)工程學(xué)院副教授,對數(shù)字圖像處理研究頗深。
目錄
第1部分 基礎(chǔ)知識導(dǎo)讀篇
第1章 數(shù)字圖像基礎(chǔ) 2
1.1 圖像表示基礎(chǔ) 2
1.1.1 藝術(shù)與生活 2
1.1.2 數(shù)字圖像 3
1.1.3 二值圖像的處理 5
1.1.4 像素值的范圍 5
1.1.5 圖像索引 7
1.2 彩色圖像的表示 8
1.3 應(yīng)用基礎(chǔ) 9
1.3.1 量化 10
1.3.2 特征 10
1.3.3 距離 11
1.3.4 圖像識別 13
1.3.5 信息隱藏 15
1.4 智能圖像處理基礎(chǔ) 16
1.5 抽象 18
第2章 Python基礎(chǔ) 21
2.1 如何開始 21
2.2 基礎(chǔ)語法 22
2.2.1 變量的概念 22
2.2.2 變量的使用 22
2.3 數(shù)據(jù)類型 24
2.3.1 基礎(chǔ)類型 25
2.3.2 列表 25
2.3.3 元組 28
2.3.4 字典 29
2.4 選擇結(jié)構(gòu) 31
2.5 循環(huán)結(jié)構(gòu) 35
2.6 函數(shù) 39
2.6.1 什么是函數(shù) 39
2.6.2 內(nèi)置函數(shù) 41
2.6.3 自定義函數(shù) 42
2.7 模塊 44
2.7.1 標(biāo)準(zhǔn)模塊 44
2.7.2 第三方模塊 45
2.7.3 自定義模塊 46
第3章 OpenCV基礎(chǔ) 47
3.1 基礎(chǔ) 47
3.1.1 安裝OpenCV 47
3.1.2 讀取圖像 49
3.1.3 顯示圖像 50
3.1.4 保存圖像 51
3.2 圖像處理 52
3.2.1 像素處理 52
3.2.2 通道處理 57
3.2.3 調(diào)整圖像大小 60
3.3 感興趣區(qū)域 62
3.4 掩模 63
3.4.1 掩;A(chǔ)及構(gòu)造 64
3.4.2 乘法運(yùn)算 65
3.4.3 邏輯運(yùn)算 66
3.4.4 掩模作為函數(shù)參數(shù) 68
3.5 色彩處理 69
3.5.1 色彩空間基礎(chǔ) 69
3.5.2 色彩空間轉(zhuǎn)換 71
3.5.3 獲取皮膚范圍 72
3.6 濾波處理 73
3.6.1 均值濾波 75
3.6.2 高斯濾波 78
3.6.3 中值濾波 82
3.7 形態(tài)學(xué) 84
3.7.1 腐蝕 85
3.7.2 膨脹 88
3.7.3 通用形態(tài)學(xué)函數(shù) 91
第2部分 基礎(chǔ)案例篇
第4章 圖像加密與解密 94
4.1 加密與解密原理 94
4.2 圖像整體加密與解密 96
4.3 臉部打碼及解碼 98
4.3.1 掩模方式實現(xiàn) 98
4.3.2 ROI方式實現(xiàn) 101
第5章 數(shù)字水印 105
5.1 位平面 106
5.2 數(shù)字水印原理 114
5.3 實現(xiàn)方法 115
5.4 具體實現(xiàn) 119
5.5 可視化水印 121
5.5.1 ROI 121
5.5.2 加法運(yùn)算 123
5.6 擴(kuò)展學(xué)習(xí) 125
5.6.1 算術(shù)運(yùn)算實現(xiàn)數(shù)字水印 125
5.6.2 藝術(shù)字 128
第6章 物體計數(shù) 131
6.1 理論基礎(chǔ) 131
6.1.1 如何計算圖像的中心點 131
6.1.2 獲取圖像的中心點 133
6.1.3 按照面積篩選前景對象 135
6.2 核心程序 138
6.2.1 核函數(shù) 138
6.2.2 zip函數(shù) 140
6.2.3 閾值處理函數(shù)threshold 140
6.3 程序設(shè)計 141
6.4 實現(xiàn)程序 142
第7章 缺陷檢測 144
7.1 理論基礎(chǔ) 144
7.1.1 開運(yùn)算 144
7.1.2 距離變換函數(shù)distanceTransform 146
7.1.3 最小包圍圓形 148
7.1.4 篩選標(biāo)準(zhǔn) 149
7.2 程序設(shè)計 150
7.3 實現(xiàn)程序 151
第8章 手勢識別 153
8.1 理論基礎(chǔ) 154
8.1.1 獲取凸包 154
8.1.2 凸缺陷 156
8.1.3 凸缺陷占凸包面積比 159
8.2 識別過程 161
8.2.1 識別流程 162
8.2.2 實現(xiàn)程序 165
8.3 擴(kuò)展學(xué)習(xí):石頭、剪刀、布的識別 167
8.3.1 形狀匹配 167
8.3.2 實現(xiàn)程序 170
第9章 答題卡識別 173
9.1 單道題目的識別 173
9.1.1 基本流程及原理 173
9.1.2 實現(xiàn)程序 178
9.2 整張答題卡識別原理 180
9.2.1 圖像預(yù)處理 180
9.2.2 答題卡處理 181
9.2.3 篩選出所有選項 189
9.2.4 將選項按照題目分組 190
9.2.5 處理每一道題目的選項 195
9.2.6 顯示結(jié)果 195
9.3 整張答題卡識別程序 195
第10章 隱身術(shù) 201
10.1 圖像的隱身術(shù) 201
10.1.1 基本原理與實現(xiàn) 201
10.1.2 實現(xiàn)程序 213
10.1.3 問題及優(yōu)化方向 214
10.2 視頻隱身術(shù) 215
第11章 以圖搜圖 217
11.1 原理與實現(xiàn) 218
11.1.1 算法原理 218
11.1.2 感知哈希值計算方法 220
11.1.3 感知哈希值計算函數(shù) 224
11.1.4 計算距離 224
11.1.5 計算圖像庫內(nèi)所有圖像的哈希值 225
11.1.6 結(jié)果顯示 226
11.2 實現(xiàn)程序 228
11.3 擴(kuò)展學(xué)習(xí) 230
第12章 手寫數(shù)字識別 231
12.1 基本原理 232
12.2 實現(xiàn)細(xì)節(jié) 233
12.3 實現(xiàn)程序 235
12.4 擴(kuò)展閱讀 236
第13章 車牌識別 238
13.1 基本原理 238
13.1.1 提取車牌 238
13.1.2 分割車牌 240
13.1.3 識別車牌 242
13.2 實現(xiàn)程序 246
13.3 下一步學(xué)習(xí) 249
第14章 指紋識別 250
14.1 指紋識別基本原理 251
14.2 指紋識別算法概述 251
14.2.1 描述關(guān)鍵點特征 251
14.2.2 特征提取 252
14.2.3 MCC匹配方法 254
14.2.4 參考資料 258
14.3 尺度不變特征變換 258
14.3.1 尺度空間變換 260
14.3.2 關(guān)鍵點定位 266
14.3.3 通過方向描述關(guān)鍵點 267
14.3.4 顯示關(guān)鍵點 271
14.4 基于SIFT的指紋識別 273
14.4.1 距離計算 273
14.4.2 特征匹配 274
14.4.3 算法及實現(xiàn)程序 277
第3部分 機(jī)器學(xué)習(xí)篇
第15章 機(jī)器學(xué)習(xí)導(dǎo)讀 282
15.1 機(jī)器學(xué)習(xí)是什么 283
15.2 機(jī)器學(xué)習(xí)基礎(chǔ)概念 284
15.2.1 機(jī)器學(xué)習(xí)的類型 284
15.2.2 泛化能力 289
15.2.3 數(shù)據(jù)集的劃分 290
15.2.4 模型的擬合 291
15.2.5 性能度量 292
15.2.6 偏差與方差 293
15.3 OpenCV中的機(jī)器學(xué)習(xí)模塊 294
15.3.1 人工神經(jīng)網(wǎng)絡(luò) 295
15.3.2 決策樹 296
15.3.3 EM模塊 300
15.3.4 K近鄰模塊 300
15.3.5 logistic回歸 303
15.3.6 貝葉斯分類器 305
15.3.7 支持向量機(jī) 308
15.3.8 隨機(jī)梯度下降 SVM 分類器 310
15.4 OpenCV機(jī)器學(xué)習(xí)模塊的使用 312
15.4.1 使用KNN模塊分類 312
15.4.2 使用SVM模塊分類 314
第16章 KNN實現(xiàn)字符識別 317
16.1 手寫數(shù)字識別 317
16.2 英文字母識別 319
第17章 求解數(shù)獨圖像 322
17.1 基本過程 322
17.2 定位數(shù)獨圖像內(nèi)的單元格 323
17.3 構(gòu)造KNN模型 327
17.4 識別數(shù)獨圖像內(nèi)的數(shù)字 330
17.5 求解數(shù)獨 332
17.6 繪制數(shù)獨求解結(jié)果 334
17.7 實現(xiàn)程序 335
17.8 擴(kuò)展學(xué)習(xí) 338
第18章 SVM數(shù)字識別 339
18.1 基本流程 339
18.2 傾斜校正 340
18.3 HOG特征提取 343
18.4 數(shù)據(jù)處理 348
18.5 構(gòu)造及使用SVM分類器 351
18.6 實現(xiàn)程序 352
18.7 參考學(xué)習(xí) 354
第19章 行人檢測 355
19.1 方向梯度直方圖特征 355
19.2 基礎(chǔ)實現(xiàn) 358
19.2.1 基本流程 359
19.2.2 實現(xiàn)程序 359
19.3 函數(shù)detectMultiScale參數(shù)及優(yōu)化 360
19.3.1 參數(shù)winStride 360
19.3.2 參數(shù)padding 362
19.3.3 參數(shù)scale 364
19.3.4 參數(shù)useMeanshiftGrouping 366
19.4 完整程序 369
19.5 參考學(xué)習(xí) 370
第20章 K均值聚類實現(xiàn)藝術(shù)畫 371
20.1 理論基礎(chǔ) 371
20.1.1 案例 371
20.1.2 K均值聚類的基本步驟 373
20.2 K均值聚類模塊 374
20.3 藝術(shù)畫 377
第4部分 深度學(xué)習(xí)篇
第21章 深度學(xué)習(xí)導(dǎo)讀 384
21.1 從感知機(jī)到人工神經(jīng)網(wǎng)絡(luò) 384
21.1.1 感知機(jī) 384
21.1.2 激活函數(shù) 385
21.1.3 人工神經(jīng)網(wǎng)絡(luò) 387
21.1.4 完成分類 388
21.2 人工神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí) 389
21.3 深度學(xué)習(xí)是什么 390
21.3.1 深度的含義 390
21.3.2 表示學(xué)習(xí) 391
21.3.3 端到端 392
21.3.4 深度學(xué)習(xí)可視化 393
21.4 激活函數(shù)的分類 394
21.4.1 sigmoid函數(shù) 394
21.4.2 tanh函數(shù) 395
21.4.3 ReLU函數(shù) 395
21.4.4 Leaky ReLU函數(shù) 396
21.4.5 ELU函數(shù) 396
21.5 損失函數(shù) 397
21.5.1 為什么要用損失值 397
21.5.2 損失值如何起作用 398
21.5.3 均方誤差 399
21.5.4 交叉熵誤差 400
21.6 學(xué)習(xí)的技能與方法 401
21.6.1 全連接 401
21.6.2 隨機(jī)失活 402
21.6.3 One-hot編碼 403
21.6.4 學(xué)習(xí)率 403
21.6.5 正則化 404
21.6.6 mini-batch方法 405
21.6.7 超參數(shù) 406
21.7 深度學(xué)習(xí)游樂場 406
第22章 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ) 407
22.1 卷積基礎(chǔ) 407
22.2 卷積原理 409
22.2.1 數(shù)值卷積 409
22.2.2 圖像卷積 410
22.2.3 如何獲取卷積核 411
22.3 填充和步長 412
22.4 池化操作 413
22.5 感受野 414
22.6 預(yù)處理與初始化 416
22.6.1 擴(kuò)充數(shù)據(jù)集 416
22.6.2 標(biāo)準(zhǔn)化與歸一化 417
22.6.3 網(wǎng)絡(luò)參數(shù)初始化 418
22.7 CNN 418
22.7.1 LeNet 418
22.7.2 AlexNet 419
22.7.3 VGG網(wǎng)絡(luò) 420
22.7.4 NiN 420
22.7.5 GooLeNet 421
22.7.6 殘差網(wǎng)絡(luò) 423
第23章 DNN模塊 426
23.1 工作流程 427
23.2 模型導(dǎo)入 428
23.3 圖像預(yù)處理 429
23.4 推理相關(guān)函數(shù) 438
第24章 深度學(xué)習(xí)應(yīng)用實踐 440
24.1 圖像分類 441
24.1.1 圖像分類模型 441
24.1.2 實現(xiàn)程序 442
24.2 目標(biāo)檢測 443
24.2.1 YOLO 444
24.2.2 SSD 447
24.3 圖像分割 450
24.3.1 語義分割 450
24.3.2 實例分割 453
24.4 風(fēng)格遷移 458
24.5 姿勢識別 460
24.6 說明 463
第5部分 人臉識別篇
第25章 人臉檢測 466
25.1 基本原理 466
25.2 級聯(lián)分類器的使用 469
25.3 函數(shù)介紹 470
25.4 人臉檢測實現(xiàn) 471
25.5 表情檢測 473
第26章 人臉識別 475
26.1 人臉識別基礎(chǔ) 475
26.1.1 人臉識別基本流程 475
26.1.2 OpenCV人臉識別基礎(chǔ) 476
26.2 LBPH人臉識別 478
26.2.1 基本原理 478
26.2.2 函數(shù)介紹 482
26.2.3 案例介紹 482
26.3 EigenFaces人臉識別 484
26.3.1 基本原理 484
26.3.2 函數(shù)介紹 485
26.3.3 案例介紹 485
26.4 FisherFaces人臉識別 487
26.4.1 基本原理 487
26.4.2 函數(shù)介紹 489
26.4.3 案例介紹 489
26.5 人臉數(shù)據(jù)庫 491
第27章 dlib庫 493
27.1 定位人臉 493
27.2 繪制關(guān)鍵點 494
27.3 勾勒五官輪廓 497
27.4 人臉對齊 500
27.5 調(diào)用CNN實現(xiàn)人臉檢測 502
第28章 人臉識別應(yīng)用案例 504
28.1 表情識別 504
28.2 駕駛員疲勞檢測 507
28.3 易容術(shù) 511
28.3.1 仿射 511
28.3.2 算法流程 512
28.3.3 實現(xiàn)程序 514
28.4 年齡和性別識別 517