數(shù)字圖像處理與深度學(xué)習(xí)技術(shù)應(yīng)用
定 價(jià):69 元
叢書(shū)名:人工智能與智能系統(tǒng)人才培養(yǎng)系列
- 作者:楊淑瑩
- 出版時(shí)間:2024/8/1
- ISBN:9787121483011
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP391.413;TP181
- 頁(yè)碼:312
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
本書(shū)介紹了數(shù)字圖像處理技術(shù)和深度學(xué)習(xí)技術(shù),以及這些技術(shù)的應(yīng)用,全書(shū)由12章組成。前九章主要介紹數(shù)字圖像處理技術(shù),內(nèi)容包括:Python 環(huán)境搭建、位圖基礎(chǔ)、圖像的顯示、圖像的幾何變換、圖像灰度變換、圖像的平滑處理、圖像銳化處理、圖像分割及測(cè)量、圖像的形態(tài)學(xué)處理,后三章主要介紹深度學(xué)習(xí)技術(shù),將數(shù)字圖像處理技術(shù)和深度學(xué)習(xí)技術(shù)相結(jié)合應(yīng)用于項(xiàng)目開(kāi)發(fā),內(nèi)容包括基于卷積神經(jīng)網(wǎng)絡(luò)CNN 模型的漢字識(shí)別、基于Faster RCNN 模型的手勢(shì)識(shí)別、基于卷積神經(jīng)網(wǎng)絡(luò)CNN 模型的語(yǔ)音識(shí)別共三個(gè)項(xiàng)目的開(kāi)發(fā)技術(shù)。本書(shū)僅僅介紹基本的理論知識(shí),同時(shí)介紹將理論轉(zhuǎn)化為代碼的實(shí)現(xiàn)步驟和基于Python 開(kāi)發(fā)工具的編程代碼,并且可以將處理前與處理后的圖像進(jìn)行對(duì)照比較。實(shí)例程序的框架結(jié)構(gòu)簡(jiǎn)單,代碼簡(jiǎn)潔,使初學(xué)Python 者很快就掌握?qǐng)D像處理與圖像識(shí)別技術(shù)。
楊淑瑩,博士,天津理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院教授,碩士研究生導(dǎo)師,天津市“教學(xué)名師”,中國(guó)圖像圖形學(xué)學(xué)會(huì)第五屆理事會(huì)學(xué)術(shù)委員會(huì)委員。多年來(lái)在圖像、語(yǔ)音、時(shí)間序列等方面進(jìn)行模式識(shí)別相關(guān)工作的深入研究,涉及模式識(shí)別,數(shù)字圖像處理、信號(hào)與信息處理、智能計(jì)算等領(lǐng)域。承擔(dān)并完成國(guó)家級(jí)、市級(jí)自然科學(xué)基金項(xiàng)目多項(xiàng),獲得天津市科學(xué)技術(shù)進(jìn)步獎(jiǎng)2項(xiàng),發(fā)表論文50多篇;撰寫(xiě)專著6部,F(xiàn)任國(guó)家級(jí)精品課、國(guó)家級(jí)精品資源共享課負(fù)責(zé)人;主編教材獲得國(guó)家級(jí)“十一五”規(guī)劃教材和國(guó)家級(jí)“十二五”規(guī)劃教材;獲得市級(jí)教學(xué)成果獎(jiǎng)3項(xiàng)。
第1章 圖像處理編程基礎(chǔ) (1)
1.1 Python開(kāi)發(fā)基礎(chǔ) (1)
1.1.1 Python的安裝 (1)
1.1.2 PyCharm的安裝 (6)
1.1.3 OpenCV及常用庫(kù)的配置 (9)
1.2 數(shù)字圖像處理與深度學(xué)習(xí)技術(shù)簡(jiǎn)介 (13)
1.3 系統(tǒng)界面開(kāi)發(fā)基礎(chǔ) (15)
1.4 圖像顯示 (17)
1.4.1 待處理圖像的顯示 (17)
1.4.2 處理后圖像的顯示 (20)
習(xí)題 (20)
第2章 彩色圖像特效處理 (21)
2.1 圖像的顏色表示 (21)
2.1.1 像素的顏色 (21)
2.1.2 圖像的存儲(chǔ)結(jié)構(gòu) (21)
2.1.3 圖像的精度 (25)
2.2 彩色圖像的灰度化處理 (26)
2.3 彩色圖像的著色處理 (28)
2.4 彩色圖像的亮度調(diào)整 (29)
2.5 彩色圖像的對(duì)比度調(diào)整 (31)
2.6 彩色圖像的曝光處理 (33)
2.7 彩色圖像的馬賽克處理 (34)
2.8 彩色圖像的梯度銳化處理 (35)
2.9 彩色圖像的浮雕處理 (37)
2.10 彩色圖像的霓虹處理 (38)
小結(jié) (39)
習(xí)題 (40)
第3章 圖像的合成處理 (41)
3.1 圖像的代數(shù)運(yùn)算 (41)
3.1.1 圖像加運(yùn)算 (41)
3.1.2 圖像減運(yùn)算 (43)
3.2 圖像邏輯運(yùn)算 (45)
3.2.1 位與運(yùn)算 (46)
3.2.2 位或運(yùn)算 (47)
3.2.3 位非運(yùn)算 (48)
3.2.4 位異或運(yùn)算 (49)
小結(jié) (50)
習(xí)題 (51)
第4章 圖像的幾何變換 (52)
4.1 概述 (52)
4.2 圖像平移 (54)
4.3 圖像鏡像 (56)
4.4 圖像縮放 (58)
4.5 圖像轉(zhuǎn)置 (60)
4.6 投影變換 (61)
4.7 圖像旋轉(zhuǎn) (63)
小結(jié) (66)
習(xí)題 (66)
第5章 圖像的灰度變換 (67)
5.1 概述 (67)
5.2 二值化和閾值處理 (68)
5.3 灰度線性變換與分段線性變換 (69)
5.3.1 灰度線性變換 (69)
5.3.2 分段線性變換 (71)
5.4 灰度非線性變換 (73)
5.4.1 灰度對(duì)數(shù)變換 (73)
5.4.2 灰度指數(shù)變換 (75)
5.4.3 灰度冪次變換 (76)
5.5 灰度直方圖 (78)
5.5.1 灰度直方圖概念 (78)
5.5.2 直方圖正規(guī)化 (80)
5.5.3 直方圖均衡化 (82)
5.5.4 自適應(yīng)直方圖均衡化 (85)
小結(jié) (88)
習(xí)題 (88)
第6章 圖像平滑處理 (89)
6.1 概述 (89)
6.2 噪聲消除法 (90)
6.2.1 二值圖像的黑白點(diǎn)噪聲濾波 (90)
6.2.2 消除孤立黑像素點(diǎn) (91)
6.3 鄰域平均法 (93)
6.3.1 3×3均值濾波 (94)
6.3.2 N×N均值濾波 (95)
6.3.3 超限鄰域平均法 (96)
6.3.4 方框?yàn)V波 (98)
6.4 高斯濾波 (100)
6.5 中值濾波 (101)
6.5.1 N×N中值濾波 (102)
6.5.2 十字形中值濾波 (103)
6.5.3 N×N最大值濾波 (105)
6.6 雙邊濾波 (106)
6.7 2D卷積核的實(shí)現(xiàn) (109)
6.8 產(chǎn)生噪聲處理 (111)
6.8.1 隨機(jī)噪聲 (111)
6.8.2 椒鹽噪聲 (112)
小結(jié) (113)
習(xí)題 (114)
第7章 圖像邊緣銳化處理 (115)
7.1 概述 (115)
7.2 圖像微分邊緣檢測(cè) (116)
7.2.1 縱向邊緣檢測(cè) (116)
7.2.2 橫向邊緣檢測(cè) (117)
7.2.3 雙向邊緣檢測(cè) (118)
7.3 常用的邊緣檢測(cè)算子及方法 (120)
7.3.1 Roberts邊緣檢測(cè)算子 (120)
7.3.2 Sobel邊緣檢測(cè)算子 (122)
7.3.3 Prewitt邊緣檢測(cè)算子 (124)
7.3.4 Scharr邊緣檢測(cè)算子 (125)
7.3.5 Krisch自適應(yīng)邊緣檢測(cè) (126)
7.3.6 拉普拉斯算子 (129)
7.3.7 高斯-拉普拉斯算子 (131)
7.3.8 Canny邊緣檢測(cè) (134)
7.4 梯度銳化 (136)
7.4.1 提升邊緣 (137)
7.4.2 根據(jù)梯度二值化圖像 (139)
小結(jié) (141)
習(xí)題 (141)
第8章 圖像形態(tài)學(xué)處理 (143)
8.1 概述 (143)
8.2 圖像腐蝕 (143)
8.2.1 水平腐蝕 (144)
8.2.2 垂直腐蝕 (146)
8.2.3 全方向腐蝕 (147)
8.3 圖像膨脹 (148)
8.3.1 水平膨脹 (149)
8.3.2 垂直膨脹 (150)
8.3.3 全方向膨脹 (151)
8.4 圖像開(kāi)運(yùn)算與閉運(yùn)算 (152)
8.4.1 圖像開(kāi)運(yùn)算 (152)
8.4.2 圖像閉運(yùn)算 (154)
8.5 形態(tài)學(xué)梯度運(yùn)算 (156)
8.6 黑帽與禮帽運(yùn)算 (157)
8.7 圖像細(xì)化 (159)
小結(jié) (163)
習(xí)題 (163)
第9章 圖像分割與測(cè)量 (165)
9.1 概述 (165)
9.2 閾值法分割 (166)
9.2.1 直方圖門(mén)限選擇法 (166)
9.2.2 半閾值選擇法 (169)
9.2.3 迭代閾值法 (171)
9.2.4 Otsu閾值法 (173)
9.2.5 自適應(yīng)閾值法 (175)
9.2.6 分水嶺算法 (177)
9.3 投影法分割 (184)
9.3.1 水平投影分割 (184)
9.3.2 垂直投影分割 (185)
9.4 輪廓檢測(cè) (187)
9.4.1 輪廓提取 (187)
9.4.2 邊界跟蹤法 (188)
9.4.3 區(qū)域增長(zhǎng)法 (191)
9.4.4 輪廓檢測(cè)與擬合 (195)
9.5 目標(biāo)物體測(cè)量 (198)
9.5.1 區(qū)域標(biāo)記 (198)
9.5.2 面積測(cè)量 (200)
9.5.3 周長(zhǎng)測(cè)量 (201)
9.6 最小外包形狀檢測(cè) (203)
9.6.1 最小外包矩形 (203)
9.6.2 最小外包圓形 (204)
9.6.3 最小外包三角形 (205)
9.6.4 最小外包橢圓 (206)
9.7 霍夫檢測(cè) (207)
9.7.1 霍夫直線檢測(cè) (207)
9.7.2 霍夫圓檢測(cè) (211)
小結(jié) (214)
習(xí)題 (214)
第10章 圖像頻域變換處理 (215)
10.1 圖像頻域變換 (215)
10.1.1 圖像傅里葉變換 (215)
10.1.2 圖像快速傅里葉變換 (218)
10.1.3 圖像離散余弦變換 (222)
10.1.4 圖像頻域變換原理 (225)
10.2 頻域低通濾波 (226)
10.2.1 理想低通濾波 (226)
10.2.2 梯形低通濾波 (229)
10.2.3 巴特沃思低通濾波 (231)
10.2.4 指數(shù)低通濾波 (233)
10.3 頻域高通濾波 (235)
10.3.1 理想高通濾波 (235)
10.3.2 梯形高通濾波 (237)
10.3.3 巴特沃思高通濾波 (239)
10.3.4 指數(shù)高通濾波 (241)
小結(jié) (243)
習(xí)題 (243)
第11章 基于深度學(xué)習(xí)CNN模型的漢字識(shí)別 (244)
11.1 深度學(xué)習(xí)技術(shù)概述 (244)
11.2 CNN基本概念 (245)
11.3 漢字識(shí)別系統(tǒng)設(shè)計(jì) (249)
11.4 漢字圖像預(yù)處理 (251)
11.5 投影與分割 (253)
11.6 構(gòu)建漢字識(shí)別模型 (256)
11.6.1 構(gòu)建CNN模型 (256)
11.6.2 識(shí)別模型訓(xùn)練 (258)
11.7 漢字識(shí)別模型檢驗(yàn) (260)
第12章 基于深度學(xué)習(xí)CNN模型的語(yǔ)音識(shí)別 (265)
12.1 語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì) (265)
12.2 語(yǔ)音信號(hào)預(yù)處理及特征提取 (266)
12.2.1 語(yǔ)音信號(hào)預(yù)處理 (266)
12.2.2 MFCC特征提取 (268)
12.3 構(gòu)建語(yǔ)音識(shí)別模型 (270)
12.3.1 構(gòu)建CNN模型 (270)
12.3.2 識(shí)別模型訓(xùn)練 (273)
12.4 語(yǔ)音識(shí)別模型檢驗(yàn) (274)
第13章 基于深度學(xué)習(xí)Faster R-CNN模型的手勢(shì)識(shí)別 (279)
13.1 R-CNN目標(biāo)檢測(cè)與識(shí)別模型 (279)
13.2 邊框回歸(Bounding Box Regression)原理 (282)
13.3 Faster R-CNN目標(biāo)檢測(cè)與識(shí)別模型 (284)
13.3.1 Faster R-CNN模型框架 (284)
13.3.2 基于區(qū)域提議網(wǎng)絡(luò)(RPN)的目標(biāo)檢測(cè) (285)
13.3.3 基于RoI池化和分類技術(shù)的目標(biāo)識(shí)別 (288)
13.4 手勢(shì)識(shí)別系統(tǒng)設(shè)計(jì) (289)
13.5 構(gòu)建手勢(shì)識(shí)別模型 (291)
13.5.1 構(gòu)建Faster R-CNN模型 (291)
13.5.2 Faster R-CNN識(shí)別模型訓(xùn)練 (295)
13.6 手勢(shì)識(shí)別模型檢驗(yàn) (299)