本書結(jié)合理論和實(shí)踐,主要介紹如何使用圖像處理和深度學(xué)習(xí)技術(shù)來(lái)使計(jì)算機(jī)感知和理解圖形。全書分為概述、OpenCV 圖像基本操作、深度學(xué)習(xí)與計(jì)算機(jī)視覺、計(jì)算機(jī)視覺基礎(chǔ)技術(shù)、計(jì)算機(jī)視覺綜合應(yīng)用五大部分(共 11 章)。概述部分(第 1 章)主要介紹計(jì)算機(jī)視覺的概念和發(fā)展史;OpenCV 圖像基本操作(第 2 章)主要介紹基于OpenCV 的圖像處理操作;深度學(xué)習(xí)與計(jì)算機(jī)視覺(第3 章)主要介紹深度學(xué)習(xí)的概念及其應(yīng)用、深度學(xué)習(xí)的實(shí)現(xiàn)框架TensorFlow 的用法以及卷積神經(jīng)網(wǎng)絡(luò)的概念、結(jié)構(gòu)和算法;計(jì)算機(jī)視覺基礎(chǔ)技術(shù)(第4~9 章)主要介紹圖像分類、目標(biāo)檢測(cè)、圖像分割、場(chǎng)景文字識(shí)別、人體關(guān)鍵點(diǎn)檢測(cè)、圖像生成等關(guān)鍵技術(shù)的原理、方法及應(yīng)用;計(jì)算機(jī)視覺綜合應(yīng)用(第 10、11 章)主要介紹視覺交互機(jī)器人和無(wú)人駕駛的自動(dòng)巡線兩個(gè)大型綜合實(shí)驗(yàn)。本書圍繞基本理論,設(shè)置了較多的實(shí)驗(yàn)操作和實(shí)踐案例,通過(guò)自己動(dòng)手練習(xí),幫助讀者鞏固所學(xué)內(nèi)容。
許桂秋,數(shù)據(jù)中國(guó)“百校工程”項(xiàng)目運(yùn)營(yíng)總監(jiān)。2000年9月―2004年6月,廈門大學(xué),計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)學(xué)習(xí),獲工學(xué)學(xué)士;2007年8月―2011年4月,中國(guó)石油天然氣股份有限公司,項(xiàng)目經(jīng)理,工程師;2011年6月―2016年7月,曙光信息產(chǎn)業(yè)股份有限公司,項(xiàng)目經(jīng)理,工程師;主要從事大數(shù)據(jù),人工智能等新一代信息技術(shù)領(lǐng)域的產(chǎn)教融合研究。主要著作出版情況:《大數(shù)據(jù)導(dǎo)論》、《Python編程基礎(chǔ)與應(yīng)用》、《NoSQL數(shù)據(jù)庫(kù)原理與應(yīng)用》、《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》等9本系列教材,浙江科技出版社,2019年。
目 錄
第1章 概述 1
1.1 什么是計(jì)算機(jī)視覺 1
1.2 計(jì)算機(jī)視覺的發(fā)展史 3
第2章 OpenCV圖像基本操作 6
2.1 如何使用OpenCV 6
2.2 圖像的基礎(chǔ)操作 8
2.2.1 圖像的基本表示方法 8
2.2.2 圖像的讀取、顯示和存儲(chǔ) 11
2.2.3 視頻序列的讀取和存儲(chǔ) 16
2.2.4 圖像像素的處理與訪問(wèn) 20
2.2.5 獲取圖像屬性 23
2.2.6 圖像RoI 23
2.2.7 圖像通道的拆分與合并 25
2.3 圖像的幾何變換 28
2.3.1 圖像縮放 28
2.3.2 圖像翻轉(zhuǎn) 30
2.3.3 圖像仿射變換 31
2.3.4 圖像透視 34
2.4 圖像的算術(shù)運(yùn)算 35
2.4.1 圖像的加法運(yùn)算 35
2.4.2 圖像的加權(quán)和運(yùn)算 37
2.4.3 圖像的按位邏輯運(yùn)算 38
第3章 深度學(xué)習(xí)與計(jì)算機(jī)視覺 42
3.1 深度學(xué)習(xí)概述 42
3.1.1 深度學(xué)習(xí)的概念 42
3.1.2 深度學(xué)習(xí)的發(fā)展歷程 42
3.2 卷積神經(jīng)網(wǎng)絡(luò) 45
3.2.1 卷積神經(jīng)網(wǎng)絡(luò)的研究歷史與意義 45
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu) 46
3.2.3 卷積神經(jīng)網(wǎng)絡(luò)的工作原理 48
3.2.4 卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展趨勢(shì) 49
3.2.5 實(shí)驗(yàn)—機(jī)器人識(shí)別你的字 50
3.3 基于深度學(xué)習(xí)的計(jì)算機(jī)視覺 56
3.3.1 計(jì)算機(jī)視覺與深度學(xué)習(xí)的關(guān)系 56
3.3.2 計(jì)算機(jī)視覺和深度學(xué)習(xí)發(fā)展的加速器—GPU 58
3.3.3 計(jì)算機(jī)視覺與深度學(xué)習(xí)的基礎(chǔ)與研究方向 59
3.4 深度學(xué)習(xí)的實(shí)現(xiàn)框架TensorFlow 60
3.4.1 TensorFlow簡(jiǎn)介 60
3.4.2 TensorFlow環(huán)境的搭建 60
3.4.3 TensorFlow計(jì)算模型—計(jì)算圖 68
3.4.4 TensorFlow數(shù)據(jù)模型—張量 70
3.4.5 TensorFlow運(yùn)行模型—會(huì)話 74
第4章 圖像分類 76
4.1 定義與應(yīng)用場(chǎng)景 76
4.2 實(shí)現(xiàn)方法 77
4.3 常用數(shù)據(jù)集 80
4.4 實(shí)驗(yàn)—機(jī)器人看圖識(shí)物 82
4.5 實(shí)驗(yàn)—機(jī)器人識(shí)別人臉表情 100
第5章 目標(biāo)檢測(cè) 112
5.1 定義與應(yīng)用場(chǎng)景 112
5.2 實(shí)現(xiàn)方法 113
5.2.1 基于候選區(qū)域的目標(biāo)檢測(cè)算法 114
5.2.2 基于直接回歸的目標(biāo)檢測(cè)算法 119
5.3 常用數(shù)據(jù)集 122
5.4 實(shí)驗(yàn)—機(jī)器人捕捉人臉并識(shí)別 123
5.5 實(shí)驗(yàn)—無(wú)人駕駛中的目標(biāo)檢測(cè) 141
第6章 圖像分割 146
6.1 定義與應(yīng)用場(chǎng)景 146
6.2 實(shí)現(xiàn)方法 147
6.2.1 基于特征編碼的模型 147
6.2.2 基于區(qū)域選擇的模型 148
6.2.3 基于上采樣/反卷積的模型 150
6.2.4 基于RNN的模型 151
6.2.5 基于提高特征分辨率的模型 152
6.3 常用數(shù)據(jù)集 152
6.4 實(shí)驗(yàn)—無(wú)人駕駛場(chǎng)景感知 153
第7章 場(chǎng)景文字識(shí)別 165
7.1 定義與應(yīng)用場(chǎng)景 165
7.2 實(shí)現(xiàn)方法 167
7.2.1 傳統(tǒng)方法時(shí)期 167
7.2.2 深度學(xué)習(xí)方法時(shí)期 167
7.3 常用數(shù)據(jù)集 170
7.4 實(shí)驗(yàn)—無(wú)人值守車牌識(shí)別機(jī)器人 171
第8章 人體關(guān)鍵點(diǎn)檢測(cè) 179
8.1 定義與應(yīng)用場(chǎng)景 179
8.1.1 人體關(guān)鍵點(diǎn)檢測(cè)的定義 179
8.1.2 人體關(guān)鍵點(diǎn)檢測(cè)的應(yīng)用場(chǎng)景 180
8.2 實(shí)現(xiàn)方法 182
8.2.1 自頂向下 183
8.2.2 自底向上 184
8.3 常用數(shù)據(jù)集 186
8.3.1 MPII數(shù)據(jù)集 187
8.3.2 MSCOCO數(shù)據(jù)集 188
8.4 實(shí)驗(yàn)—姿態(tài)識(shí)別互動(dòng)機(jī)器人 189
第9章 圖像生成 194
9.1 定義與應(yīng)用場(chǎng)景 194
9.1.1 圖像生成的定義 194
9.1.2 圖像生成的應(yīng)用 195
9.2 實(shí)現(xiàn)方法 196
9.2.1 GAN模型 196
9.2.2 PixelRNN/PixelCNN模型 197
9.2.3 VAE模型 198
9.3 常用數(shù)據(jù)集 200
9.4 實(shí)驗(yàn)—機(jī)器人書法學(xué)習(xí) 200
第10章 視覺交互機(jī)器人 212
10.1 實(shí)驗(yàn)?zāi)康?212
10.2 實(shí)驗(yàn)背景 212
10.3 實(shí)驗(yàn)原理 212
10.4 實(shí)驗(yàn)環(huán)境 215
10.5 實(shí)驗(yàn)步驟 215
10.5.1 利用CNN主流架構(gòu)的mini_Xception訓(xùn)練情感分類 215
10.5.2 視覺交互機(jī)器人綜合實(shí)驗(yàn) 221
第11章 無(wú)人駕駛的自動(dòng)巡線 228
11.1 實(shí)驗(yàn)?zāi)康?228
11.2 實(shí)驗(yàn)背景 228
11.3 實(shí)驗(yàn)原理 230
11.4 實(shí)驗(yàn)環(huán)境 231
11.5 實(shí)驗(yàn)步驟 231
11.5.1 數(shù)據(jù)準(zhǔn)備 231
11.5.2 網(wǎng)絡(luò)設(shè)計(jì) 231
11.5.3 模型訓(xùn)練 237
11.5.4 模型測(cè)試 243