本書較全面地介紹了數(shù)字圖像處理的基礎(chǔ)理論、經(jīng)典算法及典型應(yīng)用。本書內(nèi)容包括數(shù)字圖像處理基礎(chǔ)知識、圖像增強、圖像復原、圖像的幾何變換與幾何校正、形態(tài)學圖像處理、圖像分割、圖像描述與特征提取等,并通過一個較完整的車牌識別系統(tǒng)向讀者詳細介紹了數(shù)字圖像處理系統(tǒng)的基本設(shè)計思想與設(shè)計方法。本書實踐部分介紹了OpenCV、NumPy、Matplotlib、Scikit-learn等圖像處理相關(guān)工具包的常用方法,其中的代碼匯集生成了“基于Python的圖像處理算法演示系統(tǒng)v1.0”,以輔助讀者理解算法。為適應(yīng)人工智能等新技術(shù)的發(fā)展,本書簡單介紹了卷積神經(jīng)網(wǎng)絡(luò)的平移、旋轉(zhuǎn)、尺度縮放、形變等不變性,讓讀者理解卷積神經(jīng)網(wǎng)絡(luò)在圖像處理方面的優(yōu)勢。
本書編者在編寫過程中,收集整理了大量經(jīng)典的圖像處理算法,引入了新的圖像處理技術(shù),全書的例題在Python環(huán)境下均通過了調(diào)試。本書可作為普通高校電子信息、人工智能、計算機等專業(yè)的教材,也適合各類培訓班作為教材使用。
本書配有以下教學資源:電子課件,習題答案,示例代碼和對應(yīng)的素材,圖像處理算法演示系統(tǒng)。歡迎選用本書作教材的教師發(fā)郵件到j(luò)inacmp@163.com或登錄www.cmpedu.com 注冊下載。
俗話說“眼見為實”“百聞不如一見”,圖像已成為人類獲取和交換信息的主要來源。數(shù)字圖像具有信息量大、占用的頻帶較寬且像素間的相關(guān)性強等特點,數(shù)字圖像處理需要綜合應(yīng)用信息處理、計算機、機器學習、統(tǒng)計分析等各方面的知識和技術(shù),對已有的圖像進行變換、處理、重構(gòu),從而改進圖像質(zhì)量或從圖像中提取有用的信息。
目前普通高等院校人工智能、計算機、電子信息等相關(guān)專業(yè)都開設(shè)了數(shù)字圖像處理這門課程,對數(shù)字圖像處理教材的需求和要求也在不斷增加。在組織編寫教材過程中,課題組遵循工程教育認證的成果導向理念來構(gòu)建圖像處理的課程體系;利用圖像信息直觀的特點,傳播主流意識形態(tài)的道德價值觀和思想政治理念,在潛移默化中展現(xiàn)課程思政;跟隨人工智能、計算機等新技術(shù)的發(fā)展步伐,更新圖像處理的教學內(nèi)容和開發(fā)工具,努力推出實用性強、針對性強的數(shù)字圖像處理教材。編者多年從事數(shù)字圖像處理課程教學,收集、整理了大量的經(jīng)典算法和應(yīng)用,在此將多年來對數(shù)字圖像處理技術(shù)的探索心得與大家共享。
本書主要內(nèi)容
總體上,數(shù)字圖像處理分三個層次:低級圖像處理、中級圖像處理和高級圖像處理。本書主要介紹低級圖像處理和中級圖像處理,也就是對圖像進行各種加工以改善圖像的視覺效果或突出有用信息,進一步對圖像中感興趣的目標進行檢測(或分割)和測量,以獲得它們的客觀信息,從而建立對圖像的描述。本書沒有介紹高級圖像處理中的圖像理解及場景解釋等內(nèi)容。
1.低級圖像處理部分
本書的第1章是數(shù)字圖像處理概述,主要介紹了數(shù)字圖像的概念和相關(guān)術(shù)語、數(shù)字圖像處理的特點、數(shù)字圖像處理的主要研究內(nèi)容以及數(shù)字圖像處理的一些經(jīng)典應(yīng)用。
第2章介紹數(shù)字圖像處理的一些基礎(chǔ)知識,包括圖像的數(shù)字化、數(shù)字圖像的表示與坐標約定、圖像模式及彩色模型、灰度統(tǒng)計特征、像素點之間的基本關(guān)系、圖像質(zhì)量評價以及Python圖像處理編程基礎(chǔ)等。
第3章介紹空域圖像增強技術(shù),主要介紹了線性灰度變換、非線性灰度變換和直方圖處理等點處理技術(shù),以及空域平滑、空域銳化等鄰域處理技術(shù),分析了點處理和鄰域處理的特點和各種處理技術(shù)的功能效果。
第4章介紹頻域圖像增強技術(shù),主要介紹了通過傅里葉變換實現(xiàn)圖像增強的原理和步驟,分析了傅里葉變換的性質(zhì),學習了利用頻域信息的特點對圖像進行低通濾波、高通濾波的方法。
第5章介紹圖像復原技術(shù),主要介紹了線性移不變圖像退化模型及非盲去卷積的圖像復原原理,對無約束圖像復原(逆濾波)和有約束圖像復原(維納濾波、約束最小二乘濾波等)等算法進行了公式推導,并對各算法進行了分析比較。
第6章介紹圖像的幾何變換與幾何校正技術(shù),主要介紹了圖像常用的坐標變換和常用的灰度插值方法,進一步學習了剛體變換、仿射變換、投影變換和非線性變換等幾何變換,簡單介紹了幾何校正的基本原理。
第7章介紹形態(tài)學圖像處理技術(shù),主要介紹了基本的形態(tài)學運算,包括腐蝕、膨脹、開運算、閉運算,分析了利用這些基本運算推導和組合成的各種數(shù)學形態(tài)學實用算法,并用這些算法對圖像形狀和結(jié)構(gòu)進行了分析與處理。
2.中級圖像處理部分
第8章介紹圖像分割技術(shù),闡述了圖像分割的意義,介紹了圖像分割的一些常用方法,包括閾值分割、邊緣檢測、區(qū)域分割等,著重介紹了一些圖像分割的經(jīng)典算法,包括閾值分割法、區(qū)域生長法、水域分割法等。
第9章介紹圖像描述和特征提取技術(shù),闡述了圖像描述和特征提取的必要性,介紹了圖像的灰度描述、邊界描述、區(qū)域描述、紋理描述方法,著重介紹了圖像的直方圖特征、鏈碼描述和傅里葉描述、幾何特征和不變矩、矩分析法和灰度共生矩陣法等,較詳細地介紹了HOG特征,分析了一般圖像識別系統(tǒng)的工作流程。
第10章介紹一個較為完整的車牌識別系統(tǒng)。本章教學內(nèi)容與配套的算法演示系統(tǒng)相結(jié)合,讓讀者對圖像處理系統(tǒng)有一個較為全面的認識。
本書特點
(1) 內(nèi)容新穎、實用性強。隨著人工智能的發(fā)展,越來越多的工程應(yīng)用和教學研究都使用Python語言,本教材的例題都是使用Python語言實現(xiàn)的,符合實際應(yīng)用的需要。本教材緊跟新技術(shù)發(fā)展前沿,收集了一些人工智能、計算機等方面的新技術(shù)應(yīng)用。
(2) 示例典型豐富、內(nèi)容完整。在多年的數(shù)字圖像處理教學過程中,筆者收集、整理了大量經(jīng)典例題,并在編書過程中有所選擇,以方便讀者較全面地了解圖像增強、圖像變換、圖像復原、幾何變換、形態(tài)學處理、圖像分割、圖像描述、特征提取等經(jīng)典圖像處理技術(shù)。
(3) 教學資料豐富。筆者汲取了國內(nèi)外圖像處理的教學經(jīng)驗,整理了一套較為完整和實用的教學資料,包括PPT課件、練習習題、圖像處理實驗指導書以及“基于Python的圖像處理算法演示系統(tǒng)v1.0”等。
教學安排
本書介紹了數(shù)字圖像處理的基礎(chǔ)知識和數(shù)字圖像處理編程技術(shù),學習本書需要數(shù)字信號處理的基礎(chǔ)知識以及Python程序設(shè)計知識。
作為教材,筆者推薦的總課時是48課時。建議在上完本課程后,再開設(shè)一到兩周的數(shù)字圖像處理的課程設(shè)計,以鞏固數(shù)字圖像處理的知識,并加強同學們的數(shù)字圖像處理程序設(shè)計能力。推薦的課時分配見下表。課時分配表
序號課時教 學 內(nèi) 容實 驗 內(nèi) 容12第1章圖像處理概述26第2章圖像處理基礎(chǔ)知識310第3章空域圖像增強空域圖像增強實驗48第4章頻域圖像增強頻域圖像增強實驗56第5章圖像復原圖像復原實驗62第6章圖像的幾何變換與幾何校正72第7章形態(tài)學圖像處理86第8章圖像分割圖像分割實驗94第9章圖像描述與特征提取102自主安排相關(guān)教學
致謝
本書由蔡體健和劉偉主編,參編人員包括王杉、劉志偉、劉遵雄、鄧芳芳。編寫分工如下:蔡體健編寫了第2、3、4、6、9章,劉偉編寫了第5、7、8章,王杉編寫了第1章,劉遵雄編寫了第10章,鄧芳芳編寫了附錄。本書由蔡體健和劉志偉負責統(tǒng)稿。
編者在教材編寫過程中參考了都柏林理工學院Brian Mac Namee教授、巴塞爾大學Philippe Cattin教授、斯坦福大學Gordon Wetzstein教授、休斯頓大學Shishir K.Shah博士、山東大學陳輝教授等的數(shù)字圖像處理課件;此外,還得到了華東交通大學人工智能系的支持,在此表示感謝。由于編者水平有限,時間也比較倉促,書中的錯誤和不妥之處在所難免,敬請讀者批評指正。
編者
第1章圖像處理概述
1.1數(shù)字圖像
1.2數(shù)字圖像處理
1.2.1什么是數(shù)字圖像處理
1.2.2數(shù)字圖像處理的基本特點
1.2.3相關(guān)學科與領(lǐng)域
1.3數(shù)字圖像處理的研究內(nèi)容
1.3.1數(shù)字圖像處理的三個層次
1.3.2數(shù)字圖像處理課程的主要
研究內(nèi)容
1.3.3數(shù)字圖像處理中的幾種
運算處理
1.4數(shù)字圖像處理的經(jīng)典應(yīng)用
1.4.1天文方面的應(yīng)用
1.4.2遙感圖像應(yīng)用
1.4.3醫(yī)學圖像應(yīng)用
1.4.4工業(yè)檢測方面的應(yīng)用
1.4.5公安執(zhí)法方面的應(yīng)用
1.4.6智能監(jiān)控方面的應(yīng)用
1.4.7文體藝術(shù)圖像應(yīng)用
1.4.8圖像檢索
1.4.9辦公室自動化圖像應(yīng)用
1.5數(shù)字圖像處理的發(fā)展趨勢
練習
第2章圖像處理基礎(chǔ)知識
2.1圖像的數(shù)字化
2.1.1圖像采樣
2.1.2圖像量化
2.1.3非均勻采樣與量化
2.2數(shù)字圖像的表示
2.2.1圖像的數(shù)學表示
2.2.2在計算機中的矩陣表示
2.2.3坐標約定
2.3圖像模式及彩色模型
2.3.1圖像模式
2.3.2RGB彩色模型
2.3.3HSI彩色模型
2.3.4彩色模型之間的相互轉(zhuǎn)換
2.4圖像的灰度分布——直方圖
2.5像素點之間的基本關(guān)系
2.5.1像素與鄰域
2.5.2鄰接性、連通性、區(qū)域和邊界
2.5.3距離度量
2.6圖像質(zhì)量評價
2.6.1主觀評價
2.6.2客觀評價
2.6.3常用的評價指標
2.7Python的圖像處理編程
2.7.1Python圖像處理工具包
2.7.2可視化工具包
練習
第3章空域圖像增強
3.1圖像增強方法
3.2灰度變換
3.2.1線性灰度變換
3.2.2非線性灰度變換
3.3基于直方圖的灰度變換
3.3.1直方圖均衡化
3.3.2直方圖規(guī)定化
3.4空域濾波與鄰域運算
3.5空域平滑濾波
3.5.1均值濾波
3.5.2高斯濾波
3.5.3閾值鄰域平滑濾波
3.5.4中值濾波
3.6空域銳化濾波
3.6.1一階微分算子
3.6.2二階微分算子
3.6.3梯度的各向同性
3.7空域濾波與卷積運算
3.7.1空域低通濾波與高通濾波
3.7.2圖像濾波邊界處理
3.7.3相關(guān)運算與卷積運算
練習
第4章頻域圖像增強
4.1傅里葉變換原理
4.2離散傅里葉變換
4.2.1一維離散傅里葉變換
4.2.2離散傅里葉變換的矩陣向量
表示形式
4.2.3一維離散卷積
4.2.4二維離散傅里葉變換
4.3數(shù)字圖像的傅里葉變換性質(zhì)
4.3.1可分離性
4.3.2共軛對稱性
4.3.3周期性
4.3.4平移性
4.3.5旋轉(zhuǎn)不變性
4.3.6卷積定理
4.4頻域圖像平滑
4.4.1理想低通濾波器
4.4.2巴特沃斯低通濾波器
4.4.3高斯低通濾波器
4.5頻域圖像銳化
4.5.1理想高通濾波器
4.5.2巴特沃斯高通濾波器
4.5.3高斯高通濾波器
4.6空域濾波與頻域濾波的關(guān)系
練習
第5章圖像復原
5.1圖像復原與圖像增強的關(guān)系
5.2噪聲模型及去噪方法
5.2.1噪聲模型
5.2.2噪聲仿真
5.2.3空域濾波去噪方法
5.2.4頻域濾波去噪方法
5.3圖像退化模型
5.3.1線性移不變退化模型
5.3.2退化函數(shù)的估計
5.3.3平面運動模糊退化模型
5.4圖像復原算法
5.4.1無約束的圖像復原
5.4.2有約束的圖像復原
5.5補充數(shù)學知識
5.5.1卷積的矩陣向量表示
5.5.2循環(huán)矩陣的對角形式
練習
第6章圖像的幾何變換與
幾何校正
6.1基本的坐標變換
6.1.1圖像平移
6.1.2鏡像變換
6.1.3圖像旋轉(zhuǎn)
6.1.4圖像縮放
6.2灰度插值運算
6.2.1最近鄰插值
6.2.2雙線性插值
6.2.3雙三次插值
6.3圖像幾何變換類別
6.3.1剛體變換
6.3.2仿射變換
6.3.3投影變換
6.3.4非線性變換
6.4圖像的幾何校正
6.4.1圖像的幾何畸變描述
6.4.2圖像幾何校正方法
練習
第7章形態(tài)學圖像處理
7.1形態(tài)學基礎(chǔ)
7.1.1集合運算
7.1.2結(jié)構(gòu)元素與形態(tài)學運算
7.2基本的形態(tài)學運算
7.2.1腐蝕運算
7.2.2膨脹運算
7.2.3開運算
7.2.4閉運算
7.3形態(tài)學算法
7.3.1邊界提取
7.3.2區(qū)域填充
7.3.3連通分量提取
7.3.4骨架提取
練習
第8章圖像分割
8.1圖像分割技術(shù)簡介
8.2閾值分割
8.2.1直方圖閾值法
8.2.2基本全局閾值法
8.2.3最大類間方差法
8.2.4移動平均變閾值法
8.2.5自適應(yīng)閾值法
8.3邊緣檢測與連接
8.3.1邊緣檢測
8.3.2邊界連接
8.4區(qū)域分割法
8.4.1區(qū)域生長法
8.4.2分裂合并法
8.4.3圖像水域分割
練習
第9章圖像描述與特征提取
9.1灰度描述
9.1.1幅度特征
9.1.2變換系數(shù)特征
9.1.3直方圖特征
9.2邊界描述
9.2.1鏈碼描述
9.2.2傅里葉描述
9.3區(qū)域描述
9.3.1幾何特征
9.3.2矩
9.4紋理描述
9.4.1矩分析法
9.4.2灰度差分統(tǒng)計法
9.4.3灰度共生矩陣法
9.5常用的特征提取算法
9.6MNIST手寫數(shù)字識別系統(tǒng)
練習
第10章車牌識別系統(tǒng)
10.1車牌識別系統(tǒng)的主要組成和
工作流程
10.2車牌檢測與定位模塊
10.2.1邊緣檢測和數(shù)學形態(tài)學處理
10.2.2大小形狀特征
10.2.3仿射校正
10.2.4顏色特征
10.3車牌字符分割模塊
10.3.1字符分割前的預處理
10.3.2水平投影去除上下邊界
10.3.3垂直投影字符分割法
10.4車牌識別模塊
10.4.1準備數(shù)據(jù)樣本
10.4.2訓練模型階段
10.4.3識別字符階段
練習
附錄圖像處理實驗指導
(Python版)
實驗一Python圖像處理編程基礎(chǔ)
實驗二空域圖像增強
實驗三頻域圖像增強
實驗四圖像復原
實驗五圖像分割
參考文獻