王亮出生于1983年11月27日,祖籍山東煙臺。2015年畢業(yè)于北京交通大學計算機與信息技術學院計算機工程系,獲博士學位。2011年到2013年在美國麻省理工學院(MIT)數(shù)學系進行訪問學習,師從于GilbertStrang教授,從事逆問題理論研究。2015年到2018年在MIT計算機科學與人工智能實驗室(CSAIL)做博士后,從事智能交通與自動駕駛方面的研究,指導教師為BertholdK.P.Horn教授。2019年以百人計劃副教授入職中山大學。目前主要研究興趣包括:機器視覺,智能感知,自動駕駛等。
劉京京出生于1980年4月28日,祖籍吉林榆樹市。2003年及2005年畢業(yè)于新加坡南洋理工大學電氣與電子工程學院,分別獲得一級榮譽學士學位和工程碩士學位;2010年畢業(yè)于牛津大學工程科學系,獲博士學位,期間獲EPSRC全額博士獎學金,又獲得了EPSRC Plus Fellowship在牛津大學從事一年博士后研究工作。2010年6月-2017年6月深圳光啟高等理工研究院企業(yè)科學家,獲得2018年深圳市科技進步一等獎;2017年7月-2019年6月北京大學深圳研究院研究員;2019年7月至今,于中山大學電子與通信工程學院從事教學和科學研究,校百人計劃副教授,博士生導師,廣東省集成電路工程技術中心核心成員。研究興趣包括:智能傳感器芯片、低功耗CMOS集成電路,生物醫(yī)療芯片等。
張志勇出生于1976年7月16日,祖籍湖南郴州。2006年畢業(yè)于國防科技大學電子與通信工程學院,獲博士學位。2006年12月-2018年07月在國防科技大學電子與通信工程學院,從事自動目標識別、實時系統(tǒng)與ASIC技術的教學和科研工作;2018年7月至今,于中山大學電子與通信工程學院從事教學和科學研究,校百人計劃教授,博士生導師。研究興趣包括光學成像自動目標識別、智能系統(tǒng)與模式識別、實時系統(tǒng)設計與實現(xiàn)技術等領。作為負責人和主要參與者先后承擔國家863重大項目、自然科學基金等項目20余項。作為主要完成人獲得省部級科技進步一等獎1項。
第1章 內(nèi)容介紹
1.1 感與知
1.2 光電感知
1.3 智能交互
1.3.1 復制一個積木結(jié)構(gòu)
1.3.2 從容器中抓取零件
1.4 視覺感知的相關領域
1.5 成像 視覺
1.6 后續(xù)章節(jié)的概要
1.7 習題
第2章 成像系統(tǒng)
2.1 透視投影
2.2 平行直線與消失點
2.2.1 消失點理論
2.2.2 尋找消失點
2.3 確定觀測方向
2.3.1 確定平行直線的方向
2.3.2 判斷觀測方向
2.3.3 正交性約束
2.3.4 成像的逆問題
2.4 透鏡
2.5 成像模式的拓展
2.5.1 物體表面:透視成像
2.5.2 物體內(nèi)部:層析成像
2.6 像素
2.7 習題
第3章 輻射與亮度
3.1 圖像亮度
3.2 輻射
3.3 圖像的形成
3.4 雙向反射分布函數(shù)
3.5 連續(xù)光源
3.6 物體表面的反射性質(zhì)
3.7 物體表面的亮度
3.8 光度立體視覺
3.9 習題
第4章 顏色與光譜
4.1 電子圖像
4.2 三色刺激
4.3 光譜頻帶
4.4 黑體輻射
4.5 紅外成像
4.6 X射線成像
4.7 仿制響尾蛇導彈
4.8 習題
第5章 半導體光電轉(zhuǎn)換
5.1 光子吸收原理
5.2 半導體P-N結(jié)
5.3 光電二極管
5.4 量子效率
5.5 片上太陽能電池
5.6 本章小結(jié)
5.7 習題
第6章 圖像傳感器
6.1 CCD圖像傳感器
6.2 CMOS圖像傳感器
6.2.1 無源像素傳感器
6.2.2 有源像素傳感器
6.2.3 4T有源像素傳感器
6.2.4 對數(shù)像素圖像傳感器
6.2.5 脈沖調(diào)制圖像傳感器
6.3 紅外圖像傳感器
6.4 圖像傳感器的外圍電路
6.5 本章小結(jié)
6.6 習題
第7章 二值圖處理
7.1 二值圖
7.2 標注連通區(qū)域
7.2.1 種子算法
7.2.2 串行標注算法
7.3 簡單幾何性質(zhì)
7.3.1 區(qū)域的面積
7.3.2 區(qū)域的位置
7.4 計算朝向
7.4.1 投影
7.4.2 轉(zhuǎn)動慣量
7.5 夜間車燈預警系統(tǒng)
7.6 習題
第8章 離散線性系統(tǒng)
8.1 離散信號與線性系統(tǒng)
8.1.1 單位沖擊響應
8.1.2 移不變系統(tǒng)與卷積
8.2 循環(huán)卷積
8.3 多項式與平移操作
8.4 離散Fourier變換
8.5 卷積定理
8.5.1 特征值分析
8.5.2 快速Fourier變換
8.6 二維信號的情況
8.7 后向投影
8.8 習題
第9章 圖像處理
9.1 線性移不變系統(tǒng)
9.2 點擴散函數(shù)
9.3 調(diào)制傳遞函數(shù)
9.4 二維Fourier變換
9.5 模糊和失焦
9.6 圖像復原與增強
9.7 功率譜
9.8 Wiener濾波器
9.8.1 優(yōu)化模型
9.8.2 變分法求解
9.8.3 兩個具體例子
9.9 離散情況
9.10 習題
第10章 邊緣和角點
10.1 圖像中的邊緣
10.2 微分算子
10.3 離散近似
10.3.1 梯度算子的離散近似
10.3.2 Laplace算子的離散近似
10.4 確定邊緣
10.4.1 邊緣檢測和定位
10.4.2 簡單邊緣模型的缺陷
10.4.3 確定長直線邊緣
10.5 角點檢測
10.5.1 角點的判斷標準
10.5.2 角點檢測算法
10.6 平行軸旋轉(zhuǎn)定理
10.7 角點的動態(tài)特征
10.8 一個具體的例子
10.9 習題
第11章 光流估計
11.1 觀測運動
11.2 光流:估算速度場
11.3 稀疏光流算法
11.3.1 一個具體例子
11.3.2 算法實現(xiàn)過程
11.4 稠密光流算法 318
11.4.1 光流的光滑性
11.4.2 離散求解
11.4.3 算法實現(xiàn)過程
11.5 光流的不連續(xù)
11.6 觸覺傳感器
11.7 習題
第12章 無源導航
12.1 估計觀測者的運動
12.2 平動的情況
12.2.1 相似曲面與相似運動
12.2.2 最小二乘方法
12.3 使用其他的范數(shù)形式
12.4 轉(zhuǎn)動的情況
12.5 剛體運動
12.6 碰撞時間估計
12.7 習題
第13章 統(tǒng)計機器學習
13.1 一個簡單的例子
13.2 特征向量
13.3 分類模型
13.3.1 最近鄰分類
13.3.2 最近中心分類
13.3.3 概率分布模型
13.3.4 特征空間的劃分
13.4 神經(jīng)網(wǎng)絡模型
13.4.1 線性神經(jīng)網(wǎng)絡模型
13.4.2 非線性神經(jīng)網(wǎng)絡模型
13.4.3 對模型的深入理解
13.4.4 應用案例:材料基因計算方法
13.5 聚類的自動形成
13.6 鐵軌表面擦傷的自動檢測
13.7 一個預言故事
13.8 習題
第14章 隨機分析與過程
14.1 引例:動物行為分析
14.2 集合及其結(jié)構(gòu)
14.2.1 集合的-代數(shù)
14.2.2 對集合的分割
14.3 概率空間
14.4 隨機變量
14.5 概率分布
14.5.1 概率密度函數(shù)
14.5.2 兩個具體例子
14.6 條件期望
14.6.1 條件概率
14.6.2 復合函數(shù)映射
14.7 隨機過程與鞅
14.7.1 隨機過程的概率空間
14.7.2 鞅、超鞅、子鞅
14.7.3 兩個具體例子
14.7.4 停止時間
14.8 習題
第15章 隨機過程的圖模型
15.1 Markov鏈
15.1.1 人口遷移模型
15.1.2 Markov過程
15.1.3 有限停止時間
15.1.4 調(diào)和函數(shù)與鞅
15.2 基于Markov鏈的隨機采樣
15.3 鏈式概率圖模型
15.4 隱Markov模型
15.5 Bayes網(wǎng)絡
15.6 習題
第16章 學生聽課狀態(tài)分析
16.1 概率圖模型的完善
16.1.1 隱模型的參數(shù)估計
16.1.2 條件概率模型
16.1.3 算法
16.1.4 條件最大后驗估計
16.1.5 解決下溢問題
16.2 教育機器人
16.3 基于感知的智能交互
16.4 數(shù)據(jù)收集與整理
16.5 實驗結(jié)果與分析
16.6 本章小結(jié)
16.7 習題
附錄
一些應用案例
A.1基于YOLO的目標檢測
A.1.1 YOLOv1簡介
A.1.2 YOLOv2簡介
A.1.3 YOLOv3簡介
A.1.4 YOLOv4簡介
A.1.5 YOLOv5簡介
A.1.6 YOLO拓展框架簡介
A.1.7 交并比(IoU)介紹
A.2 關于YOLOv5的實際操作
A.2.1 YOLO數(shù)據(jù)集制作
A.2.2 YOLOv5模型訓練
A.2.3 YOLOv5目標檢測
A.3 常用目標檢測算法介紹
A.3.1 基于手工標注特征的傳統(tǒng)算法
A.3.1.1 Viola-Jones算法
A.3.1.2 HOG算法
A.3.1.3 DPM算法
A.3.1.4 傳統(tǒng)目標檢測算法的缺點
A.3.2 目標檢測的經(jīng)典模型
A.3.2.1 LeNet
A.3.2.2 AlexNet
A.3.2.3 NIN
A.3.2.4 InceptionV1模塊
A.3.2.5 GoogLeNet
A.3.2.6 VGG
A.3.2.7 Inception V2
A.3.2.8 Inception V3
A.3.2.9 ResNet
A.3.2.10 Inception V4
A.3.2.11 Darknet
A.3.2.12 MobileNet
A.3.3 基于錨框的雙階段目標檢測算法
A.3.3.1 R-CNN
A.3.3.2 空間金字塔池化網(wǎng)絡(SPPNet)
A.3.3.3 Fast R-CNN
A.3.3.4 Faster R-CNN
A.3.3.5 特征金字塔網(wǎng)絡(FPN)
A.3.4 基于錨框的單階段目標檢測算法
A.3.4.1 基于二進制掩膜的目標檢測算法
A.3.4.2 Overfeat
A.3.4.3 SSD
A.3.4.4 RetinaNet
A.3.5 無錨框目標檢測算法
A.3.5.1 CornerNet
A.3.5.2 CenterNet
A.3.5.3 FSAF
A.4 智慧工地暴力行為識別
A.4.1 工地暴力行為識別需求分析
A.4.2 研究思路
A.4.3 工地暴力行為識別檢測運行框架的總體設計
A.4.4 Transformer編碼器的實現(xiàn)
A.4.5 已有暴力行為數(shù)據(jù)集調(diào)研
A.4.6 數(shù)據(jù)采集及處理
A.4.7 實驗設置
A.4.8 消融實驗
A.4.9 實驗結(jié)果
A.4.10 工作小結(jié)
A.5 工地抽煙行為的智能檢測
A.5.1 問題描述
A.5.2 基本算法簡介
A.5.3 模型訓練及測試
A.5.4 目標 動作聯(lián)合檢測模型
A.6 雙模態(tài)鋼軌缺陷快速檢測
A.6.1 數(shù)據(jù)采集系統(tǒng)概述
A.6.2 數(shù)據(jù)集概述
A.6.3 Parallel-YOLOv4-Tiny輕量級檢測方法
A.6.4 實驗結(jié)果與分析
A.6.4.1 損失函數(shù)實驗
A.6.4.2 對比實驗
A.6.5 工作小結(jié)
A.7 本書總結(jié)
本書參考文獻
索引