機器人、無人駕駛汽車、無人機和智慧工廠將顯著改變數(shù)字社會中人類的生活方式。無線機器人中的人工智能介紹了無線通信和網(wǎng)絡(luò)技術(shù)如何促進機器人中的人工智能,它在機器人中的人工智能、無線通信、計算和控制之間架起了基礎(chǔ)的多學(xué)科知識的橋梁。本書的一個獨特性是提出應(yīng)用通信和信號處理技術(shù)來增強機器人和多智能體系統(tǒng)中的傳統(tǒng)人工智能。
本書的技術(shù)內(nèi)容包括機器人基礎(chǔ)知識、信息物理系統(tǒng)、人工智能,統(tǒng)計決策和馬爾可夫決策過程,強化學(xué)習(xí),狀態(tài)估計,定位,計算機視覺和多模態(tài)數(shù)據(jù)融合,機器人規(guī)劃,多智能體系統(tǒng),網(wǎng)絡(luò)化多智能體系統(tǒng),網(wǎng)絡(luò)化機器人的安全性和魯棒性,以及超可靠和低延遲的機器對機器的網(wǎng)絡(luò)。提供的例題和練習(xí)有助于簡單和有效的理解本書的內(nèi)容。
希望拓展在機器人、人工智能和無線通信等方面的知識的工程師將從這本書中受益。同時,本書也適用于電氣工程、計算機工程、計算機科學(xué)和一般工程專業(yè)的高年級本科生或一年級研究生的教材。讀者需要具備本科概率論和線性代數(shù)的基礎(chǔ)知識,以及基本的編程能力,來享受深入閱讀的樂趣。
譯者序
前言
作譯者簡介
第1章 人工智能和機器人概述1
1.1 人工智能、控制論和機器人學(xué)的基礎(chǔ)知識1
1.2 智能體4
1.2.1 合理性的概念5
1.2.2 系統(tǒng)動力學(xué)6
1.2.3 任務(wù)環(huán)境8
1.2.4 機器人和多智能體系統(tǒng)9
1.3 推理11
1.3.1 約束滿足問題13
1.3.2 通過搜索來求解CSP15
參考文獻20
第2章 基本搜索算法21
2.1 問題求解智能體21
2.2 搜索求解24
2.3 統(tǒng)一搜索28
2.3.1 廣度優(yōu)先搜索28
2.3.2 動態(tài)規(guī)劃30
2.3.3 深度優(yōu)先搜索35
2.4 有信息搜索37
2.5 優(yōu)化41
2.5.1 線性規(guī)劃41
2.5.2 非線性規(guī)劃42
2.5.3 凸優(yōu)化42
參考文獻44
第3章 機器學(xué)習(xí)基礎(chǔ)45
3.1 監(jiān)督學(xué)習(xí)46
3.1.1 回歸46
3.1.2 貝葉斯分類53
3.1.3 KNN54
3.1.4 支持向量機55
3.2 無監(jiān)督學(xué)習(xí)57
3.2.1 K均值聚類57
3.2.2 EM算法58
3.2.3 主成分分析58
3.3 深度神經(jīng)網(wǎng)絡(luò)61
3.4 數(shù)據(jù)預(yù)處理64
參考文獻68
第4章 馬爾可夫決策過程69
4.1 統(tǒng)計決策69
4.1.1 數(shù)學(xué)基礎(chǔ)72
4.1.2 貝葉斯決策73
4.1.3 雷達(dá)信號探測78
4.1.4 貝葉斯序貫決策80
4.2 馬爾可夫決策過程81
4.2.1 馬爾可夫決策過程的數(shù)學(xué)基礎(chǔ)82
4.2.2 最優(yōu)策略84
4.2.3 開發(fā)貝爾曼方程的解85
4.3 決策及規(guī)劃:動態(tài)規(guī)劃87
4.4 MDP的應(yīng)用:搜索移動目標(biāo)92
4.5 多臂賭博機問題95
4.5.1 ε-貪婪算法97
4.5.2 上置信界98
4.5.3 湯普森采樣99
參考文獻106
第5章 強化學(xué)習(xí)107
5.1 強化學(xué)習(xí)基礎(chǔ)107
5.1.1 重訪多臂賭博機問題108
5.1.2 強化學(xué)習(xí)基礎(chǔ)111
5.1.3 基于馬爾可夫過程的強化學(xué)習(xí)112
5.1.4 貝爾曼最優(yōu)性原理115
5.2 Q學(xué)習(xí)116
5.2.1 部分可觀測狀態(tài)116
5.2.2 Q學(xué)習(xí)算法117
5.2.3 Q學(xué)習(xí)示例119
5.3 無模型的學(xué)習(xí)125
5.3.1 蒙特卡羅方法126
5.3.2 時序差分學(xué)習(xí)129
5.3.3 SARSA132
5.3.4 Q學(xué)習(xí)與TD學(xué)習(xí)的關(guān)系133
參考文獻135
第6章狀態(tài)估計136
6.1 估計基礎(chǔ)136
6.1.1 基于觀測的線性估計量137
6.1.2 線性預(yù)測139
6.1.3 貝葉斯估計140
6.1.4 極大似然估計142
6.2 遞歸狀態(tài)估計144
6.3 貝葉斯濾波146
6.4 高斯濾波149
6.4.1 卡爾曼濾波149
6.4.2 標(biāo)量卡爾曼濾波150
6.4.3 擴展卡爾曼濾波154
參考文獻156
第7章 定位157
7.1 傳感器網(wǎng)絡(luò)定位158
7.1.1 到達(dá)時間技術(shù)158
7.1.2 到達(dá)角技術(shù)160
7.1.3 到達(dá)時間差技術(shù)162
7.2 移動機器人定位164
7.3 同時定位與建圖165
7.3.1 概率SLAM166
7.3.2 擴展卡爾曼濾波SLAM168
7.3.3 立體攝像機輔助的SLAM169
7.4 網(wǎng)絡(luò)定位和導(dǎo)航172
參考文獻175
第8章 機器人規(guī)劃176
8.1 知識表示和分類邏輯176
8.1.1 貝葉斯網(wǎng)絡(luò)178
8.1.2 語義表示184
8.2 離散規(guī)劃184
8.3 自主移動機器人的規(guī)劃和導(dǎo)航187
8.3.1 規(guī)劃和導(dǎo)航示例188
8.3.2 強化學(xué)習(xí)的系統(tǒng)闡述189
8.3.3 定長規(guī)劃191
8.3.4 條件窮舉規(guī)劃191
參考文獻196
第9章多模態(tài)數(shù)據(jù)融合197
9.1 計算機視覺197
9.1.1 計算機視覺基礎(chǔ)198
9.1.2 邊緣檢測199
9.1.3 圖像特征和目標(biāo)識別201
9.2 基于視覺功能的多模態(tài)信息融合203
9.3 決策樹206
9.3.1 決策示例207
9.3.2 正式處理209
9.3.3 分類樹210
9.3.4 回歸樹211
9.3.5 規(guī)則和樹212
9.3.6 定位機器人213
9.3.7 帶決策樹的強化學(xué)習(xí)214
9.4 聯(lián)邦學(xué)習(xí)219
9.4.1 聯(lián)邦學(xué)習(xí)基礎(chǔ)220
9.4.2 通過無線通信進行聯(lián)邦學(xué)習(xí)221
9.4.3 無線網(wǎng)絡(luò)上的聯(lián)邦學(xué)習(xí)222
9.4.4 多接入通信上的聯(lián)邦學(xué)習(xí)224
參考文獻225
第10章多機器人系統(tǒng)227
10.1 多機器人任務(wù)分配227
10.1.1 最優(yōu)分配228
10.1.2 多旅行商問題230
10.1.3 工廠自動化231
10.2 無線通信和網(wǎng)絡(luò)236
10.2.1 數(shù)字通信系統(tǒng)236
10.2.2 計算機網(wǎng)絡(luò)239
10.2.3 多址通信241
10.3 網(wǎng)絡(luò)多機器人系統(tǒng)243
10.3.1 曼哈頓街道上的聯(lián)網(wǎng)自動駕駛汽車243
10.3.2 網(wǎng)絡(luò)協(xié)同多機器人系統(tǒng)251
參考文獻257
技術(shù)縮略語258
索引263