讀者對(duì)象:本書的主要讀者是控制科學(xué)與工程及無人作戰(zhàn)相關(guān)專業(yè)的本科生、研究生,以及智能博弈對(duì)抗AI開發(fā)設(shè)計(jì)人員參考,也可供人工智能相關(guān)領(lǐng)域的科研人員閱讀和參考.
本書以智能博弈對(duì)抗為主線,聚焦技術(shù)進(jìn)展、緊盯研究前沿,分為理論方法、應(yīng)用實(shí)踐、前沿展望三大部分。理論方法著重介紹智能博弈對(duì)抗的理論、相關(guān)基礎(chǔ)方法;應(yīng)用實(shí)踐針對(duì)當(dāng)前三類典型智能博弈對(duì)抗系統(tǒng)平臺(tái),提出人工智能程序設(shè)計(jì)思路并進(jìn)行設(shè)計(jì)實(shí)現(xiàn);前沿展望分析當(dāng)前智能博弈對(duì)抗領(lǐng)域的前沿元理論,探討智能博弈對(duì)抗的典型應(yīng)用場(chǎng)景。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
“智能科學(xué)技術(shù)著作叢書”序
前言
第1章 緒論 1
1.1 引言.1
1.2 智能博弈對(duì)抗內(nèi)涵與意義 2
1.2.1 智能博弈對(duì)抗 2
1.2.2 相關(guān)概念 2
1.2.3 研究的意義 6
1.3 智能博弈對(duì)抗相關(guān)研究應(yīng)用 7
1.3.1 即時(shí)策略類對(duì)抗 7
1.3.2 序貫策略類對(duì)抗 10
1.3.3 軍事仿真類對(duì)抗 15
1.4 主要內(nèi)容及章 節(jié)安排 19
參考文獻(xiàn) 21
第2章 博弈論視角下的多智能體學(xué)習(xí) 23
2.1 引言 23
2.2 博弈論基礎(chǔ) 23
2.2.1 博弈五要素 24
2.2.2 博弈論分類 25
2.2.3 博弈論相關(guān)概念 26
2.3 多智能體學(xué)習(xí)簡(jiǎn)介 27
2.3.1 多智能體學(xué)習(xí)系統(tǒng)組成 28
2.3.2 多智能體學(xué)習(xí)概述 29
2.3.3 多智能體學(xué)習(xí)研究方法分類 30
2.4 多智能體博弈學(xué)習(xí)框架 31
2.4.1 多智能體博弈基礎(chǔ)模型及元博弈 31
2.4.2 均衡解概念與博弈動(dòng)力學(xué) 34
2.4.3 多智能體博弈學(xué)習(xí)的挑戰(zhàn) 36
2.5 多智能體博弈策略學(xué)習(xí)方法.39
2.5.1 離線博弈策略學(xué)習(xí)方法 40
2.5.2 在線博弈策略學(xué)習(xí)方法 49
2.6 前沿研究重點(diǎn)及方向 50
2.6.1 前沿研究重點(diǎn) 50
2.6.2 前沿研究方向 51
參考文獻(xiàn) 52
第3章 智能博弈對(duì)抗策略學(xué)習(xí)方法基礎(chǔ) 65
3.1 引言 65
3.2 馬爾可夫決策過程 65
3.2.1 馬爾可夫決策模型 65
3.2.2 馬爾可夫決策過程求解方法 67
3.2.3 半馬爾可夫決策過程 70
3.3 強(qiáng)化學(xué)習(xí) 75
3.3.1 強(qiáng)化學(xué)習(xí)簡(jiǎn)介 76
3.3.2 基于值函數(shù)的方法 78
3.3.3 基于策略梯度的方法 80
3.4 深度強(qiáng)化學(xué)習(xí) 81
3.4.1 無模型強(qiáng)化學(xué)習(xí) 81
3.4.2 基于模型的強(qiáng)化學(xué)習(xí) 84
3.5 分層強(qiáng)化學(xué)習(xí) 86
3.6 分布式強(qiáng)化學(xué)習(xí) 88
參考文獻(xiàn) 91
第4章 智能博弈對(duì)抗對(duì)手建模方法 95
4.1 引言 95
4.2 對(duì)手建;A(chǔ) 95
4.2.1 對(duì)手建模簡(jiǎn)介 95
4.2.2 顯式對(duì)手建模方法 98
4.2.3 隱式對(duì)手建模方法 99
4.3 面向即時(shí)策略類對(duì)抗的對(duì)抗規(guī)劃 100
4.3.1 戰(zhàn)術(shù)對(duì)抗規(guī)劃 100
4.3.2 策略對(duì)抗規(guī)劃 103
4.3.3 混合對(duì)抗規(guī)劃 106
4.3.4 未來研究重點(diǎn) 109
4.4 面向序貫策略類對(duì)抗的對(duì)手剝削 110
4.4.1 對(duì)手建模式適變 111
4.4.2 對(duì)手感知式學(xué)習(xí) 113
4.4.3 對(duì)手生成式搜索 114
4.4.4 未來研究重點(diǎn) 115
參考文獻(xiàn) 116
第5章 協(xié)作式即時(shí)策略博弈對(duì)抗決策智能體設(shè)計(jì) 123
5.1 引言 123
5.2 面向《星際爭(zhēng)霸》的即時(shí)策略博弈對(duì)抗決策 123
5.2.1 《星際爭(zhēng)霸》游戲基礎(chǔ) 123
5.2.2 問題復(fù)雜度分析 125
5.2.3 研究挑戰(zhàn) 125
5.2.4 關(guān)鍵技術(shù)分析 126
5.3 《星際爭(zhēng)霸》智能博弈AI構(gòu)建 135
5.3.1 《星際爭(zhēng)霸》AI研究歷程 135
5.3.2 《星際爭(zhēng)霸》AI環(huán)境 138
5.3.3 《星際爭(zhēng)霸》AI實(shí)現(xiàn) 139
參考文獻(xiàn) 142
第6章 競(jìng)爭(zhēng)式序貫博弈對(duì)抗決策智能體設(shè)計(jì) 144
6.1 引言 144
6.2 面向德州撲克的序貫博弈對(duì)抗決策 144
6.2.1 無限注德州撲克規(guī)則 144
6.2.2 問題復(fù)雜度分析 147
6.2.3 關(guān)鍵技術(shù)分析 148
6.3 德州撲克智能博弈AI構(gòu)建 155
6.3.1 德州撲克AI研究歷程 155
6.3.2 德州撲克智能博弈系統(tǒng) 160
6.3.3 兩人無限注德州撲克AI實(shí)現(xiàn) 162
6.3.4 多人無限注德州撲克AI實(shí)現(xiàn) 165
參考文獻(xiàn) 166
第7章 混合式序貫博弈對(duì)抗決策智能體設(shè)計(jì) 169
7.1 引言 169
7.2 面向斗地主的序貫博弈對(duì)抗決策 169
7.2.1 斗地主規(guī)則 169
7.2.2 問題復(fù)雜度分析 170
7.2.3 關(guān)鍵技術(shù)分析 171
7.3 斗地主智能博弈AI構(gòu)建 177
7.3.1 斗地主AI研究歷程 177
7.3.2 斗地主AI實(shí)現(xiàn) 178
7.4 面向橋牌的序貫博弈對(duì)抗決策 180
7.4.1 橋牌規(guī)則 180
7.4.2 問題復(fù)雜度分析 181
7.4.3 關(guān)鍵技術(shù)分析 182
7.5 橋牌叫牌AI構(gòu)建 187
7.5.1 橋牌AI研究歷程 187
7.5.2 叫牌AI實(shí)現(xiàn) 188
參考文獻(xiàn) 190
第8章 兵棋智能博弈對(duì)抗決策智能體設(shè)計(jì)192
8.1 引言 192
8.2 面向智能兵棋的多智能體對(duì)抗決策方法 192
8.2.1 兵棋推演基礎(chǔ) 192
8.2.2 問題復(fù)雜度分析 194
8.2.3 關(guān)鍵技術(shù)分析 196
8.3 墨子兵棋AI構(gòu)建 206
8.3.1 兵棋AI研究歷程206
8.3.2 兵棋智能博弈系統(tǒng) 207
8.3.3 兵棋AI實(shí)現(xiàn) 208
參考文獻(xiàn) 212
第9章 智能博弈對(duì)抗元理論 214
9.1 引言 214
9.2 元宇宙:開放式學(xué)習(xí)環(huán)境 214
9.3 元博弈:博弈的博弈理論 217
9.3.1 元博弈理論 217
9.3.2 開放式學(xué)習(xí)框架 218
9.4 元認(rèn)知:認(rèn)知行為框架 218
9.4.1 快與慢 218
9.4.2 元認(rèn)知 219
9.4.3 認(rèn)知行為建模 220
9.5 元學(xué)習(xí):雙層優(yōu)化方法 222
9.5.1 度量學(xué)習(xí)方法 222
9.5.2 分層優(yōu)化方法 223
9.5.3 貝葉斯方法 224
參考文獻(xiàn).224
第10章 智能博弈對(duì)抗前沿應(yīng)用227
10.1 引言.227
10.2 微分博弈與視覺欺騙227
10.2.1 微分博弈 227
10.2.2 視覺欺騙 228
10.3 攻防博弈與復(fù)雜網(wǎng)絡(luò)攻防 232
10.3.1 攻防博弈 232
10.3.2 復(fù)雜網(wǎng)絡(luò)攻防 233
10.4 平均場(chǎng)博弈與無人機(jī)集群對(duì)抗 234
10.4.1 平均場(chǎng)博弈 234
10.4.2 無人機(jī)集群對(duì)抗 235
參考文獻(xiàn) 238