本書系統(tǒng)地闡述了無人作戰(zhàn)飛機自主空戰(zhàn)技術的應用背景、空戰(zhàn)幾何關系及UCAV平臺模型構建、典型空空導彈可發(fā)射區(qū)建模、基于 BO-Bi-LSTM 的目標多步軌跡預測、基于典型戰(zhàn)術機動動作的機動軌跡規(guī)劃方法、中遠距自主空戰(zhàn)機動占位決策以及基于深度強化學習的離線機動決策學習方法等內(nèi)容。本書可供武器系統(tǒng)與運用工程、無人飛行器作戰(zhàn)系統(tǒng)與技術及相關專業(yè)本科高年級學生和研究生學習參考,同時也適合從事無人飛行器設計、無人作戰(zhàn)飛機戰(zhàn)術戰(zhàn)法研究等方面的人員參考。
●第1章無人作戰(zhàn)飛機自主空戰(zhàn)技術綜述
1.1無人作戰(zhàn)飛機自主空戰(zhàn)的應用背景和需求性分析
1.2無人作戰(zhàn)飛機自主空戰(zhàn)方法綜述
1.2.1軌跡預測方法研究現(xiàn)狀
1.2.2近距空戰(zhàn)機動決策方法研究現(xiàn)狀
1.2.3中遠距空戰(zhàn)機動決策方法研究現(xiàn)狀
1.3相關問題與重要理論
1.3.1空空導彈可發(fā)射區(qū)解算問題
1.3.2空戰(zhàn)試探機動決策問題
1.3.3深度強化學習
第2章空戰(zhàn)幾何關系及UCAV平臺模型構建
2.1空戰(zhàn)幾何關系分析
2.1.1航向夾角、方位角和距離
2.1.2基于空戰(zhàn)幾何關系的態(tài)勢分析
2.1.3攻擊幾何學
2.2無人作戰(zhàn)飛機模型及參數(shù)擬合
2.2.1無人作戰(zhàn)飛機平臺模型
2.2.2升力模型與阻力模型
2.2.3推力模型
2.2.4飛行包線及約束
2.3本章小結
第3章典型空空導彈可發(fā)射區(qū)建模
3.1導彈可發(fā)射問題的解算原理
3.2基于追逃對抗策略的目標機動預估系統(tǒng)構建
3.2.1目標機平臺質(zhì)點模型
3.2.2目標機動庫構建
3.2.3逃逸機動評價函數(shù)設計
3.2.4基于統(tǒng)計學原理的逃逸機動決策方法
3.3多約束條件下空空導彈運動動力學建模
3.3.1空空導彈運動動力學模型
3.3.2導彈導引控制模型
3.3.3導彈性能約束條件分析
3.4基于黃金分割搜索算法的可發(fā)射邊界求解策略
3.4.1黃金分割策略的解算原理
3.4.2黃金分割策略的簡要改進辦法
3.5模型驗證與仿真分析
3.6本章小結
第4章基于BO-Bi-LSTM的目標多步軌跡預測
4.1在線滾動預測理論
4.1.1KNNImputer算法用于缺失數(shù)據(jù)填充
4.1.2在線滾動遞歸預測
4.1.3dropout層
4.2BO-Bi-LSTM多步軌跡預測
4.2.1LSTM及Bi-LSTM網(wǎng)絡
4.2.2貝葉斯自動優(yōu)化網(wǎng)絡超參數(shù)
4.2.3滑動窗口長度確定
4.3仿真實驗與分析
4.3.1第一段軌跡
4.3.2第二段軌跡
4.3.3網(wǎng)絡超參數(shù)優(yōu)化結果
4.4本章小結
第5章基于典型戰(zhàn)術機動動作的機動軌跡規(guī)劃方法
5.1UCAV試探機動決策系統(tǒng)的構建原理
5.2UCAV試探機動決策系統(tǒng)的構建
5.2.1多約束條件下UCAV運動動力學建模
5.2.2UCAV試探機動控制量優(yōu)化設計
5.3空戰(zhàn)機動決策評價函數(shù)構建
5.3.1空戰(zhàn)過程中的相對位置關系表述
5.3.2角度決策因子評價函數(shù)
5.3.3距離決策因子評價函數(shù)
5.3.4能量決策因子評價函數(shù)
5.3.5機動決策整體評價函數(shù)
5.4基于導彈攻擊狀態(tài)評估的權重因子分級模型
5.5模型驗證與仿真分析
5.5.1仿真1:包含決策過程的智能體UCAV對抗非智能體目標
5.5.2仿真2:含評估過程的智能體UCAV對抗不含評估過程的智能體目標
5.6本章小結
第6章中遠距自主空戰(zhàn)機動占位決策
6.1多普勒雷達探測原理
6.1.1最小可檢測信號
6.1.2檢測概率
6.2中遠距雷達探測區(qū)及盲區(qū)建模
6.2.1相控陣雷達探測遠邊界建模
6.2.2多普勒雷達探測盲區(qū)建模
6.2.3輻射方向圖仿真
6.2.4相控陣雷達探測距離仿真
6.2.5雷達盲區(qū)仿真
6.3基于多普勒盲區(qū)的中遠距機動決策
6.3.1決策模式
6.3.2戰(zhàn)術優(yōu)勢適應度函數(shù)
6.3.3態(tài)勢權值
6.4仿真實驗與分析
6.4.1仿真條件設置
6.4.2使用MPC框架下的中遠距機動決策
6.4.3不使用MPC框架下的中遠距機動決策
6.4.4對比總結
6.5本章小結
第7章基于深度強化學習的離線機動決策學習方法
7.1空戰(zhàn)機動決策設計
7.1.1總體思路
7.1.2狀態(tài)轉移更新機制設計
7.1.3獎勵函數(shù)設計
7.2LSTM-PPO算法
7.2.1深度強化學習
7.2.2PPO算法
7.2.3OU隨機噪聲
7.2.4LSTM-PPO算法設計
7.3仿真實驗
7.3.1實驗數(shù)據(jù)處理
7.3.2實驗設計
7.3.3仿真結果分析
7.3.4算法對比分析
7.4本章小結
參考文獻