迭代學(xué)習(xí)控制——一種優(yōu)化方法
本書主要介紹范數(shù)優(yōu)化迭代學(xué)習(xí)控制的基本理論和最新進(jìn)展。全書內(nèi)容分14章,系統(tǒng)地介紹了迭代學(xué)習(xí)控制的基本思想和理論體系,并對(duì)基于逆模型的迭代學(xué)習(xí)控制、范數(shù)優(yōu)化迭代學(xué)習(xí)控制、參數(shù)優(yōu)化迭代學(xué)習(xí)控制、基于逐次投影的迭代學(xué)習(xí)控制等迭代學(xué)習(xí)控制的最新研究成果進(jìn)行了詳細(xì)的闡述。本書也是Owens院士關(guān)于其在優(yōu)化迭代學(xué)習(xí)領(lǐng)域中長(zhǎng)期的研究結(jié)果的凝練和總結(jié)。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
譯者序
叢書序
前言
致謝
第1章 緒論 1
1.1控制系統(tǒng)、模型和算法 1
1.2 重復(fù)和法代 2
1.2.1 周期性參考信號(hào) 3
1.2.2 重復(fù)控制和多通道系統(tǒng) 3
1.2.3 迭代學(xué)習(xí)控制 4
1.3 迭代的動(dòng)態(tài)特性:概念回顧 7
1.4 預(yù)備知識(shí)的需求 9
1.4.1 數(shù)學(xué)知識(shí)綜述 10
1.4.2 算法的概念基礎(chǔ) 11
1.5 討論和擴(kuò)展閱讀 12
第2章 戴學(xué)方法 14
2.1 矩陣元素的理論 14
2.2 二次最優(yōu)和二次型 21
2.2.1 配方 21
2.2.2 奇異值、拉格朗日方法和矩陣范數(shù) 22
2.3 Banach空間、算子、范數(shù)和收斂序列 23
2.3.1 向量壁間 23
2.3.2 范數(shù)空間 25
2.3.3 收斂性、閉包、完備性和Banach 空間 26
2.3.4 線性算子和稠密子集 27
2.4 Hilbert 空間 30
2.4.1 內(nèi)積和范數(shù) 30
2.4.2 范數(shù)和弱收斂 31
2.4.3 H山田空間上的伴隨和自伴隨算子 33
2.5 實(shí)Hilbert 空間、凸集和投影 38
2.6 Hilbert 空間上的最優(yōu)控制 40
2.6.1 通過配方法證明 41
2.6.2 使用映射定理證明 42
2.6.3 討論 43
2.7 進(jìn)一步討論和參考書目 44
第3章 狀態(tài)空間模型45
3.1 連續(xù)狀態(tài)空間系統(tǒng)模型 46
3.1.1 狀態(tài)方程的解 47
3 1.2 卷積算子和脈沖響應(yīng) 48
3 1.3 系統(tǒng)作為函數(shù)空間之間的算子 48
3.2 拉普拉斯變換 49
3.3 傳遞函數(shù)矩陣、極點(diǎn)、零點(diǎn)和相對(duì)階 50
3.4系統(tǒng)的頻率響應(yīng) 51
3.5 離散時(shí)間、采樣數(shù)據(jù)狀態(tài)空間模型 52
3.5.1 用差分方程表示的狀態(tài)空間模型 52
3.5.2 線性離散時(shí)間狀態(tài)方程的解 53
3.5.3 離散卷積算子和離散沖激響應(yīng)序列 54
3.6 !F 變換和離散傳遞函數(shù)矩陣 55
3.6.1 離散傳遞函數(shù)矩陣、極點(diǎn)、零點(diǎn)和相對(duì)階 56
3.6.2 離散系統(tǒng)的頻域響應(yīng) 57
3.7 多速率離散時(shí)間系統(tǒng) 57
3.8 能控性、能觀性、最小實(shí)現(xiàn)和極點(diǎn)配置 58
3.9 逆系統(tǒng) 59
3.9.1 m=l、零點(diǎn)和f 的情況 59
3.9.2 當(dāng)m#l 時(shí)的左逆和右逆 61
3.10 線性連續(xù)系統(tǒng)的二次最優(yōu)控制 62
3.10.1 相關(guān)算子和空間 63
3.10.2 伴隨算子的計(jì)算 64
3.10.3 兩點(diǎn)邊值問題 66
3.10.4 Ric四川方程和狀態(tài)前饋加反饋的描述 67
3.10.5 另一種Rlccati 描述 69
3.11 擴(kuò)展閱讀和參考書目 70
第4章 矩陣模型、超向量和離散系統(tǒng) 72
4.1 超向量和矩陣模型 72
4.2 串聯(lián)和并聯(lián)代數(shù) 73
4.3 轉(zhuǎn)置系統(tǒng)和時(shí)間反轉(zhuǎn) 74
4.4可逆性、值域和相對(duì)階 75
4.4.1 相對(duì)階、核和G 的值域 76
4.4.2 G 的值域和解藕理論 77
4.5 值域、核及逆系統(tǒng)的使用 79
4.5.1 逆的劃分 80
4.5.2 P-1(z)的保穩(wěn)定性 81
4.6 值域、核和鏟規(guī)范型 82
4.6.1 使用狀態(tài)反饋和輸出注入的分解 82
4.6.2 鏟規(guī)范型 83
4.6.3 一致秩系統(tǒng)的特殊情況 85
4.7 線性離散系統(tǒng)的二次最優(yōu)控制 86
4.7.1 伴隨和離散兩點(diǎn)邊界值問題 87
4.7.2 狀態(tài)反饋/前饋解 88
4.8 頻域關(guān)系 89
4.8.1 有限區(qū)間的邊界范數(shù) 90
4.8.2 用頻率響應(yīng)計(jì)算范數(shù) 91
4.8.3 二次型和正實(shí)傳遞函數(shù)矩陣 92
4.8.4 依賴頻率的下界 94
4.9 討論和擴(kuò)展閱讀 97
第5章 迭代學(xué)習(xí)控制的構(gòu)建 99
5.1 設(shè)計(jì)問題的抽象構(gòu)建 99
5.1.1 設(shè)計(jì)問題 99
5.1.2 輸入和誤差更新公式2 線性系統(tǒng) 102
5.1.3 魯棒性和不確定模型 103
5.2 線性迭代收斂的一般性條件 106
5.2.1 譜半徑和范數(shù)條件 107
5.2.2 無限維空間內(nèi)r(L) = IILII = 1 和L=L* 的情況 109
5.2.3 松弛條件、收斂性和魯棒性 111
5.2.4特征值分析 114
5.2.5 特征值和特征函數(shù)的計(jì)算方法 115
5.3 魯棒性、正定性和逆系統(tǒng) 117
5.4討論和擴(kuò)展閱讀 119
第6章 逆模型控制算法 121
6.1 逆模型控制z 基本算法 121
6.1.1 系統(tǒng)矩陣的右逆 121
6 1.2 系統(tǒng)矩陣的左逆 122
6 1.3 逆模型的重要性 124
6 1.4 狀態(tài)空間的逆模型算法 125
6 1.5 魯棒性測(cè)試和乘性誤差模型 126
6.2 頻域內(nèi)的魯棒性判據(jù) 129
6.2.1 離散系統(tǒng)單調(diào)魯棒性測(cè)試 129
6.2.2 改善魯棒性·松弛 131
6.2.3 離散系統(tǒng)z 魯棒性和非單調(diào)收斂性 132
6.3 討論和擴(kuò)展閱讀 134
第7章 梯庭算法及其單調(diào)性 136
7.1 最速下降算法z 能量最優(yōu)的方法 137
7.2 在離散狀態(tài)空間系統(tǒng)中的應(yīng)用 138
7.2.1 算法構(gòu)建 139
7.2.2 特征結(jié)構(gòu)解釋2 有限次選代的收斂性 140
7.2.3 頻域衰減 143
7.3 針對(duì)連續(xù)狀態(tài)空間系統(tǒng)的最速下降算法 146
7.4廣義梯度算法的單調(diào)性 148
7.5 再解離散狀態(tài)空間模型 151
7.5.1 基于伴隨系統(tǒng)的梯度算法 151
7.5.2 設(shè)計(jì)中m=l 的情況具有重要作用 159
7.5.3 魯棒性的頻域判據(jù) 160
7.5.4 魯棒性和松弛條件 163
7.5.5 非單調(diào)性梯度控制和ε權(quán)重范數(shù) 163
7.5.6 基于E 范數(shù)的最速下降法 167
7.6 討論、解釋和進(jìn)一步推廣 168
7.6.1 控制思想的融合 168
7.6.2 性能分析 170
7.6.3 對(duì)連續(xù)狀態(tài)空間系統(tǒng)的進(jìn)一步分析 170
第8章 逆模型和梯度法融合設(shè)計(jì) 172
8.1 逆模型算法z 魯棒性和雙向?yàn)V波器 172
8.2 設(shè)計(jì)中的一般性問題 175
8.2.1 模型預(yù)處理 176
8.2.2 補(bǔ)償模型 178
8.2.3 穩(wěn)定逆算法 179
8.2.4 全聯(lián)通網(wǎng)絡(luò)和非最小相位系統(tǒng) 180
8.3 梯度、補(bǔ)償和反饋設(shè)計(jì)方法 186
8.3.1 反饋設(shè)計(jì)法:離散系統(tǒng) 187
8.3.2 反饋設(shè)計(jì):連續(xù)系統(tǒng) 188
8.4 t寸論和擴(kuò)展閱讀 189
第9章 范數(shù)優(yōu)化迭代學(xué)習(xí)控制 191
9.1 問題和算法的公式化描述 191
9.1.1 目標(biāo)函數(shù)的選擇 192
9 1.2 松弛的NOILC 194
9 1.3 離散狀態(tài)空間系統(tǒng)的NOILC 195
9 1.4 離散狀態(tài)空間方程的松弛NOILC 197
9 1.5 頻率衰減的解釋:離散情況 198
9 1.6 NOILC,連續(xù)狀態(tài)空間方程 198
9 1.7 收斂性、特征結(jié)構(gòu)、♂和頻譜帶寬 200
9 1.8 收斂性, NOILC 的通用特性 203
9.2 NOILC 的魯棒性z 前饋實(shí)現(xiàn) 207
9.2.1 前饋NOILC 的計(jì)算過程 208
9.2.2 右乘模型誤差 209
9.2.3 帶右乘性誤差的離散狀態(tài)空間系統(tǒng) 213
9.2.4 左乘模型誤差 216
9.2.5 帶左乘模型誤差的離散系統(tǒng) 220
9.2.6 空間中范數(shù)的單調(diào)性 221
9.3 非最小相位特性和偽極限 222
9.4討論和擴(kuò)展閱讀 224
9.4.1 關(guān)于背景 224
9.4.2 實(shí)際問題 224
9.4.3 性能 225
9.4.4 魯棒性和逆算法 225
9.4.5 選擇不同的方案 226
9.4.6 Q 、R 和并矢展開 227
第10章 NOILC 的擴(kuò)展 228
10.1 基于輸入和誤差權(quán)重的濾波器 228
10.2 多速率采樣離散系統(tǒng) 229
10.3 視初始條件為控制輸入 230
10.4 多目標(biāo)問題 234
10.5 內(nèi)點(diǎn)問題 235
10.5.1 連續(xù)系統(tǒng)2 內(nèi)點(diǎn)問題 236
10.5.2 離散系統(tǒng)z 內(nèi)點(diǎn)問題 239
10.5.3 IPNOILC魯棒性和其他問題 240
10.6 多任務(wù)NOILC 242
10.6.1 連續(xù)狀態(tài)空間系統(tǒng) 242
10.6.2 將初始條件作為控制量 247
10.6.3 離散狀態(tài)壁間系統(tǒng) 248
10.7 多模型和預(yù)測(cè)NOILC 248
10.7.1 預(yù)測(cè)NOILC-一一基本理論和與逆模型算法的聯(lián)系 249
10.7.2 多模型系統(tǒng) 251
10.7.3 線性狀態(tài)空間模型 252
10.7.4 收斂性和其他特性 254
10.7.5 特殊情況, M=2 和M=∞ 259
10.7.6 前饋預(yù)測(cè)NOILC 的魯棒性 261
10.8 討論和擴(kuò)展閱讀 264
第11章 迭代與輔助優(yōu)化 267
1 1.1含輔助變量的模型及問題描述 267
1 1.2 右逆模型解 269
1 1.3 采用切換算法的解 270
11.3.1 切換算法 270
11.3.2 切換算法的特性 271
11.3.3 收斂率的特性 274
11.3.4 NOILC的解糯最小能量表示 275
11.3.5 Gl = G時(shí)的內(nèi)點(diǎn)跟蹤 276
11.3.6 通過選擇Gl =Ge重構(gòu)NOILC 譜 277
1 1.4 魯棒切換算法的注解 279
11.5 GeG: 可逆時(shí)的切換算法 282
1 1.6 討論及擴(kuò)展閱讀 284
第12章 迭代和逐次投影 286
12.1 收斂性和鄰近性 286
12.2 逐次投影和鄰近算法 287
12.3 帶約束的法代控制 292
12.3.1 帶輸入約束的NOILC 293
12.3.2 一般性分析 295
12.3.3 帶有輸入和輸出限制的內(nèi)點(diǎn)控制 298
12.3.4滿足輔助變量約束的迭代控制 301
12.3.5 概述和總結(jié) 302
12.4操作員介入的"迭代管理" 302
12.5 如果馬和島不相交會(huì)如何 305
12.6 討論和深入閱讀 308
第13章 加速和逐次投影 310
13.1 通過離線法代替換系統(tǒng)法代 310
13.2 利用外推的加速算法311
13.2.1 逐次投影和外推算法 311
13.2.2 NOILC ,使用外推的加速 314
13.3 使用參數(shù)化集合的陷波算法 315
13.3.1 創(chuàng)建譜陷波:計(jì)算和性質(zhì) 315
13.3.2 陷波算法和使用逐次投影的法代控制 321
13.3.3 離散狀態(tài)空間系統(tǒng)的陷波算法 323
13.3.4 前饋形式的陷波算法的魯棒性 326
13.4討論和擴(kuò)展閱讀 330
第14章 參政優(yōu)化迭代控制 332
14.1 參數(shù)化和范數(shù)最優(yōu)迭代 332
14.2 參數(shù)最優(yōu)控制z 單參數(shù)情況 336
14.2.1 各選目標(biāo)函數(shù) 336
14.2.2 問題定義和收斂特性 338
14.2.3 參數(shù)對(duì)收斂性的影響 340
14.2.4 補(bǔ)償器的選擇 341
14.2.5 叫河馬]的計(jì)算E 離散狀態(tài)空間系統(tǒng) 343
14.2.6 J(β) 中參數(shù)的選擇 345
14.2.7 送代過程 346
14.2.8 高原/平臺(tái)效應(yīng) 346
14.2.9 交換算法 350
14.3 POILC 的魯棒性z 單參數(shù)情況 354
14.3.1 使用右逆分析魯棒性 354
14.3.2 魯棒性z 更一般的情形 356
14.4 多參數(shù)學(xué)習(xí)控制 357
14.4.1 參數(shù)化形式 357
14.4.2 Or和目標(biāo)函數(shù)的替代形式 358
14.4.3 多參數(shù)POILC 算法 360
14.4.4 多參數(shù)的參數(shù)化 362
14.5 討論和擴(kuò)展閱讀 364
14.5.1本章小結(jié) 364
14.5.2 高階POILC,簡(jiǎn)要概述 365
參考文獻(xiàn) 366