生成對(duì)抗網(wǎng)絡(luò):原理及圖像處理應(yīng)用
定 價(jià):109 元
叢書名:人工智能前沿理論與技術(shù)應(yīng)用叢書
- 作者:朱秀昌
- 出版時(shí)間:2022/8/1
- ISBN:9787121439551
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP181
- 頁(yè)碼:280
- 紙張:
- 版次:01
- 開本:16開
本書深入淺出地介紹了近年來(lái)AI領(lǐng)域中十分引人注目的新型人工神經(jīng)網(wǎng)絡(luò)——生成對(duì)抗網(wǎng)絡(luò)(GAN)的基本原理、網(wǎng)絡(luò)結(jié)構(gòu)及其在圖像處理領(lǐng)域中的應(yīng)用;同時(shí),分析了近年來(lái)在GAN訓(xùn)練、GAN質(zhì)量評(píng)估及多種改進(jìn)型GAN方面取得的進(jìn)展;在實(shí)踐方面,給出了基于Python的基本GAN編程實(shí)例。另外,本書還介紹了支撐GAN模型的基礎(chǔ)理論和相關(guān)算法,以使讀者更好地理解和掌握GAN技術(shù)。
朱秀昌,男,1947年生,碩士,江蘇丹徒人。曾任南京郵電大學(xué)通信與信息工程學(xué)院教授,博士生導(dǎo)師,"江蘇省圖像處理與圖像通信重點(diǎn)實(shí)驗(yàn)室”主任。長(zhǎng)期從事圖像和多媒體通信方面的科研和教學(xué)工作。曾主持完成了多項(xiàng)國(guó)家、省部級(jí)科研項(xiàng)目,主講了多門本科生和研究生的專業(yè)課程。先后在5個(gè)出版社編著出版了"數(shù)字圖像處理與圖像通信”等書籍17本,發(fā)表專業(yè)技術(shù)論文160余篇。
第1章 緒論 1
1.1 從圖像處理到數(shù)字視覺(jué) 2
1.1.1 數(shù)字圖像技術(shù) 3
1.1.2 數(shù)字視覺(jué)技術(shù) 5
1.1.3 數(shù)字視覺(jué)的應(yīng)用 7
1.2 神經(jīng)網(wǎng)絡(luò)由淺入深 10
1.2.1 神經(jīng)網(wǎng)絡(luò)的發(fā)展 10
1.2.2 深度神經(jīng)網(wǎng)絡(luò) 11
1.2.3 深度學(xué)習(xí)的進(jìn)展 12
1.3 從概率生成到對(duì)抗生成 13
1.3.1 概率生成模型 14
1.3.2 概率分布比較 16
1.3.3 對(duì)抗生成模型 16
1.4 GAN的應(yīng)用 18
1.4.1 在圖像領(lǐng)域中的應(yīng)用 18
1.4.2 在其他領(lǐng)域中的應(yīng)用 20
第2章 數(shù)字圖像處理 22
2.1 數(shù)字圖像基礎(chǔ) 22
2.1.1 圖像的數(shù)學(xué)表示 22
2.1.2 圖像的數(shù)字化 23
2.1.3 數(shù)字圖像的表示 26
2.1.4 圖像的分辨率 28
2.2 傳統(tǒng)數(shù)字圖像處理 30
2.2.1 圖像采集和壓縮 30
2.2.2 圖像去噪和濾波 31
2.2.3 圖像增強(qiáng)和復(fù)原 32
2.2.4 圖像分割 33
2.2.5 圖像特征提取和目標(biāo)檢測(cè) 34
2.2.6 圖像變換和超分辨率重建 35
2.3 ANN圖像處理 36
2.3.1 圖像分類 36
2.3.2 目標(biāo)檢測(cè)與跟蹤 37
2.3.3 語(yǔ)義分割和實(shí)例分割 39
2.3.4 圖像生成 40
2.4 常用的圖像數(shù)據(jù)集 43
第3章 人工神經(jīng)網(wǎng)絡(luò) 49
3.1 ANN簡(jiǎn)介 49
3.1.1 從生物到人工神經(jīng)元 50
3.1.2 從感知機(jī)到神經(jīng)網(wǎng)絡(luò) 51
3.1.3 從淺層到深度 54
3.1.4 ANN的特點(diǎn)和應(yīng)用 55
3.2 常見的ANN類型 57
3.2.1 RBF網(wǎng)絡(luò) 57
3.2.2 ART網(wǎng)絡(luò) 58
3.2.3 SOM網(wǎng)絡(luò) 59
3.2.4 波爾茲曼機(jī) 59
3.2.5 級(jí)聯(lián)相關(guān)網(wǎng)絡(luò) 61
3.3 ANN的關(guān)鍵技術(shù) 62
3.3.1 網(wǎng)絡(luò)類型 62
3.3.2 網(wǎng)絡(luò)訓(xùn)練 62
3.3.3 激活函數(shù) 64
3.3.4 驗(yàn)證和泛化 65
3.4 BP算法 66
3.4.1 數(shù)據(jù)的正向傳播 67
3.4.2 誤差的反向傳播 68
3.4.3 BP算法流程 70
3.4.4 BP算法的幾個(gè)問(wèn)題 70
3.5 ANN的學(xué)習(xí)方式 71
3.5.1 有監(jiān)督學(xué)習(xí) 71
3.5.2 無(wú)監(jiān)督學(xué)習(xí) 72
3.5.3 半監(jiān)督學(xué)習(xí) 72
3.5.4 強(qiáng)化學(xué)習(xí) 73
第4章 GAN中常用的ANN 74
4.1 卷積神經(jīng)網(wǎng)絡(luò) 74
4.1.1 CNN的結(jié)構(gòu) 75
4.1.2 CNN的核心技術(shù) 76
4.1.3 CNN的訓(xùn)練和改進(jìn) 79
4.1.4 CNN一例 80
4.1.5 圖像卷積 81
4.2 循環(huán)神經(jīng)網(wǎng)絡(luò) 84
4.2.1 RNN的結(jié)構(gòu) 85
4.2.2 RNN與CNN的比較 85
4.3 變分自編碼器 86
4.3.1 自編碼器 86
4.3.2 VAE概述 87
4.4 深度殘差網(wǎng)絡(luò) 91
4.4.1 深度網(wǎng)絡(luò)的困境 91
4.4.2 殘差塊結(jié)構(gòu) 92
4.4.3 殘差塊的作用 92
4.4.4 ResNet的誤差反傳 93
第5章 相關(guān)算法 96
5.1 和圖像處理有關(guān)的算法 96
5.1.1 分類算法 96
5.1.2 聚類算法 104
5.1.3 降維算法 106
5.1.4 遷移學(xué)習(xí) 113
5.1.5 馬爾可夫鏈和HMM 115
5.2 和函數(shù)優(yōu)化有關(guān)的算法 120
5.2.1 最小二乘法 120
5.2.2 梯度下降法 121
5.2.3 EM算法 125
第6章 GAN基礎(chǔ) 129
6.1 GAN概要 130
6.1.1 GAN的數(shù)據(jù)生成 130
6.1.2 GAN的網(wǎng)絡(luò)結(jié)構(gòu) 133
6.1.3 GAN的優(yōu)勢(shì)和不足 137
6.2 數(shù)據(jù)分布及其轉(zhuǎn)換 139
6.2.1 圖像數(shù)據(jù)的高維分布 139
6.2.2 隱變量和隱空間 141
6.2.3 分布函數(shù)的轉(zhuǎn)換 143
6.3 生成模型與判別模型 145
6.3.1 生成模型 145
6.3.2 判別模型 149
6.3.3 生成模型和判別模型的關(guān)系 150
6.4 GAN的工作過(guò)程 152
6.4.1 納什均衡 153
6.4.2 對(duì)抗訓(xùn)練 154
6.4.3 訓(xùn)練流程 157
第7章 GAN的目標(biāo)函數(shù) 160
7.1 數(shù)據(jù)的信息熵 161
7.1.1 隨機(jī)變量 161
7.1.2 信息量和信息熵 164
7.1.3 交叉熵 166
7.2 數(shù)據(jù)分布的差異:散度 168
7.2.1 KL散度 168
7.2.2 JS散度 169
7.2.3 f散度 169
7.3 GAN目標(biāo)函數(shù)及其優(yōu)化 171
7.3.1 目標(biāo)函數(shù) 171
7.3.2 判別器優(yōu)化 178
7.3.3 生成器優(yōu)化 180
第8章 GAN的訓(xùn)練 182
8.1 GAN訓(xùn)練中常見的問(wèn)題 183
8.1.1 收斂不穩(wěn)定問(wèn)題 183
8.1.2 梯度消失問(wèn)題 184
8.1.3 模式崩潰問(wèn)題 189
8.2 提升GAN訓(xùn)練的穩(wěn)定性 192
8.2.1 選擇恰當(dāng)?shù)木W(wǎng)絡(luò)模型 192
8.2.2 選擇恰當(dāng)?shù)哪繕?biāo)函數(shù) 194
8.2.3 選擇恰當(dāng)?shù)膬?yōu)化算法 196
8.3 GAN訓(xùn)練中的常用技巧 198
8.3.1 數(shù)據(jù)規(guī)范化 198
8.3.2 學(xué)習(xí)率衰減 199
8.3.3 丟棄技術(shù) 200
8.3.4 批量規(guī)范化 203
8.3.5 激活函數(shù)的選擇 203
第9章 GAN的改進(jìn) 206
9.1 GAN的改進(jìn)之路 207
9.2 C GAN和info GAN 207
9.2.1 C GAN 207
9.2.2 info GAN 209
9.3 DC GAN 211
9.4 W GAN 213
9.5 Big GAN 214
第10章 GAN的圖像處理應(yīng)用 217
10.1 圖像生成 218
10.1.1 圖像生成的三種方式 218
10.1.2 幾種特殊的圖像生成 221
10.2 圖像超分辨率重建 221
10.3 圖像修復(fù) 222
10.4 圖像翻譯 224
10.4.1 圖像至圖像的翻譯 224
10.4.2 文本至圖像的翻譯 225
10.5 圖像風(fēng)格遷移 226
10.6 視頻預(yù)測(cè) 227
第11章 GAN的Python編程 228
11.1 Python編程語(yǔ)言 228
11.1.1 Python簡(jiǎn)介 228
11.1.2 Python的特點(diǎn) 230
11.1.3 Python的應(yīng)用 232
11.2 常見的Python集成開發(fā)環(huán)境 233
11.3 深度學(xué)習(xí)框架 235
11.3.1 主流的深度學(xué)習(xí)框架 235
11.3.2 主流學(xué)習(xí)框架的比較 237
11.4 TensorFlow中的GAN編程 238
11.4.1 張量和張量流 239
11.4.2 Python的TensorFlow庫(kù) 242
11.4.3 TensorFlow的常用模塊 243
第12章 GAN圖像處理實(shí)例 245
12.1 1維GAN編程 245
12.1.1 1維GAN小程序 246
12.1.2 數(shù)據(jù)對(duì)齊 248
12.1.3 訓(xùn)練中的幾個(gè)問(wèn)題 249
12.2 MNIST手寫數(shù)字的生成 249
12.2.1 GAN模型的訓(xùn)練程序 250
12.2.2 GAN模型的生成程序 254
12.2.3 訓(xùn)練程序的圖解 256
12.2.4 生成程序的圖解 257