作為一本講解人工神經(jīng)網(wǎng)絡原理的圖書,《深入淺出人工神經(jīng)網(wǎng)絡》旨在讓讀者在短的時間內(nèi)對這些原理知識有一個清晰明了的認識和理解。
《深入淺出人工神經(jīng)網(wǎng)絡》總共分為3部分,總計9章。第1部分講解了人工神經(jīng)網(wǎng)絡的源頭—生物神經(jīng)網(wǎng)絡的基礎知識,第2部分講解了學習人工神經(jīng)網(wǎng)絡的數(shù)學知識,第3部分講解了幾種常見而典型的人工神經(jīng)網(wǎng)絡模型,比如感知器、多層感知器、徑向基函數(shù)神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡等。
《深入淺出人工神經(jīng)網(wǎng)絡》寫作風格簡潔明快,深入淺出,特別適合對人工神經(jīng)網(wǎng)絡/人工智能感興趣的入門級讀者。本書只聚焦原理性知識的講解,不涉及編程實現(xiàn),即使對程序編碼尚不熟悉的讀者也可以輕松閱讀理解。本書還可用作高等院校以及相關培訓機構的教學或參考用書。
中國人工智能學會副理事長焦李成先生推薦
中國信息通信研究院云計算與大數(shù)據(jù)研究所所長 何寶宏博士作序推薦
源自前華為技術專家的集大成之作
人工神經(jīng)網(wǎng)絡的大師級學院派作品
聚焦于原理講解 不涉及編碼實現(xiàn) 旨在傳授純粹的人工神經(jīng)網(wǎng)絡知識
近年來,人工神經(jīng)網(wǎng)絡又一次成為了人工智能領域的研究熱點。隨著研究工作的不斷深入,人工神經(jīng)網(wǎng)絡在圖像識別、語音識別、自動語言處理、自動控制、數(shù)據(jù)挖掘、預測估計以及生物、醫(yī)學、經(jīng)濟等領域取得了越來越多令人驚嘆的成功應用。
本書采用了淺顯易懂、簡潔明快的風格來講解人工神經(jīng)網(wǎng)絡的原理性知識,其內(nèi)容涵蓋了生物神經(jīng)元的基礎知識、關鍵的數(shù)學知識點,以及多種常見而典型的人工神經(jīng)網(wǎng)絡模型,如感知器(Perceptron)、多層感知器(MLP)、徑向基函數(shù)神經(jīng)網(wǎng)絡(RBFNN)、卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)等。
本書旨在讓讀者在短時間內(nèi)對人工神經(jīng)網(wǎng)絡的工作原理有一個清晰明了的認識和理解。本書只聚焦原理性知識的講解,不涉及編程實現(xiàn),即使對程序編碼尚不熟悉的讀者也可以輕松閱讀理解。
江永紅博士,生于1965年,1981~1985年就讀于四川大學無線電電子學專業(yè),獲學士學位;1985~1988年就讀于中國空間技術研究院通信與電子系統(tǒng)專業(yè),獲碩士學位;1988~1992年就讀于西安電子科技大學通信與電子系統(tǒng)專業(yè),獲博士學位,主要研究人工神經(jīng)網(wǎng)絡在模糊控制系統(tǒng)中的應用;1992~1995年于華南理工大學進行博士后研究工作,其間申請并主持了國家自然科學基金項目“基于神經(jīng)網(wǎng)絡的譜估計方法”。
20世紀90年代中后期,江永紅博士于新西蘭梅西大學開設并講授人工神經(jīng)網(wǎng)絡課程。20世紀90年代末期,入職華為技術有限公司,長期從事技術研發(fā)及培訓工作,曾擔任華為HCIE面試主考官,以及華為ICT技術認證系列書籍的審稿人。
在他編寫的《HCNA網(wǎng)絡技術學習指南》一書中,華為全球培訓與認證部部長這樣評價:“江永紅博士在華為工作近20年,現(xiàn)為華為技術專家,且之前于國內(nèi)外高校從事過多年的教學工作,對于知識的學習及傳授方法有著深刻的領悟……”
江永紅博士目前為YESLAB講師,專門致力于人工神經(jīng)網(wǎng)絡、深度學習原理及應用的教學活動和知識普及工作。
第 1章 背景知識 1
1.1 什么是智能 / 1
1.2 大腦與神經(jīng)元 / 2
1.3 關于人工智能/機器學習/神經(jīng)網(wǎng)絡/深度學習 / 7
第 2章 函數(shù) 10
2.1 函數(shù)的極限 / 10
2.2 函數(shù)的連續(xù)性 / 13
2.3 導數(shù) / 14
2.4 凹凸性與拐點 / 21
2.5 極值與駐點 / 23
2.6 曲率 / 25
2.7 二元函數(shù) / 27
第3章 梯度 34
3.1 矢量的概念 / 34
3.2 矢量的運算 / 35
3.3 矢量與坐標 / 37
3.4 方向角與方向余弦 / 39
3.5 矢量的數(shù)量積 / 40
3.6 函數(shù)的梯度 / 42
第4章 矩陣 50
4.1 矩陣的概念及運算 / 50
4.2 矩陣的初等變換 / 54
4.3 矢量的矩陣表示法 / 57
4.4 矩陣的秩 / 58
4.5 矩陣的逆 / 63
4.6 從標量函數(shù)到矩陣函數(shù) / 69
第5章 MCP模型及感知器(Perceptron) 80
5.1 MCP模型 / 80
5.2 模式識別初探 / 84
5.3 感知器 / 88
5.4 凸集與單層感知器 / 94
5.5 XOR問題 / 98
第6章 多層感知器(MLP) 100
6.1 縱向串接 / 100
6.2 MLP的基本架構 / 102
6.3 BP算法 / 108
6.4 梯度下降法 / 120
6.5 極小值問題 / 121
6.6 學習率 / 123
6.7 批量訓練 / 125
6.8 欠擬合與過擬合 / 127
6.9 容量 / 128
6.10 拓撲 / 130
6.11 收斂曲線 / 132
6.12 訓練樣本集 / 133
6.13 權值連接方式 / 135
第7章 徑向基函數(shù)神經(jīng)網(wǎng)絡(RBFNN) 137
7.1 插值的概念 / 137
7.2 RBF / 141
7.3 從精確插值到RBFNN / 148
7.4 Cover定理 / 151
7.5 空間分割問題 / 154
7.6 訓練策略 / 156
第8章 卷積神經(jīng)網(wǎng)絡(CNN) 157
8.1 卷積運算與相關運算 / 157
8.2 卷積核與特征映射圖 / 188
8.3 CNN的一般結構 / 195
8.4 三種思想 / 207
8.5 邊界策略 / 209
8.6 池化 / 211
8.7 CNN網(wǎng)絡實例 / 214
8.8 Hubel-Wiesel實驗 / 225
第9章 循環(huán)神經(jīng)網(wǎng)絡(RNN) 228
9.1 N-Gram模型 / 228
9.2 RNN示例 / 232
9.3 單向RNN / 237
9.4 BPTT算法 / 240
9.5 填空問題 / 255
9.6 雙向RNN / 263
9.7 梯度爆炸與梯度消失 / 265
9.8 LSTM / 269
結束語 278