本書貫穿了信號的獲取、處理、分析和識別整條鏈路所需的關(guān)鍵知識點(diǎn),以聲信號為研究對象,闡述了傳統(tǒng)信號處理、自適應(yīng)信號處理、機(jī)器學(xué)習(xí)等信號處理和智能分析設(shè)計(jì)等知識要點(diǎn)。全書總共16 章,第1~4 章介紹了經(jīng) 典信號處理與分析方法,第5~11 章闡述了先進(jìn)信號處理方法、人工特征的獲取原理和方法,第12~16 章主要說明了深度學(xué)習(xí)、混合模型等智能分析方法。
本書的主要讀者對象為聲信號處理和分析相關(guān)學(xué)科的高校學(xué)生,以及從事聲信號處理的相關(guān)科研工作者。本書對語音信號處理相關(guān)專業(yè)的技術(shù)人員也有一定的參考價(jià)值。本書也適合對智能語音信號分析感興趣的讀者閱讀。
內(nèi)容豐富
本書包括信號采集、處理、分析、識別整條鏈路的關(guān)鍵知識點(diǎn)。
知識系統(tǒng)
本書可幫助從事信號處理相關(guān)研究的科研人員系統(tǒng)地學(xué)習(xí)機(jī)器、算法、模型學(xué)習(xí)相關(guān)知識。
表述新穎
智能分析智能信號處理,人工智能類的書籍偏重機(jī)器學(xué)習(xí)方法,但沒有具體的研究對象。本書概括性地以公式為載體,講述了信號的獲取、處理、分析等關(guān)鍵知識點(diǎn)。
綜合性強(qiáng)
考慮到本科生和研究生的接受能力,筆者已經(jīng)在所在院校開展了相關(guān)知識點(diǎn)的教授,從教授效果來看,學(xué)生很喜歡這門課,基本都能夠掌握關(guān)鍵的知識點(diǎn),對數(shù)理分析、公式的來龍去脈,以及綜合應(yīng)用有詳細(xì)論述,讀者可把握知識框架和綜合應(yīng)用。
潘超
博士,現(xiàn)任西北工業(yè)大學(xué)副教授,主要從事信號信息處理領(lǐng)域的教學(xué)與麥克風(fēng)陣列信號處理、寬帶波束形成、語音增強(qiáng)、聲源分離、聲事件檢測、聲源定位、聲場測量、聲場重構(gòu)等方面的研發(fā)工作。
陳景東
博士,電氣電子工程師學(xué)會會士(IEEE Fellow),先后在日本國際電氣通信基礎(chǔ)技術(shù)研究所、澳大利亞格里菲斯大學(xué)、美國貝爾實(shí)驗(yàn)室等機(jī)構(gòu)任職,F(xiàn)任西北工業(yè)大學(xué)教授,主要從事聲信號處理、陣列信號處理、自適應(yīng)信號處理、模式識別,以及無線通信領(lǐng)域的研發(fā)工作。
第 1 章 信號與系統(tǒng) 1
1.1 信號的表述與分析. 1
1.2 離散處理 . 2
1.3 卷積 2
1.3.1 連續(xù)卷積 . 2
1.3.2 離散卷積 . 3
1.3.3 卷積的重要性質(zhì). 3
1.4 系統(tǒng)的描述 3
1.4.1 物理系統(tǒng) . 4
1.4.2 濾波系統(tǒng) . 4
1.5 抽樣定理 . 4
1.5.1 抽樣的基本準(zhǔn)則. 4
1.5.2 工具①:連續(xù)時(shí)間脈沖串函數(shù)及其傅里葉變換 4
1.5.3 工具②:卷積操作下傅里葉變換的性質(zhì) 5
1.5.4 推導(dǎo):抽樣定理. 6
1.5.5 混疊案例:高頻的信號表現(xiàn)出低頻的行為. 7
1.6 問題 7
第 2 章 離散傅里葉變換. 9
2.1 離散信號的傅里葉變換 9
2.1.1 離散時(shí)間傅里葉變換 . 9
2.1.2 大致思路 . 9
2.1.3 從時(shí)間上離散的信號到時(shí)間上連續(xù)的信號. 10
2.1.4 脈沖串調(diào)制后信號的傅里葉變換 10
2.1.5 離散時(shí)間傅里葉變換 . 10
2.1.6 正交性與反離散時(shí)間傅里葉變換 11
2.2 DTFT 的重要性質(zhì) 11
2.2.1 線性性質(zhì) . 12
2.2.2 時(shí)移性質(zhì) . 12
2.2.3 頻移性質(zhì) . 12
2.2.4 時(shí)域卷積定理 . 12
2.2.5 頻域卷積定理 . 13
2.3 離散傅里葉變換 13
2.3.1 DFT 的定義 13
2.3.2 基函數(shù)的正交性. 14
2.3.3 DFT 的反變換 . 14
2.3.4 簡要總結(jié) . 15
2.4 DFT 簡潔描述. 15
2.5 DFT 的性質(zhì) 16
2.5.1 工具①:周期延拓序列與主值序列 . 16
2.5.2 線性性質(zhì) . 17
2.5.3 時(shí)域循環(huán)移位定理 18
2.5.4 頻域循環(huán)移位定理 18
2.5.5 循環(huán)卷積定理 . 19
2.6 問題 19
第 3 章 Z 變換 . 21
3.1 Z 變換的定義. 21
3.1.1 Z 變換的定義 . 21
3.1.2 正交性 21
3.1.3 反 Z 變換 22
3.2 Z 變換收斂域. 22
3.2.1 有限長序列的收斂域 . 23
3.2.2 右序列的收斂域. 23
3.2.3 左序列的收斂域. 24
3.2.4 雙邊序列的收斂域 24
3.2.5 序列類型與收斂域的總結(jié) 25
3.3 Z 變換的性質(zhì). 26
3.3.1 線性性質(zhì) . 26
3.3.2 時(shí)域卷積定理 . 26
3.3.3 序列移位性質(zhì) . 27
3.3.4 序列乘以指數(shù)序列的性質(zhì) 27
3.3.5 序列乘以 的性質(zhì) 27
3.4 用 Z 變換描述和分析系統(tǒng) 28
3.4.1 零狀態(tài)響應(yīng) 28
3.4.2 系統(tǒng)全響應(yīng) 29
3.4.3 系統(tǒng)的頻率響應(yīng). 29
3.4.4 系統(tǒng)的因果性分析 30
3.4.5 系統(tǒng)的穩(wěn)定性分析 30
3.4.6 特殊系統(tǒng) . 30
3.5 問題 31
第 4 章 頻響濾波器的設(shè)計(jì) . 32
4.1 基本濾波框架. 32
4.1.1 IIR 濾波器 32
4.1.2 FIR 濾波器. 33
4.2 變換域下的濾波系統(tǒng) . 33
4.2.1 Z 域下的濾波系統(tǒng) 33
4.2.2 頻域下的濾波系統(tǒng) 33
4.3 濾波原理 . 34
4.4 IIR 濾波器的設(shè)計(jì) 34
4.4.1 沖激響應(yīng)不變法. 35
4.4.2 雙線性變換法 . 36
4.5 線性相位 FIR 濾波器 . 36
4.5.1 為什么要做線性相位 . 36
4.5.2 系統(tǒng)的時(shí)延量 . 37
4.5.3 利用對稱性約束線性相位 37
4.5.4 偶對稱、偶數(shù)長度濾波器 37
4.5.5 偶對稱、奇數(shù)長度濾波器 38
4.5.6 奇對稱、偶數(shù)長度濾波器 38
4.5.7 奇對稱、奇數(shù)長度濾波器 39
4.6 兩種 FIR 濾波器的設(shè)計(jì)方法 39
4.6.1 頻率采樣法 40
4.6.2 最優(yōu)逼近法 41
4.7 問題 42
第 5 章 自適應(yīng)濾波器的設(shè)計(jì) 43
5.1 信號模型與濾波 43
5.2 誤差與誤差統(tǒng)計(jì)量. 44
5.3 維納濾波器 44
5.3.1 自相關(guān)矩陣 Ryy . 45
5.3.2 互相關(guān)向量 ry 45
5.3.3 維納濾波器 46
5.4 維納濾波分析. 46
5.4.1 正交分解 . 46
5.4.2 輸出信噪比 47
5.4.3 信號畸變 . 48
5.5 卡爾曼濾波 49
5.5.1 狀態(tài)方程與觀測方程 . 49
5.5.2 濾波框架 . 49
5.5.3 雙誤差函數(shù) 50
5.5.4 最優(yōu)濾波器 50
5.6 問題 51
第 6 章 信道 . 52
6.1 信道建模 . 52
6.2 信道的可變性. 53
6.2.1 鏡像源模型 53
6.2.2 隨房間大小的變化 55
6.2.3 隨墻面材質(zhì)變化. 55
6.2.4 隨空間位置變化. 56
6.2.5 隨周圍環(huán)境變化. 56
6.3 信道的頻率選擇性. 56
6.3.1 單信道的頻率選擇性 . 56
6.3.2 多信道的共零點(diǎn)特性 . 57
6.4 信道均衡 . 57
6.5 噪聲對消 . 58
6.6 問題 59
第 7 章 信道估計(jì) 60
7.1 信號模型 . 60
7.1.1 代價(jià)函數(shù) . 61
7.1.2 最速梯度下降算法 61
7.2 LMS 算法與 NLMS 算法 63
7.2.1 LMS 算法 63
7.2.2 收斂性分析 64
7.2.3 NLMS 算法 64
7.3 變換域信道估計(jì)方法 . 65
7.3.1 信號模型 . 65
7.3.2 代價(jià)函數(shù) . 67
7.3.3 兩個(gè)關(guān)鍵的梯度函數(shù) . 67
7.3.4 梯度計(jì)算與信道更新 . 68
7.3.5 Hessian 矩陣求逆的簡化 69
7.4 問題 69
第 8 章 陣列信號處理 70
8.1 波束形成框架. 70
8.2 空間響應(yīng) . 71
8.3 指向性因子和白噪聲增益 . 72
8.3.1 指向性因子 72
8.3.2 白噪聲增益 73
8.3.3 信噪比增益 73
8.4 波束形成器設(shè)計(jì) 75
8.4.1 延遲求和波束形成 75
8.4.2 超指向波束形成. 75
8.4.3 差分波束形成 . 76
8.4.4 正交級數(shù)展開波束形成. 78
8.4.5 自適應(yīng)波束形成. 80
8.5 問題 81
第 9 章 語音信號 82
9.1 語音信號的產(chǎn)生機(jī)理 . 82
9.2 脈沖串模型與信號的基本特征. 83
9.3 自回歸模型 84
9.4 自回歸模型的求解. 84
9.5 問題 88
第 10 章 時(shí)頻域信號分析. 89
10.1 信號分幀處理 89
10.2 PR 條件 90
10.3 典型的窗函數(shù) 91
10.4 問題 . 94
第 11 章 MFCC 特征 95
11.1 人耳的聽覺機(jī)理 . 95
11.2 濾波器組. 96
11.2.1 1 倍頻程 96
3
11.2.2 梅爾頻率 96
11.2.3 等效矩形帶寬 97
11.2.4 伽馬通(Gammatone)濾波器組 . 97
11.3 線性加權(quán)與梅爾譜 99
11.4 譜包絡(luò)與倒譜 100
11.5 梅爾頻率倒譜系數(shù)(MFCC).101
11.6 問題 .102
第 12 章 GMM 模型和 EM 算法103
12.1 從貝葉斯到混合模型.103
12.2 GMM 模型 104
12.3 EM 算法 .105
12.3.1 多個(gè)觀測聯(lián)合估計(jì) .106
12.3.2 離散隱變量的估計(jì) .106
12.4 GMM-EM 算法 .107
12.4.1 GMM 模型下迭代公式的化簡107
12.4.2 混合系數(shù) 的迭代估計(jì) 107
12.4.3 均值的迭代估計(jì)108
12.4.4 方差的迭代估計(jì)108
12.5 應(yīng)用:說話人識別 109
12.5.1 說話人聲學(xué)特征109
12.5.2 說話人識別的基本框架109
12.5.3 參數(shù)學(xué)習(xí) 110
12.6 問題 .111
第 13 章 深度神經(jīng)網(wǎng)絡(luò)與反向傳播 112
13.1 神經(jīng)網(wǎng)絡(luò).112
13.1.1 神經(jīng)元.112
13.1.2 神經(jīng)網(wǎng)絡(luò)的建模能力 113
13.1.3 深度前饋神經(jīng)網(wǎng)絡(luò) .113
13.2 網(wǎng)絡(luò)結(jié)構(gòu).114
13.2.1 卷積網(wǎng)絡(luò) 114
13.2.2 殘差網(wǎng)絡(luò) 115
13.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 116
13.2.4 注意力機(jī)制網(wǎng)絡(luò)117
13.3 代價(jià)函數(shù).117
13.3.1 均方誤差 117
13.3.2 交叉熵.118
13.3.3 負(fù)對數(shù)似然 .118
13.4 反向傳播方法 118
13.4.1 參數(shù)更新的基本原理 118
13.4.2 導(dǎo)數(shù)的鏈?zhǔn)椒▌t119
13.4.3 反向傳播 119
13.4.4 非頂層參數(shù)更新121
13.4.5 頂層參數(shù)更新 121
13.5 問題 .122
第 14 章 分類、聚類和降維 .123
14.1 距離與相似度 123
14.1.1 樣本之間的距離123
14.1.2 分布之間的距離123
14.1.3 相似度.124
14.2 分類 .124
14.2.1 K 近鄰算法124
14.2.2 樸素貝葉斯 .125
14.2.3 Logistic 二分類回歸與 Softmax 多分類回歸 .126
14.2.4 深度學(xué)習(xí) 128
14.3 有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí) 128
14.3.1 有監(jiān)督學(xué)習(xí) .128
14.3.2 無監(jiān)督學(xué)習(xí) .128
14.4 聚類 .129
14.4.1 K 均值聚類129
14.4.2 密度峰值聚類 129
14.4.3 層級聚類 130
14.5 降維 .131
14.6 問題 .132
第 15 章 支持向量機(jī) 133
15.1 決策函數(shù)與優(yōu)化問題.133
15.1.1 決策函數(shù) 133
15.1.2 設(shè)計(jì)準(zhǔn)則 134
15.1.3 優(yōu)化問題 134
15.1.4 拉格朗日函數(shù)與 KKT 條件 134
15.1.5 對偶優(yōu)化問題 136
15.2 穩(wěn)健 SVM .136
15.3 Relu 函數(shù)與 SVM .139
15.4 核函數(shù) SVM 140
15.5 SVM 問題的求解141
15.6 問題 .143
第 16 章 聲紋特征提取與說話人識別.144
16.1 聲紋識別的基本框架.144
16.1.1 模型構(gòu)建的基本思路 145
16.1.2 說話人注冊的基本過程145
16.1.3 說話人辨識的基本過程146
16.2 聲紋提取模型的構(gòu)建與訓(xùn)練 .147
16.2.1 幀級別特征提取147
16.2.2 片段級別特征提取 .148
16.3 問題 .149
附錄 A .150
A.1 傅里葉變換對.150
A.2 離散時(shí)間傅里葉變換對 151
A.3 拉普拉斯變換對151
A.4 Z 變換對 .152
A.5 點(diǎn)到超平面的距離.153
附錄 B 符號與運(yùn)算符說明155
B.1 符號說明 .155
B.2 運(yùn)算符說明 155
參考文獻(xiàn)157