語(yǔ)音信號(hào)識(shí)別技術(shù)與實(shí)踐
定 價(jià):58 元
- 作者:姜囡 著
- 出版時(shí)間:2019/12/1
- ISBN:9787551723800
- 出 版 社:東北大學(xué)出版社
- 中圖法分類:TN912.34
- 頁(yè)碼:246
- 紙張:膠版紙
- 版次:1
- 開本:16開
《語(yǔ)音信號(hào)識(shí)別技術(shù)與實(shí)踐》內(nèi)容分為8章。第1章為語(yǔ)音識(shí)別技術(shù)概述,介紹了語(yǔ)音識(shí)別技術(shù)的原理和發(fā)展與應(yīng)用。第2章為語(yǔ)音信號(hào)處理基本技術(shù),包括數(shù)字化預(yù)處理、短時(shí)時(shí)域處理和頻域處理的內(nèi)容。第3章是語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)和分割,介紹了端點(diǎn)檢測(cè)的原理和常規(guī)檢測(cè)方法,提出了基于復(fù)雜背景條件下的端點(diǎn)檢測(cè)算法,包括算法流程和實(shí)驗(yàn)方法。第4章是語(yǔ)音分割聚類,研究了如何獲取一段多人對(duì)話語(yǔ)音中說話人身份變動(dòng)的信息,以及如何確定哪些語(yǔ)音段是由同一個(gè)人發(fā)出來的。詳細(xì)介紹了三種方法,包括基于混合特征的分割聚類方法、基于改進(jìn)雙門限端點(diǎn)檢測(cè)的分割法、基于自組織神經(jīng)網(wǎng)絡(luò)的改進(jìn)K-means聚類算法。第5章為基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別,詳述了基于自適應(yīng)免疫克隆神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別算法原理、流程和實(shí)驗(yàn)方法。第6章是偽裝語(yǔ)音識(shí)別,探討了在語(yǔ)音被采用偽裝手段(如在耳語(yǔ)、假聲、模仿他人講話、捏鼻子講話以及用手絹或口罩等物品捂嘴講話等)情況下,如何正確進(jìn)行語(yǔ)音鑒定的問題。提出了基于GFCC與共振峰的聲紋提取方法和基于深度置信網(wǎng)絡(luò)模型的聲紋提取方法。第7章是基于語(yǔ)音信號(hào)的心理壓力分級(jí)與識(shí)別,探討了反映心理壓力的生理信號(hào)和分級(jí)實(shí)驗(yàn)方法,以及基于語(yǔ)音信號(hào)的心理壓力識(shí)別方法。第8章是不同情感的語(yǔ)音聲學(xué)特征分析,通過對(duì)生氣、害怕、高興、中性、驚訝、悲傷六種情感語(yǔ)音的共振峰頻率特征、共振峰走向特征、音節(jié)間的過渡特征、音節(jié)內(nèi)的過渡特征、基頻曲線特征以及振幅曲線特征進(jìn)行語(yǔ)音聲學(xué)特征分析,探索了同一個(gè)人的語(yǔ)音在不同情感下表現(xiàn)的特征差異。
《語(yǔ)音信號(hào)識(shí)別技術(shù)與實(shí)踐》較全面地總結(jié)了課題組近年來關(guān)于語(yǔ)音識(shí)別、語(yǔ)音與心理壓力等級(jí)識(shí)別、語(yǔ)音與情感分析方面的研究?jī)?nèi)容。主要章節(jié)均以理論介紹、算法流程、實(shí)驗(yàn)步驟、結(jié)果分析為脈絡(luò)撰寫,內(nèi)容詳盡,循序漸進(jìn),適合語(yǔ)音識(shí)別及語(yǔ)音情感分析的初學(xué)者,希望為在此領(lǐng)域有求知欲的學(xué)子打開一扇探索之門。
第1章 語(yǔ)音識(shí)別技術(shù)概述
1.1 語(yǔ)音識(shí)別的基本原理
1.2 語(yǔ)音識(shí)別技術(shù)的發(fā)展
1.3 語(yǔ)音識(shí)別技術(shù)的應(yīng)用
1.4 本章小結(jié)
第2章 語(yǔ)音信號(hào)處理基本技術(shù)
2.1 語(yǔ)音信號(hào)的數(shù)字化預(yù)處理
2.1.1 預(yù)濾波
2.1.2 采樣與量化
2.1.3 語(yǔ)音信號(hào)的A/D轉(zhuǎn)化
2.1.4 預(yù)加重
2.1.5 分幀處理
2.1.6 加窗處理
2.2 語(yǔ)音信號(hào)的短時(shí)時(shí)域處理
2.2.1 短時(shí)能量
2.2.2 短時(shí)過零率
2.3 語(yǔ)音信號(hào)的短時(shí)頻域處理
2.3.1 短時(shí)傅里葉變換
2.3.2 語(yǔ)譜圖
2.3.3 短時(shí)功率譜密度
2.4 本章小結(jié)
第3章 語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)和分割
3.1 端點(diǎn)檢測(cè)的基本原理
3.2 語(yǔ)音端點(diǎn)檢測(cè)的常規(guī)方法
3.2.1 基于短時(shí)能量和過零率的語(yǔ)音端點(diǎn)檢測(cè)
3.2.2 基于自相關(guān)函數(shù)的語(yǔ)音端點(diǎn)檢測(cè)
3.2.3 基于小波變換的語(yǔ)音端點(diǎn)檢測(cè)
3.3 基于小波分析的語(yǔ)音端點(diǎn)檢測(cè)
3.3.1 小波變換的基本原理
3.3.2 基于小波變換的語(yǔ)音端點(diǎn)檢測(cè)
3.4 基于小波包和高階累積量的語(yǔ)音端點(diǎn)檢測(cè)
3.4.1 小波包變換
3.4.2 高階累積量理論
3.4.3 基于小波包和高階累積量的語(yǔ)音端點(diǎn)檢測(cè)算法設(shè)計(jì)
3.4.4 實(shí)驗(yàn)分析
3.5 基于自適應(yīng)門限的分形維數(shù)語(yǔ)音端點(diǎn)檢測(cè)
3.5.1 基于分形維數(shù)的端點(diǎn)檢測(cè)
3.5.2 基于自適應(yīng)門限的分形維數(shù)端點(diǎn)檢測(cè)算法設(shè)計(jì)
3.6 本章小結(jié)
第4章 語(yǔ)音分割聚類
4.1 基于混合特征的說話人語(yǔ)音分割聚類
4.1.1 說話人語(yǔ)音分割聚類
4.1.2 基于混合特征的語(yǔ)音分割聚類算法設(shè)計(jì)
4.1.3 實(shí)驗(yàn)驗(yàn)證
4.2 基于改進(jìn)雙門限端點(diǎn)檢測(cè)法的說話人語(yǔ)音分割
4.2.1 語(yǔ)音分割方法的選取
4.2.2 傳統(tǒng)雙門限端點(diǎn)檢測(cè)算法研究
4.2.3 雙門限端點(diǎn)檢測(cè)算法的改進(jìn)設(shè)計(jì)
4.2.4 基于改進(jìn)雙門限法的說話人語(yǔ)音分割步驟
4.2.5 實(shí)驗(yàn)驗(yàn)證
4.3 基于自組織神經(jīng)網(wǎng)絡(luò)的改進(jìn)K-means說話人語(yǔ)音聚類
4.3.1 K-means說話人語(yǔ)音聚類算法
4.3.2 自組織神經(jīng)網(wǎng)絡(luò)說話人聚類算法設(shè)計(jì)
4.3.3 基于自組織神經(jīng)網(wǎng)絡(luò)的改進(jìn)K-means說話人語(yǔ)音聚類算法設(shè)計(jì)
4.3.4 實(shí)驗(yàn)驗(yàn)證
4.4 本章小結(jié)
第5章 基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別
5.1 自適應(yīng)免疫克隆算法和神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識(shí)
5.1.1 自適應(yīng)免疫克隆算法
5.1.2 神經(jīng)元
5.1.3 網(wǎng)絡(luò)連接方式
5.1.4 學(xué)習(xí)(訓(xùn)練)算法
5.1.5 BP神經(jīng)網(wǎng)絡(luò)
5.2 基于自適應(yīng)免疫克隆神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別算法設(shè)計(jì)
5.3 實(shí)驗(yàn)驗(yàn)證
5.4 本章小結(jié)
第6章 偽裝語(yǔ)音識(shí)別
6.1 基礎(chǔ)知識(shí)
6.1.1 偽裝語(yǔ)音聲紋識(shí)別概述
6.1.2 深度學(xué)習(xí)概述
6.2 基于GFCC與共振峰的偽裝語(yǔ)音聲紋特征提取
6.2.1 倒譜法提取共振峰系數(shù)
6.2.2 GFCC參數(shù)的提取
6.2.3 高斯混合模型
6.2.4 基于混合參數(shù)的改進(jìn)特征提取算法
6.2.5 實(shí)驗(yàn)及結(jié)果分析
6.3 基于DBN模型的偽裝語(yǔ)音聲紋識(shí)別系統(tǒng)
6.3.1 深度置信網(wǎng)絡(luò)
6.3.2 基于DBN的改進(jìn)模型算法
6.3.3 實(shí)驗(yàn)及結(jié)果分析
6.4 本章小結(jié)
第7章 基于語(yǔ)音信號(hào)的心理壓力分級(jí)與識(shí)別
7.1 基于語(yǔ)音和生理信號(hào)的心理壓力分級(jí)
7.1.1 心理壓力多模態(tài)參數(shù)影響分析
7.1.2 心理壓力等級(jí)識(shí)別分析
7.1.3 基于語(yǔ)音信號(hào)的心理壓力等級(jí)識(shí)別驗(yàn)證
7.2 基于MFCC和GFCC混合特征的語(yǔ)音情感識(shí)別研究
7.2.1 基于混合特征的語(yǔ)音情感特征提取
7.2.2 基于CNN的語(yǔ)音情感識(shí)別
7.2.3 實(shí)驗(yàn)分析
7.3 本章小結(jié)
第8章 不同情感的語(yǔ)音聲學(xué)特征分析
8.1 情感語(yǔ)音文本的選擇
8.2 情感語(yǔ)音聲學(xué)特征分析
8.2.1 共振峰頻率特征
8.2.2 共振峰走向特征
8.2.3 音節(jié)內(nèi)過渡特征
8.2.4 音節(jié)間過渡特征
8.2.5 基頻曲線特征
8.2.6 振幅曲線特征
8.3 情感語(yǔ)音聲學(xué)特征分析結(jié)果
8.4 本章小結(jié)
參考文獻(xiàn)