Kaldi是目前語音識別領(lǐng)域,廣受歡迎并流行的開源工具包。Kaldi設(shè)計之初對通用性,可拓展性等一系列源代碼層次的考量,大大降低了Kaldi作為語音識別工具包的門檻,同時擁有非常完整的語音識別系統(tǒng)訓(xùn)練腳本。本書通過對Kaldi已有訓(xùn)練腳本的梳理和引導(dǎo),幫助讀者快速搭建可用的語音識別系統(tǒng)。
本書以國際大型體育賽事為背景,系統(tǒng)介紹了賽事轉(zhuǎn)播組織架構(gòu)和具體技術(shù)實施方案。在第一章和第二章中主要介紹了國際信號的定義、團隊工作流程和信號采集方法;第三章和第四章介紹了國際信號中重要的評論聲制作方式和轉(zhuǎn)播團隊使用的內(nèi)部通訊系統(tǒng);第五章、第六章和第七章詳細介紹了各種體育比賽轉(zhuǎn)播的音頻制作方法。本書具有理論指導(dǎo)實踐的特點,
聽覺信息處理技術(shù)的創(chuàng)新能夠推動實現(xiàn)高度智能化機器感知系統(tǒng)的發(fā)展,本分冊主要介紹了國內(nèi)外聽覺信息處理方面的研究現(xiàn)狀和階段性成果,通過對人類言語產(chǎn)生與聽覺機理,聽覺機理的計算理論與方法,語音信號處理,語音識別聲學(xué)建模,特殊場景語音識別,聲紋與語種識別,韻律、情緒及音樂分析,統(tǒng)計語音合成,口語對話系統(tǒng)等技術(shù)研究成果的闡述與分
《語音信號識別技術(shù)與實踐》內(nèi)容分為8章。第1章為語音識別技術(shù)概述,介紹了語音識別技術(shù)的原理和發(fā)展與應(yīng)用。第2章為語音信號處理基本技術(shù),包括數(shù)字化預(yù)處理、短時時域處理和頻域處理的內(nèi)容。第3章是語音信號的端點檢測和分割,介紹了端點檢測的原理和常規(guī)檢測方法,提出了基于復(fù)雜背景條件下的端點檢測算法,包括算法流程和實驗方法。第4
語音情感識別(SpeechEmotionRecognition,SER)是情感計算、模式識別、信號處理和人機交互領(lǐng)域的熱門研究話題,SER的研究涉及特征提取、特征優(yōu)選、分類器改進、特征融合等多種技術(shù)。語音情感識別是在同一數(shù)據(jù)庫中進行的識別研究,主要應(yīng)用于自然的人機交互領(lǐng)域,目前大部分的人機交互方式都依賴于觸覺,如觸屏、
本書是面向從事音頻領(lǐng)域研究的專業(yè)書籍。通過此書,讀者能夠掌握空間線索在音頻中應(yīng)用的基礎(chǔ)知識,并能了解空間音頻技術(shù)在3D音頻研究的一些前沿內(nèi)容和實驗手段。本書概念講解清楚、系統(tǒng)性強,是作者多年來從事數(shù)字音頻編碼工作并指導(dǎo)研究生開展研究的經(jīng)驗總結(jié),具有較強的實用性,可供高等院校相關(guān)專業(yè)的高年級本科生、研究生和工程技術(shù)人員
本書是音響技術(shù)與音樂欣賞相關(guān)知識的百科,內(nèi)容深入淺出、側(cè)重實用而新穎全面。全書分4部分:(1)電聲基礎(chǔ),包括聲學(xué)和音響的基礎(chǔ)知識;(2)音響釋疑420例,對420個有關(guān)音響技術(shù)的實際問題進行解釋;(3)音樂與欣賞,提供欣賞音樂和選購軟件的相關(guān)知識;(4)電子音響史料,介紹電子音響技術(shù)的發(fā)展沿革。 音響實際涉及的知識門類
本書系統(tǒng)地介紹語音信號處理的基礎(chǔ)、概念、原理、方法與應(yīng)用。全書共分9章。第1章介紹語音信號處理及其發(fā)展過程;第2章介紹語音信號的產(chǎn)生與人類聽覺的機理,傳統(tǒng)的線性語音產(chǎn)生模型,以及非線性語音產(chǎn)生模型;第3章從語音信號的時域特征入手,引入時頻分析的思想,并進一步闡述時頻分析中短時傅里葉變換和小波變換在語音信號特征分析中的應(yīng)
在本書中,業(yè)界專家湯姆林森?霍爾曼(TomlinsonHolman)和亞瑟?鮑姆(ArthurBaum)提供了大量的工具和專業(yè)知識,展現(xiàn)了音頻捕捉、視頻錄制、剪輯流程和混錄的最新發(fā)展,可以幫助你的電影或視頻制作達到驚人的效果。這本最新版(第2版)包含聲音制作從前期到后期在技術(shù)、技巧和工藝流程上的秘密,并收入以下最新內(nèi)容
數(shù)字技術(shù)的快速發(fā)展和網(wǎng)絡(luò)應(yīng)用的普及,帶動現(xiàn)場擴聲設(shè)備從模擬時代向數(shù)字化時代轉(zhuǎn)變,涌現(xiàn)出各種品牌的數(shù)字調(diào)音臺、數(shù)字信號處理器、數(shù)字功率放大器等數(shù)字化音頻設(shè)備,可以利用計算機軟件配合完成擴聲工程設(shè)計、聲場覆蓋模擬、電聲調(diào)試等工作,利用網(wǎng)絡(luò)實現(xiàn)遠距離傳輸,解決長距離音頻信號衰減的難題。本書以現(xiàn)場演出的數(shù)字擴音設(shè)備為實例,介紹