本書貫穿了信號的獲取、處理、分析和識別整條鏈路所需的關鍵知識點,以聲信號為研究對象,闡述了傳統(tǒng)信號處理、自適應信號處理、機器學習等信號處理和智能分析設計等知識要點。全書總共16章,第1~4章介紹了經(jīng)典信號處理與分析方法,第5~11章闡述了先進信號處理方法、人工特征的獲取原理和方法,第12~16章主要說明了深度學習、混合
本書系統(tǒng)地介紹了語音處理的起源、發(fā)展歷史及應用現(xiàn)狀;語音處理的相關原理;Anaconda集成環(huán)境的安裝與使用;科學仿真MATLAB工具安裝與使用;Ffmpeg的安裝與使用、語音數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)標注;語音開源平臺百度AI和科大訊飛;語音處理工程方法;并提供了多個語音處理實戰(zhàn)。本書是一本面向初級和中級讀者的基礎教程
本書包括三個部分:第一部分從最基本的錄音操作入手,詳細介紹個人工作室的設備組成、配置及錄音操作步驟,讓讀者快速熟悉錄音相關操作,同時也借此引出錄音過程中所涉及的音頻技術相關術語。第二部分介紹音頻技術的基本概念,讓讀者了解錄音需具備的各種音頻技術的基礎知識。第三部分則將前兩部分的內(nèi)容聯(lián)系起來,介紹錄音相關設備,讓讀者可以
本書主要介紹語音識別原理及其相關應用。全書共9章,分為五大部分:第一部分(第1章)介紹語音識別的發(fā)展歷史和語音識別領域常用的數(shù)據(jù)集與工具箱;第二部分(第2章)介紹在語音識別領域常用的語音信號基礎知識和聲學特征的提;第三部分(第3章至第7章)詳細介紹語音識別的聲學模型、語言模型、解碼工具,并對語音識別領域的研究熱點(端
花暉:博士,上海交通大學媒體與傳播學院副教授。智能傳播系列教材。本書牢牢把握融媒體背景下,聲音創(chuàng)作藝術、技術與學術共融的專業(yè)特征,厚理論、重實踐、求創(chuàng)新。一方面闡述聲音創(chuàng)作的美學原理與表現(xiàn)規(guī)律,幫助學生夯實影音美學理論基礎、扎實專業(yè)核心,在跨學科語境下,了解融媒體系統(tǒng)的運行方式、掌握數(shù)字聲音制作的全崗位要求;另一方面?zhèn)?/p>
本書牢牢把握融媒體背景下,聲音創(chuàng)作藝術、技術與學術共融的專業(yè)特征,厚理論、重實踐、求創(chuàng)新,力求做到理論與實踐相結合,開拓讀者的專業(yè)視野,增強讀者的創(chuàng)新能力、協(xié)作能力與自主學習能力。為順應技術迭代與新媒體的發(fā)展,本書將重點以互聯(lián)網(wǎng),尤其是移動媒體端應用廣泛的播客為例,手把手由創(chuàng)意策劃到錄制剪輯,再到輸出發(fā)布,講授全流程創(chuàng)
本書主要介紹關于人工智能語音測試的各方面知識點和實戰(zhàn)技術。全書共分為9章,第1章和第2章詳細介紹人工智能語音測試各種知識點和人工智能語音交互原理;第3章和第4章介紹人工智能語音產(chǎn)品需求和評價指標及其相對應的驗收標準;第5章介紹如何準備語音數(shù)據(jù),包括準備方案和具體方法;第6~9章介紹人工智能語音測試涉及的4大模塊,即黑盒
本書圍繞語音識別的原理和應用講解,理論結合實際,采用大量插圖,輔以實例,力求深入淺出,讓讀者能較快地理解語音識別的基礎理論和關鍵技術。為了幫助讀者動手操作,提高實戰(zhàn)技能,本書最后還結合Kaldi、ESPnet和WeNet等開源工具,介紹了具體的工程實踐方法。
以高端先進聲、光、影視技術及設備為代表的高科技不斷在舞臺演出、會展、藝術中心和文旅演藝等領域中大顯身手,傳統(tǒng)和新興藝術借助高科技發(fā)生質(zhì)變,顯著增強現(xiàn)場感染力和藝術表現(xiàn)力,營造氛圍令參與者和觀眾享受沉浸式體驗。藝術表現(xiàn)需要技術支持,本書介紹當前主流的沉浸式3D音視頻和燈光技術,力求將現(xiàn)實工程案例與理論結合,將該技術脈絡一
本書以高等職業(yè)教育的人工智能類專業(yè)人才培養(yǎng)基本要求為指導,以培養(yǎng)學生掌握智能語音信號處理及應用為目標,以“必須、夠用”為原則,采用“項目教學法”,系統(tǒng)介紹了智能語音信號處理的基本理論、方法以及Python在語音信號處理中的應用。全書包含六個教學項目,其中,項目1介紹了智能語音的概念樂展、未來趨勢以及應用,語音信號的采集