《多媒體技術(shù)(第2版)》分為7章,系統(tǒng)介紹了多媒體技術(shù)的基本概念;各種媒體信息的表示和編碼方法;多媒體數(shù)據(jù)關(guān)系、數(shù)據(jù)庫及內(nèi)容查詢;多媒體終端構(gòu)成及工作原理;多媒體信息存儲(chǔ)技術(shù)與存儲(chǔ)策略;多媒體信息獲取與輸出技術(shù);多媒體通信及其應(yīng)用系統(tǒng)。通過閱讀《多媒體技術(shù)(第2版)》,可幫助讀者掌握多媒體技術(shù)的基本概念和主要技術(shù)原理,了解多媒體通信系統(tǒng)的體系結(jié)構(gòu)、相關(guān)技術(shù)標(biāo)準(zhǔn)和最新發(fā)展?fàn)顩r!抖嗝襟w技術(shù)(第2版)》的重點(diǎn)是多媒體的基本概念與媒體表示方法,以及多媒體通信系統(tǒng);難點(diǎn)是多媒體信息的壓縮、媒體同步概念與同步機(jī)制等。
《多媒體技術(shù)(第2版)》的主要讀者對(duì)象是通信、電子和計(jì)算機(jī)專業(yè)的學(xué)生,也可供相關(guān)專業(yè)的工程技術(shù)人員作為培訓(xùn)教材使用。
本書是在2000年已出版的《多媒體技術(shù)》的基礎(chǔ)上,結(jié)合近年多媒體技術(shù)的最新技術(shù)進(jìn)展修改編寫完成的。原書出版以后得到了廣大讀者與其他高校教師的鼓勵(lì)和肯定,被部分高校選作相應(yīng)課程教材。然而,經(jīng)過若干年多媒體技術(shù)的發(fā)展,原書中部分作為發(fā)展方向的預(yù)測(cè)已經(jīng)變成了現(xiàn)實(shí),甚至大大超過預(yù)期;有些內(nèi)容由于技術(shù)進(jìn)步需要重新書寫,因此有必要對(duì)原書進(jìn)行一次大的修訂,以反映多媒體技術(shù)的最新技術(shù)進(jìn)展。
多媒體技術(shù)從誕生到現(xiàn)在經(jīng)過二十多年的發(fā)展,已經(jīng)滲透到了人們?nèi)粘I畹母鱾(gè)方面。多媒體技術(shù)將電視式的視聽信息傳播能力與計(jì)算機(jī)的交互控制功能相結(jié)合,創(chuàng)造出集文、圖、聲、像于一體的新型信息處理模式。除了計(jì)算機(jī)系統(tǒng)本身的多媒體化,多媒體技術(shù)與點(diǎn)播電視、智能化家電、網(wǎng)絡(luò)通信等技術(shù)相互結(jié)合,使多媒體技術(shù)進(jìn)入了教育、咨詢、娛樂、企業(yè)管理和辦公室自動(dòng)化等各個(gè)領(lǐng)域;多媒體技術(shù)與控制技術(shù)相互滲透,在工業(yè)自動(dòng)化測(cè)控等領(lǐng)域也得到了廣泛應(yīng)用。目前,家庭教育和個(gè)人娛樂成為國際多媒體技術(shù)應(yīng)用市場(chǎng)的主流,內(nèi)容演示和管理信息系統(tǒng)是多媒體技術(shù)應(yīng)用的重要方面,而多媒體通信和分布式多媒體系統(tǒng)成為多媒體技術(shù)發(fā)展的重要方向。
在國內(nèi)各高校已出版的各類多媒體方面的教材與書籍中,有的側(cè)重多媒體體系結(jié)構(gòu),理論方面的意義較大;有的偏重多媒體技術(shù)在通信方面的應(yīng)用:有的主要講述多媒體計(jì)算機(jī)及其硬件組成;還有的重點(diǎn)講述多媒體應(yīng)用軟件的使用方法。本書的特點(diǎn)在于針對(duì)一般普通高等院校通信、電子、信息、計(jì)算機(jī)應(yīng)用專業(yè)的學(xué)生,從多媒體技術(shù)的各個(gè)方面進(jìn)行了比較全面、系統(tǒng)地介紹,特別是根據(jù)大部分學(xué)生先修課程安排的特點(diǎn),加強(qiáng)了對(duì)各類媒體信息基礎(chǔ)知識(shí)的介紹,努力使該書內(nèi)容適合教學(xué)需要,并盡量做到簡(jiǎn)單易懂。
第1章 概論
1.1 媒體與多媒體技術(shù)的基本概念
1.2 多媒體關(guān)鍵技術(shù)
第2章 媒體技術(shù)基礎(chǔ)
2.1 視覺媒體技術(shù)
2.1.1 人類視覺特性與電視技術(shù)基礎(chǔ)
2.1.2 圖像及視頻信息的數(shù)字化表示
2.1.3 視頻數(shù)字壓縮編碼技術(shù)
2.1.4 視頻編碼技術(shù)標(biāo)準(zhǔn)
2.2 聽覺媒體技術(shù)
2.2.1 人類聽覺特性與電聲技術(shù)基礎(chǔ)
2.2.2 音頻信息與音頻信息數(shù)字化表示
2.2.3 音頻數(shù)字壓縮編碼技術(shù)
2.2.4 MPEG數(shù)字聲音壓縮編碼標(biāo)準(zhǔn)
2.2.5 音樂合成
2.3 觸覺媒體與形體動(dòng)作信息
2.3.1 概述
2.3.2 觸覺反饋
2.3.3 形體動(dòng)作信息
第3章 多媒體數(shù)據(jù)
3.1 多媒體數(shù)據(jù)特點(diǎn)及其約束關(guān)系
3.1.1 多媒體數(shù)據(jù)特點(diǎn)
3.1.2 多媒體數(shù)據(jù)約束關(guān)系
3.2 超媒體技術(shù)
3.2.1 超媒體的概念
3.2.2 超媒體系統(tǒng)的組成和原理
3.2.3 超文本標(biāo)記語言
3.2.4 同步多媒體集成語言
3.3 多媒體數(shù)據(jù)庫
3.4 內(nèi)容查詢
第4章 多媒體終端技術(shù)
4.1 多媒體終端
4.1.1 多媒體終端形式
4.1.2 多媒體終端接口及信息存儲(chǔ)
4.2 多媒體終端軟件平臺(tái)
4.2.1 多媒體終端軟件分層結(jié)構(gòu)
4.2.2 多媒體操作系統(tǒng)
4.2.3 多媒體著作工具
4.2.4 多媒體計(jì)算機(jī)中的媒體播放軟件
4.3 多媒體終端外部設(shè)備接口
4.3.1 USB通用串行總線規(guī)范
4.3.2 IEEE-1 394串行接口標(biāo)準(zhǔn)
4.3.3 eSATA接口
4.3.4 高清晰多媒體接口
4.3.5 網(wǎng)絡(luò)接口
第5章 多媒體信息存儲(chǔ)
5.1 磁盤存儲(chǔ)系統(tǒng)
5.2 光盤存儲(chǔ)系統(tǒng)
5.2.1 光盤結(jié)構(gòu)及讀取技術(shù)
5.2.2 光盤類型
5.3 半導(dǎo)體存儲(chǔ)系統(tǒng)
5.4 多媒體數(shù)據(jù)存儲(chǔ)策略與方式
第6章 多媒體信息獲取與輸出技術(shù)
6.1 視頻信息采集與顯示
6.2 音頻信息采集與播放
6.3 圖形圖像信息輸入設(shè)備
6.4 文字信息輸入技術(shù)
6.4.1 聯(lián)機(jī)筆輸入技術(shù)
6.4.2 脫機(jī)文字識(shí)別
6.5 語音輸入/輸出技術(shù)
6.5.1 語音識(shí)別
6.5.2 語音合成
6.6 其他多媒體輸入技術(shù)
6.6.1 指點(diǎn)設(shè)備
6.6.2 觸摸屏
6.6.3 手柄
第7章 多媒體通信
7.1 多媒體通信業(yè)務(wù)與需求
7.2 多媒體通信中的同步
7.3 多媒體通信網(wǎng)與信息傳輸技術(shù)
7.3.1 多媒體寬帶通信網(wǎng)
7.3.2 寬帶干線傳輸技術(shù)
7.3.3 寬帶交換技術(shù)
7.3.4 寬帶接入技術(shù)
7.4 多媒體會(huì)議系統(tǒng)
7.4.1 會(huì)議系統(tǒng)的分類
7.4.2 多媒體會(huì)議與協(xié)同工作
7.4.3 多媒體會(huì)議系統(tǒng)結(jié)構(gòu)
7.4.4 不同網(wǎng)絡(luò)環(huán)境下的多媒體會(huì)議系統(tǒng)
7.5 交互多媒體信息點(diǎn)播系統(tǒng)
7.5.1 多媒體信息點(diǎn)播系統(tǒng)的基本概念與分類
7.5.2 VOD系統(tǒng)結(jié)構(gòu)與參考模型
促進(jìn)多媒體技術(shù)走向成熟的因素很多,但其中的關(guān)鍵技術(shù)涉及多媒體信息的獲取與輸出技術(shù)、多媒體信息壓縮技術(shù)、多媒體信息的存儲(chǔ)技術(shù)、多媒體信息的檢索技術(shù)、多媒體網(wǎng)絡(luò)技術(shù)以及多媒體技術(shù)的軟硬件支撐平臺(tái)等。
1.多媒體信息的獲取與輸出技術(shù)
一般來講,多媒體信息的獲取與輸出主要指人機(jī)交互的界面,它介于用戶和多媒體系統(tǒng)之間,是人與多媒體系統(tǒng)之間傳遞、交換信息的媒介,是用戶使用系統(tǒng)的綜合操作環(huán)境。通過人機(jī)界面,用戶向系統(tǒng)提供命令、數(shù)據(jù)等輸入信息,這些信息經(jīng)系統(tǒng)處理后,又通過人機(jī)界面,把產(chǎn)生的輸出信息回送給用戶?梢娙藱C(jī)界面的核心內(nèi)容包括了信息的顯示風(fēng)格和用戶的操作方式,它集中體現(xiàn)了多媒體系統(tǒng)的輸入/輸出功能,以及用戶對(duì)系統(tǒng)的各個(gè)部件進(jìn)行操作的控制功能。多媒體技術(shù)可使用戶用十分自然的方式與系統(tǒng)交互,從而改善了人機(jī)界面。
在多媒體技術(shù)推出之前人機(jī)界面并不友好,普遍采用字符界面,用戶在屏幕上看到的是各種字符信息,而用戶輸入計(jì)算機(jī)的也是字符。用戶接收信息的裝置主要是字符終端,主要的輸入工具是鍵盤,F(xiàn)在,多媒體終端普遍采用圖形圖像以及活動(dòng)視頻和聲音作為信息輸出手段;而采用鼠標(biāo)、跟蹤球、電子筆、觸摸屏、掃描儀、數(shù)碼相機(jī)、數(shù)字?jǐn)z像頭和音/視頻采集卡作為輸入設(shè)備,大大改善了人機(jī)接口,使多媒體系統(tǒng)獲取信息的手段越來越豐富。隨著技術(shù)進(jìn)步,采用語音識(shí)別、圖形圖像識(shí)別和圖像理解等先進(jìn)技術(shù),人機(jī)接口將越來越方便人們對(duì)多媒體終端設(shè)備的使用。
使計(jì)算機(jī)具有類似于人一樣的說話能力和聽懂人說話的能力是多媒體技術(shù)的一個(gè)重要發(fā)展方向。語音識(shí)別和語音合成技術(shù)是實(shí)現(xiàn)人機(jī)語音通信,建立一個(gè)具有聽、說能力的智能系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù),目前這兩項(xiàng)關(guān)鍵技術(shù)均取得了重大進(jìn)展,推出了大量實(shí)用系統(tǒng)。目前,語音識(shí)別輸入產(chǎn)品的識(shí)別率相當(dāng)高,有6萬條以上的詞匯表,覆蓋了日常生活的各個(gè)方面;此外,20余萬條詞匯的備份字典,提供了更廣泛的選擇空間。針對(duì)行業(yè)的特殊需要,還可提供加裝專業(yè)語庫的接口,如用于法律和醫(yī)學(xué)的專業(yè)語庫,大大提高了專業(yè)用語識(shí)別的正確性。語音識(shí)別技術(shù)發(fā)展到今天,特別是中、小詞匯量非特定人語音識(shí)別系統(tǒng)識(shí)別精度已經(jīng)大于98%,對(duì)特定人語音識(shí)別系統(tǒng)的識(shí)別精度就更高。與進(jìn)行語音輸入所用的語音識(shí)別技術(shù)相對(duì)應(yīng),利用語音合成技術(shù)可實(shí)現(xiàn)語音的輸出,為人們提供全新的服務(wù)。在銀行、郵局、勞保、證券、專利、信訪聲訊服務(wù)系統(tǒng)中,借助文一語轉(zhuǎn)換TTS技術(shù)把數(shù)據(jù)庫中的文字變成聲音,用戶可利用電話收聽即時(shí)變化的信息。目前,合成語音的可懂度、清晰度已基本解決,但自然度還不盡如人意,表現(xiàn)力的差距較大,技術(shù)的成熟度、應(yīng)用的廣泛性還需進(jìn)一步提高。