語音技術的進步使科幻電影中人機對話的場景正在逐漸走進現實生活。我們生活中用到的智能手機、電腦、音箱以及汽車等很多設備和工具都已經配備了語音界面,我們經常在商場里看到的導購機器人或者玩具機器人,也支持人機對話,支持用戶語音搜索或者下達指令。
語音界面看似簡單,但其開發(fā)卻蘊含著很多我們意想不到的問題和困難!墩Z音界面沖擊》這本書將帶領我們全面了解:
語音界面的歷史;
語音界面的現狀及未來;
語音界面的功能、優(yōu)勢和特點;
需要使用何種技術才能實現語音界面;
語音界面面臨的課題和問題;
實現“語音交互”以及人機對話面臨哪些障礙;
語音界面的商業(yè)用途;
…………
語音界面的商用前景也令人憧憬。語音經濟的規(guī)模將會超過移動應用。據預測,僅僅在美國和英國,語音電商的規(guī)模就將從2018年的20億美元增長至2022年的400億美元。語音技術創(chuàng)業(yè)公司的數量和融資規(guī)模也在飛速上升。未來,我們將看到人機互動的另一種無限可能。
語音科技——下一個顛覆者,通向人工智能時代的一把秘鑰
未來10年,語音科技會成為*具決定性的主題之一。人機對話能力將迎來變革性進展,語音也將成為*主要的人機互動方式。語音科技在商業(yè)上的應用,將會引領我們進入一個奇異的新世界,而我們不需要任何訓練就可以完美適應。
通過語音搜索、購物、下單;
向語音助手傾訴煩惱并得到貼心的安慰;
成功時得到語音助手*真誠的祝賀;
系統(tǒng)可以聽令行事,我們不必在鍵盤或觸摸屏一點點輸入文字;
…………
這些場景離我們并不遙遠。語音界面能解放雙手,用聲音識別徹底改變產品搜索、購物體驗,使虛擬伴侶變成現實……
語音技術也是實現人工智能的基石,它在不斷地變化升級。隨著語音的采集、識別、合成技術越來越先進,語音界面帶給我們的未來將遠遠超乎想象,它將打通通往人工智能未來的又一扇大門。
Neoma設計公司董事長,beyondUX設計者、創(chuàng)意總監(jiān)和IT顧問。橫濱國立大學畢業(yè)后進入索尼公司,從事用戶界面、網絡、空間等的研究開發(fā)。擔任使用觸摸、手勢、語音識別人機交互開發(fā)小組組長。隨后,在索尼集團內建立了**語音UX設計團隊,負責制作了PlayStation4的語音UI,也帶頭啟動了以語音對話和AI為基礎的新一代家電項目。
2014年成立Neoma 設計公司。從事語音UI/UX設計的咨詢和研發(fā)工作,同時參與健身俱樂部的空間制造、主題公園人機交互,以及互動數字顯示屏的設計。
第 1 章 語音界面的現狀和未來
時代在語言中流轉 / 002
哆啦 A 夢的神奇道具成為現實 / 003
語音免觸成為快捷方式 / 004
Chatbot 已經開始實際應用 / 005
語音界面變身“傳話游戲” / 006
不能和平時一樣說話 / 007
留言電話登記的表達問題 / 007
AI 技術助力語音交互的進化 / 008
第 2 章 語音界面的歷史
早期語音交互系統(tǒng)“VOYAGER” / 010
2011 年 iPhone 開始支持“Siri” / 011
物理 UI-CUI-GUI- 手勢 UI- 語音 UI / 012
AI 和語音——剪不斷的關系 / 013
智能音箱和仿生機器人的出現 / 014
語音界面走進銀行和零售店 / 015
小結 / 015
第 3 章 語音界面的特點與優(yōu)勢
減少文字輸入時間 / 019
方便快捷(減少步驟)/ 020
免觸操作(同時操作)/ 022
操作姿勢自由 / 023
支持附加條件指令 / 023
支持模糊表達 / 024
創(chuàng)造人機對話價值體驗 / 025
支持反映感情和心理狀況 / 026
受文化和語言差異的影響 / 027
符合人類認知水平的媒介 / 028
第 4 章 支持語音界面的商品
語音界面的六個基本功能 / 032
除六大基本功能外的其他功能 / 034
智能音箱 / 039
Alexa Skill 擴展 Echo 功能 / 043
AI 機器人 / 047
支持語音辨認功能的智能家電 / 053
游戲機 / 055
其他 / 060
小結 / 0613
第 5 章 語音界面技術
采音信號處理 / 065
語音識別 / 067
語義理解 / 069
對話應答 / 對話生成 / 073
語音合成 / 077
小結 / 078
第 6 章 語音界面面臨的問題
語音界面是一場傳話游戲 / 082
何時說?說什么?怎么說? / 084
不明現狀的問題 / 086
尚不準確的語音識別 / 088
說話也費力 / 089
語音操作手法單一 / 090
喚醒詞太俗氣 / 092
不自然的自然表達問題 / 095
對發(fā)聲環(huán)境的依賴 / 099
發(fā)聲前間隔過長 / 100
語音輸入無法處理中斷和取消 / 101
小結 / 104
第 7 章 語音助手 / 機器人語音界面“對話”
“會話”和“對話”的區(qū)別 / 109
任務型和非任務型 / 1114
語音界面沖擊
所謂聊天 / 113
會話的分類 / 116
報告型會話較多的原因 / 118
談話內容無聊的原因 / 121
自然對話(談話)必要的六大要素 / 123
會話方案 / 130
對話表現 / 132
交互作用分析 / 142
違和感:兒童角色口出術語 / 145
語音界面和對話中的語言文化差異 / 145
恐怖谷現象與對話 / 149
小結 / 151
第 8 章 語音界面商業(yè)勢力圖
語音識別技術開發(fā)企業(yè) / 154
語音合成技術開發(fā)企業(yè) / 157
語音界面解決方案供應企業(yè) / 158
小結 / 163
第 9 章 語音界面的未來
語音界面尚在起步階段 / 166
語音商業(yè)的未來 / 166
對話商業(yè)未來 / 172
面向自然對話時代 / 174
小結 / 175