語音技術(shù)的進步使科幻電影中人機對話的場景正在逐漸走進現(xiàn)實生活。我們生活中用到的智能手機、電腦、音箱以及汽車等很多設(shè)備和工具都已經(jīng)配備了語音界面,我們經(jīng)常在商場里看到的導購機器人或者玩具機器人,也支持人機對話,支持用戶語音搜索或者下達指令。
語音界面看似簡單,但其開發(fā)卻蘊含著很多我們意想不到的問題和困難!墩Z音界面沖擊》這本書將帶領(lǐng)我們?nèi)媪私猓?br />語音界面的歷史;
語音界面的現(xiàn)狀及未來;
語音界面的功能、優(yōu)勢和特點;
需要使用何種技術(shù)才能實現(xiàn)語音界面;
語音界面面臨的課題和問題;
實現(xiàn)“語音交互”以及人機對話面臨哪些障礙;
語音界面的商業(yè)用途;
…………
語音界面的商用前景也令人憧憬。語音經(jīng)濟的規(guī)模將會超過移動應用。據(jù)預測,僅僅在美國和英國,語音電商的規(guī)模就將從2018年的20億美元增長至2022年的400億美元。語音技術(shù)創(chuàng)業(yè)公司的數(shù)量和融資規(guī)模也在飛速上升。未來,我們將看到人機互動的另一種無限可能。
語音科技——下一個顛覆者,通向人工智能時代的一把秘鑰
未來10年,語音科技會成為*具決定性的主題之一。人機對話能力將迎來變革性進展,語音也將成為*主要的人機互動方式。語音科技在商業(yè)上的應用,將會引領(lǐng)我們進入一個奇異的新世界,而我們不需要任何訓練就可以完美適應。
通過語音搜索、購物、下單;
向語音助手傾訴煩惱并得到貼心的安慰;
成功時得到語音助手*真誠的祝賀;
系統(tǒng)可以聽令行事,我們不必在鍵盤或觸摸屏一點點輸入文字;
…………
這些場景離我們并不遙遠。語音界面能解放雙手,用聲音識別徹底改變產(chǎn)品搜索、購物體驗,使虛擬伴侶變成現(xiàn)實……
語音技術(shù)也是實現(xiàn)人工智能的基石,它在不斷地變化升級。隨著語音的采集、識別、合成技術(shù)越來越先進,語音界面帶給我們的未來將遠遠超乎想象,它將打通通往人工智能未來的又一扇大門。
Neoma設(shè)計公司董事長,beyondUX設(shè)計者、創(chuàng)意總監(jiān)和IT顧問。橫濱國立大學畢業(yè)后進入索尼公司,從事用戶界面、網(wǎng)絡(luò)、空間等的研究開發(fā)。擔任使用觸摸、手勢、語音識別人機交互開發(fā)小組組長。隨后,在索尼集團內(nèi)建立了**語音UX設(shè)計團隊,負責制作了PlayStation4的語音UI,也帶頭啟動了以語音對話和AI為基礎(chǔ)的新一代家電項目。
2014年成立Neoma 設(shè)計公司。從事語音UI/UX設(shè)計的咨詢和研發(fā)工作,同時參與健身俱樂部的空間制造、主題公園人機交互,以及互動數(shù)字顯示屏的設(shè)計。
第 1 章 語音界面的現(xiàn)狀和未來
時代在語言中流轉(zhuǎn) / 002
哆啦 A 夢的神奇道具成為現(xiàn)實 / 003
語音免觸成為快捷方式 / 004
Chatbot 已經(jīng)開始實際應用 / 005
語音界面變身“傳話游戲” / 006
不能和平時一樣說話 / 007
留言電話登記的表達問題 / 007
AI 技術(shù)助力語音交互的進化 / 008
第 2 章 語音界面的歷史
早期語音交互系統(tǒng)“VOYAGER” / 010
2011 年 iPhone 開始支持“Siri” / 011
物理 UI-CUI-GUI- 手勢 UI- 語音 UI / 012
AI 和語音——剪不斷的關(guān)系 / 013
智能音箱和仿生機器人的出現(xiàn) / 014
語音界面走進銀行和零售店 / 015
小結(jié) / 015
第 3 章 語音界面的特點與優(yōu)勢
減少文字輸入時間 / 019
方便快捷(減少步驟)/ 020
免觸操作(同時操作)/ 022
操作姿勢自由 / 023
支持附加條件指令 / 023
支持模糊表達 / 024
創(chuàng)造人機對話價值體驗 / 025
支持反映感情和心理狀況 / 026
受文化和語言差異的影響 / 027
符合人類認知水平的媒介 / 028
第 4 章 支持語音界面的商品
語音界面的六個基本功能 / 032
除六大基本功能外的其他功能 / 034
智能音箱 / 039
Alexa Skill 擴展 Echo 功能 / 043
AI 機器人 / 047
支持語音辨認功能的智能家電 / 053
游戲機 / 055
其他 / 060
小結(jié) / 0613
第 5 章 語音界面技術(shù)
采音信號處理 / 065
語音識別 / 067
語義理解 / 069
對話應答 / 對話生成 / 073
語音合成 / 077
小結(jié) / 078
第 6 章 語音界面面臨的問題
語音界面是一場傳話游戲 / 082
何時說?說什么?怎么說? / 084
不明現(xiàn)狀的問題 / 086
尚不準確的語音識別 / 088
說話也費力 / 089
語音操作手法單一 / 090
喚醒詞太俗氣 / 092
不自然的自然表達問題 / 095
對發(fā)聲環(huán)境的依賴 / 099
發(fā)聲前間隔過長 / 100
語音輸入無法處理中斷和取消 / 101
小結(jié) / 104
第 7 章 語音助手 / 機器人語音界面“對話”
“會話”和“對話”的區(qū)別 / 109
任務(wù)型和非任務(wù)型 / 1114
語音界面沖擊
所謂聊天 / 113
會話的分類 / 116
報告型會話較多的原因 / 118
談話內(nèi)容無聊的原因 / 121
自然對話(談話)必要的六大要素 / 123
會話方案 / 130
對話表現(xiàn) / 132
交互作用分析 / 142
違和感:兒童角色口出術(shù)語 / 145
語音界面和對話中的語言文化差異 / 145
恐怖谷現(xiàn)象與對話 / 149
小結(jié) / 151
第 8 章 語音界面商業(yè)勢力圖
語音識別技術(shù)開發(fā)企業(yè) / 154
語音合成技術(shù)開發(fā)企業(yè) / 157
語音界面解決方案供應企業(yè) / 158
小結(jié) / 163
第 9 章 語音界面的未來
語音界面尚在起步階段 / 166
語音商業(yè)的未來 / 166
對話商業(yè)未來 / 172
面向自然對話時代 / 174
小結(jié) / 175