本書(shū)基于聲智科技SoundAI Azero智能操作系統(tǒng),詳細(xì)介紹智能語(yǔ)音交互開(kāi)發(fā)的全過(guò)程,包括智能語(yǔ)音趨勢(shì)、智能系統(tǒng)基礎(chǔ)、技能開(kāi)發(fā)實(shí)踐等,以及如何在SoundPi智能開(kāi)發(fā)魔盒上進(jìn)行設(shè)備和技能開(kāi)發(fā)。SoundPi是聲智科技按照消費(fèi)電子產(chǎn)品標(biāo)準(zhǔn)研發(fā)設(shè)計(jì)的開(kāi)發(fā)套件,內(nèi)置SoundAI Azero,支持快捷二次開(kāi)發(fā),開(kāi)放多種硬件接口,支持IoT設(shè)備控制,是開(kāi)發(fā)者體驗(yàn)智能、驗(yàn)證產(chǎn)品、擴(kuò)展應(yīng)用的標(biāo)準(zhǔn)參考硬件。書(shū)中的開(kāi)發(fā)教程為使用者提供直接、高效的學(xué)習(xí)和實(shí)踐方式,幫助快速打造具有語(yǔ)音交互功能的智能產(chǎn)品,為下一步的高階開(kāi)發(fā)奠定基礎(chǔ)。
本書(shū)是智能語(yǔ)音開(kāi)發(fā)的入門(mén)書(shū)籍,可供學(xué)生、初學(xué)者和開(kāi)發(fā)愛(ài)好者進(jìn)行智能語(yǔ)音開(kāi)發(fā)時(shí)參考。
人工智能賦予了機(jī)器自主決策的能力,將帶動(dòng)各個(gè)行業(yè)從電氣化、自動(dòng)化升級(jí)到智能化時(shí)代,是帶動(dòng)全球經(jīng)濟(jì)增長(zhǎng)的關(guān)鍵技術(shù)創(chuàng)新。這已經(jīng)是全球的共識(shí),其重要性毋庸置疑。但是人工智能怎樣才能像互聯(lián)網(wǎng)一樣成為引領(lǐng)一個(gè)新興時(shí)代的核心推動(dòng)力呢?這其實(shí)也是全球創(chuàng)新組織進(jìn)行技術(shù)迭代和商業(yè)探索的困惑:技術(shù)做到什么程度才是重大突破?技術(shù)應(yīng)用到行業(yè)是“+AI”還是“AI+”?技術(shù)在商業(yè)實(shí)踐中扮演什么角色?其實(shí),人工智能與互聯(lián)網(wǎng)的發(fā)展歷程類似。目前,人工智能處于早期階段,當(dāng)下最為重要的任務(wù)是普及人工智能知識(shí),培養(yǎng)人工智能人才,這才是我國(guó)人工智能發(fā)展的關(guān)鍵,也是我國(guó)人工智能引領(lǐng)全球的基礎(chǔ)。
核心技術(shù)的競(jìng)爭(zhēng)歸根結(jié)底還是人才的競(jìng)爭(zhēng),我國(guó)把人工智能提升為國(guó)家戰(zhàn)略。2018年教育部印發(fā)的《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》,明確指出當(dāng)前人工智能人才還存在巨大缺口以及分布不均的問(wèn)題。人工智能人才在產(chǎn)業(yè)鏈的分布上可以劃分為三個(gè)層次:基礎(chǔ)層、技術(shù)層、應(yīng)用層。其中,基礎(chǔ)層主要包括數(shù)據(jù)、芯片、算法三個(gè)方面,技術(shù)層主要是計(jì)算機(jī)視覺(jué)、智能語(yǔ)音交互、知識(shí)圖譜、機(jī)器學(xué)習(xí)等,應(yīng)用層則覆蓋了汽車、安防、金融、醫(yī)療、家居、教育等應(yīng)用場(chǎng)景。人工智能的興起必須依賴全產(chǎn)業(yè)鏈條的人才儲(chǔ)備。我國(guó)各高校已經(jīng)開(kāi)始這項(xiàng)偉大的工程,目前有超過(guò)一百家高校開(kāi)設(shè)了人工智能相關(guān)專業(yè)和課程,包括清華大學(xué)、北京大學(xué)、中國(guó)科學(xué)院大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、北京航空航天大學(xué)、中國(guó)人民大學(xué)等。與此同時(shí),人工智能也逐漸進(jìn)入中小學(xué)課堂進(jìn)行試點(diǎn)教育�?梢灶A(yù)見(jiàn),不久之后人工智能將會(huì)成為大中小學(xué)生的必修課程,人工智能技術(shù)將成為未來(lái)職場(chǎng)人士必備的知識(shí)和技能之一。
但是,人工智能普及基礎(chǔ)教育的周期較長(zhǎng),大中小學(xué)和職業(yè)教育的學(xué)生也需要一個(gè)即時(shí)應(yīng)用的示范,這就需要在應(yīng)用教育方面尋求一個(gè)突破口。智能語(yǔ)音作為人工智能的基礎(chǔ)技術(shù)和入口,也是人工智能應(yīng)用的關(guān)鍵所在,而且在消費(fèi)電子領(lǐng)域以智能音箱為代表在全球引領(lǐng)了人工智能的場(chǎng)景示范,孕育了從傳感、芯片、系統(tǒng)到方案的成熟產(chǎn)業(yè)鏈,囊括了全球包括亞馬遜、蘋(píng)果、谷歌、微軟、百度、華為、阿里、騰訊等著名公司,不僅是入門(mén)人工智能行業(yè)的快速通道,而且也是謀求職業(yè)轉(zhuǎn)型的優(yōu)先選擇。
智能語(yǔ)音是一個(gè)復(fù)雜冗長(zhǎng)的鏈條技術(shù),融合了聲學(xué)、語(yǔ)音和語(yǔ)言三大學(xué)科。即便最簡(jiǎn)單的人機(jī)對(duì)話,至少也需要聲學(xué)算法、語(yǔ)音喚醒、端點(diǎn)檢測(cè)、語(yǔ)音識(shí)別、語(yǔ)言理解和語(yǔ)音合成等,僅僅聲學(xué)算法就包括了回聲抵消、噪聲抑制、聲源定位、混響消除、波束形成等具體算法。顯然,智能語(yǔ)音的這種技術(shù)復(fù)雜性大幅增加了學(xué)習(xí)和開(kāi)發(fā)的成本,不利于行業(yè)應(yīng)用和場(chǎng)景落地。因此,我國(guó)有必要建設(shè)一套以操作系統(tǒng)為核心的中間層AI作為基礎(chǔ)設(shè)施,并以此為契機(jī)加強(qiáng)人工智能領(lǐng)域的教育培訓(xùn),抓住人工智能技術(shù)和行業(yè)與國(guó)外同步發(fā)展的契機(jī)。
SoundAI Azero是聲智科技基于全球領(lǐng)先的遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù),是為企業(yè)、個(gè)人及第三方開(kāi)發(fā)者免費(fèi)開(kāi)放的全鏈條AI操作系統(tǒng),致力于連接有價(jià)值的信息、服務(wù)與設(shè)備,讓智能服務(wù)隨處可享。Azero經(jīng)過(guò)了數(shù)十億次人機(jī)交互真實(shí)場(chǎng)景的規(guī)模驗(yàn)證,可為家居、辦公、車載、可穿戴等20+場(chǎng)景和設(shè)備提供高效的人機(jī)交互和智能決策能力。Azero默認(rèn)集成了信息查詢、影音娛樂(lè)、IoT控制等200+項(xiàng)常用技能與服務(wù),同時(shí)提供簡(jiǎn)單好用的語(yǔ)音技能開(kāi)發(fā)工具和一站式智能語(yǔ)音軟硬件方案,可以極大地降低AI行業(yè)應(yīng)用的開(kāi)發(fā)難度和使用門(mén)檻,快速滿足不同用戶和行業(yè)群體的個(gè)性化需求。
本書(shū)作為SoundAI Azero智能操作系統(tǒng)的參考用書(shū),側(cè)重開(kāi)發(fā)基礎(chǔ)和應(yīng)用實(shí)踐,適合中學(xué)及高等院校的師生學(xué)習(xí)和實(shí)踐,相應(yīng)內(nèi)容也將及時(shí)在SoundAI Azero網(wǎng)站同步更新。
由于作者水平有限,書(shū)中錯(cuò)誤與不妥之處在所難免,懇請(qǐng)廣大讀者批評(píng)指正。
聲智科技董事長(zhǎng)兼CEO:陳孝良
2019年5月7日
第一部分 智能語(yǔ)音技術(shù)入門(mén)
第1章 智能語(yǔ)音技術(shù)時(shí)代的來(lái)臨
1.1智能語(yǔ)音的趨勢(shì)與挑戰(zhàn)
1.2如何學(xué)習(xí)智能語(yǔ)音開(kāi)發(fā)
第二部分 如何開(kāi)發(fā)語(yǔ)音交互技能
第2章 技能接入
2.1技能概述
2.1.1什么是技能
2.1.2技能的類型
2.1.3如何與技能交互
2.2技能交互設(shè)計(jì)規(guī)范
2.2.1技能場(chǎng)景定義
2.2.2技能語(yǔ)料設(shè)計(jì)
2.2.3技能引導(dǎo)設(shè)計(jì)
2.2.4多輪對(duì)話設(shè)計(jì)
2.2.5技能風(fēng)格設(shè)計(jì)
2.2.6技能發(fā)布設(shè)計(jì)
第3章 技能接入案例研究
3.1自定義技能案例
3.1.1技能接入條件
3.1.2初級(jí)技能案例分析
3.1.3中級(jí)技能案例分析
3.1.4相關(guān)接口介紹
3.2內(nèi)容信源技能案例
3.2.1技能創(chuàng)建流程
3.2.2相關(guān)接口介紹
3.3智能家居技能案例
3.3.1智能家居介紹
3.3.2技能接入條件
3.3.3技能創(chuàng)建流程
3.3.4相關(guān)接口介紹
第三部分 如何升級(jí)成智能語(yǔ)音硬件產(chǎn)品
第4章 設(shè)備接入
4.1設(shè)備接入介紹
4.2 設(shè)備接入流程
第5章 設(shè)備接入?yún)f(xié)議
5.1 設(shè)備介紹
5.1.1 設(shè)備簡(jiǎn)介
5.1.2 設(shè)備特點(diǎn)
5.2 設(shè)備架構(gòu)協(xié)議介紹
5.2.1底層架構(gòu)圖
5.2.2應(yīng)用層架構(gòu)圖
5.3 設(shè)備業(yè)務(wù)接口介紹
5.3.1 設(shè)備開(kāi)發(fā)架構(gòu)
5.3.2 通用接口
5.3.3 micbasex業(yè)務(wù)接口
5.4 設(shè)備基礎(chǔ)業(yè)務(wù)介紹
5.4.1主程序業(yè)務(wù)
5.4.2 Basex業(yè)務(wù)
5.5 設(shè)備集成并使用Demo
5.5.1交叉編譯
5.5.2 Demo運(yùn)行
第四部分 開(kāi)發(fā)套件
第6章 SoundPi Cube智能開(kāi)發(fā)魔盒
6.1 認(rèn)識(shí)SoundPi
6.1.1 設(shè)備基本參數(shù)
6.1.2 設(shè)備包裝清單
6.1.3 設(shè)備接口說(shuō)明
6.2 使用SoundPi
6.2.1 安裝與配置
6.2.2 使用設(shè)備功能
6.2.3 安裝最新的Azero apk
6.3 重置SoundPi
6.3.1 固件安裝
6.3.2 卸載Azero app
第7章 SoundPi Mini Board開(kāi)發(fā)套件
7.1 認(rèn)識(shí)SoundPi Mini Board開(kāi)發(fā)套件
7.1.1 設(shè)備基本參數(shù)
7.1.2 設(shè)備接口說(shuō)明
7.2 使用SoundPi Mini Board
7.2.1 連接設(shè)備
7.2.2 使用設(shè)備功能
7.3 重置SoundPi Mini Board
7.3.1 固件安裝
7.3.2 結(jié)束Azero app
7.3.3 更新網(wǎng)絡(luò)