本書系統(tǒng)地闡述了語音信號(hào)處理的原理、方法、技術(shù)和應(yīng)用,同時(shí)給出了部分內(nèi)容對(duì)應(yīng)的MATLAB仿真源程序。全書共14章,第1~6章是基本理論部分,包括語音信號(hào)的數(shù)字模型、語音信號(hào)的短時(shí)時(shí)域分析、頻域分析及倒譜分析、語音信號(hào)線性預(yù)測(cè)分析和矢量量化;第7~14章是應(yīng)用部分,包括語音編碼、語音合成、語音識(shí)別、語音增強(qiáng)、小波分析、人工神經(jīng)網(wǎng)絡(luò)及獨(dú)立分量分析及其在語音信號(hào)處理中的應(yīng)用、語音質(zhì)量評(píng)價(jià)和可懂度評(píng)價(jià)原理及實(shí)現(xiàn)。 本書內(nèi)容全面,重點(diǎn)突出,原理闡述深入淺出,注重理論與實(shí)際應(yīng)用的結(jié)合,可讀性強(qiáng)。 本書可以作為高等院校通信工程、電子信息工程、自動(dòng)化、計(jì)算機(jī)技術(shù)與應(yīng)用等專業(yè)高年級(jí)本科生相關(guān)課程的教材,也可供從事語音信號(hào)處理研究的研究生和科研人員參考。
張雪英,教授,太原理工大學(xué)信息學(xué)院博士生導(dǎo)師,長(zhǎng)期以來一直從事信息處理、數(shù)字語音處理等方面的教學(xué)及研究工作。
第1章 緒論
1.1 語音信號(hào)處理的發(fā)展
1.1.1 語音合成
1.1.2 語音編碼
1.1.3 語音識(shí)別
1.2 語音信號(hào)處理的應(yīng)用
1.3 語音信號(hào)處理的過程
1.4 MATLAB在數(shù)字語音信號(hào)處理中的應(yīng)用
習(xí)題1
第2章 語音信號(hào)的數(shù)字模型
2.1 語音的發(fā)聲機(jī)理
2.1.1 人的發(fā)聲器官
2.1.2 語音生成
2.2 語音的聽覺機(jī)理
2.2.1 聽覺器官
2.2.2 聽覺掩蔽效應(yīng)
2.2.3 臨界帶寬與頻率群
2.2.4 耳蝸的信號(hào)處理機(jī)制
2.2.5 語音信號(hào)聽覺模型
2.3 語音信號(hào)的線性模型
2.3.1 激勵(lì)模型
2.3.2 聲道模型
2.3.3 輻射模型
2.3.4 語音信號(hào)數(shù)字模型
2.4 語音信號(hào)的非線性模型
2.4.1 線性模型局限性
2.4.2 幾種非線性模型
2.4.3 非線性動(dòng)力學(xué)模型
2.4.4 非線性模型在語音信號(hào)處理中的應(yīng)用及MATLAB實(shí)現(xiàn)
習(xí)題2
第3章 語音信號(hào)的短時(shí)時(shí)域分析
3.1 語音信號(hào)的預(yù)處理
3.1.1 語音信號(hào)的預(yù)加重處理
3.1.2 語音信號(hào)的加窗處理
3.2 短時(shí)平均能量
3.3 短時(shí)平均幅度函數(shù)
3.4 短時(shí)平均過零率
3.5 短時(shí)自相關(guān)分析
3.5.1 短時(shí)自相關(guān)函數(shù)
3.5.2 語音信號(hào)的短時(shí)自相關(guān)函數(shù)
3.5.3 修正的短時(shí)自相關(guān)函數(shù)
3.5.4 短時(shí)平均幅度差函數(shù)
3.6 基于能量和過零率的語音端點(diǎn)檢測(cè)
3.7 基音周期估值
3.7.1 基于短時(shí)自相關(guān)法的基音周期估值
3.7.2 基于短時(shí)平均幅度差 函數(shù)AMDF法的基音周期估值
3.7.3 基音周期估值的后處理
3.7.4 基音周期估值后處理的MATLAB實(shí)現(xiàn)
習(xí)題3
第4章 語音信號(hào)短時(shí)頻域及倒譜分析
4.1 傅里葉變換的解釋
4.1.1 短時(shí)傅里葉變換
4.1.2 窗函數(shù)的作用
4.2 濾波器的解釋
4.2.1 短時(shí)傅里葉變換的濾波器實(shí)現(xiàn)形式一
4.2.2 短時(shí)傅里葉變換的濾波器 實(shí)現(xiàn)形式二
4.3 短時(shí)綜合的濾波器組相加法
4.3.1 短時(shí)綜合的濾波器組相加法原理
4.3.2 短時(shí)綜合的濾波器組相加法的MATLAB程序?qū)崿F(xiàn)
4.3.3 短時(shí)綜合的疊接相加法原理及MATLAB程序?qū)崿F(xiàn)
4.4 語音信號(hào)的復(fù)倒譜和倒譜分析及 應(yīng)用
4.4.1 復(fù)倒譜和倒譜的定義及性質(zhì)
4.4.2 復(fù)倒譜的幾種計(jì)算方法
4.4.3 倒譜的MATLAB實(shí)現(xiàn)
4.4.4 語音的倒譜分析及應(yīng)用
習(xí)題4
第5章 語音信號(hào)線性預(yù)測(cè)分析
5.1 LPC的基本原理
5.1.1 LPC的實(shí)現(xiàn)方法
5.1.2 語音信號(hào)模型和LPC 之間的關(guān)系
5.1.3 模型增益G的確定
5.2 線性預(yù)測(cè)分析的解法
5.2.1 自相關(guān)法
5.2.2 協(xié)方差法
5.2.3 自相關(guān)法的MATLAB 實(shí)現(xiàn)
5.3 線譜對(duì)LSP分析
5.3.1 LSP的定義和特點(diǎn)
5.3.2 LPC參數(shù)到LSP參數(shù)的轉(zhuǎn)換及MATLAB實(shí)現(xiàn)
5.3.3 LSP參數(shù)到LPC參數(shù)的轉(zhuǎn)換及MATLAB實(shí)現(xiàn)
5.4 LPC的幾種推演參數(shù)
5.4.1 反射系數(shù)
5.4.2 對(duì)數(shù)面積比系數(shù)LAR
5.4.3 預(yù)測(cè)器多項(xiàng)式的根
5.4.4 預(yù)測(cè)誤差濾波器的沖激 響應(yīng)及其自相關(guān)系數(shù)
5.4.5 LPC倒譜及其MATLAB實(shí)現(xiàn)
習(xí)題5
第6章 矢量量化
6.1 矢量量化基本原理
6.1.1 矢量量化的定義
6.1.2 失真測(cè)度
6.1.3 矢量量化器
6.2 最佳矢量量化器
6.3 矢量量化器的設(shè)計(jì)算法及MATLAB實(shí)現(xiàn)
6.3.1 LBG算法
6.3.2 初始碼書的選定與空胞腔的處理
6.3.3 已知訓(xùn)練序列的LBG算法的MATLAB實(shí)現(xiàn)
6.3.4 樹形搜索矢量量化器
習(xí)題6
第7章 語音編碼原理及應(yīng)用
7.1 語音編碼的分類及特性
7.1.1 波形編碼
7.1.2 參數(shù)編碼
7.1.3 混合編碼
7.2 語音編碼性能的評(píng)價(jià)指標(biāo)
7.2.1 編碼速率
7.2.2 編碼語音質(zhì)量評(píng)價(jià)
7.2.3 編解碼延時(shí)
7.2.4 算法復(fù)雜度
7.3 語音信號(hào)波形編碼
7.3.1 脈沖編碼調(diào)制PCM
7.3.2 自適應(yīng)預(yù)測(cè)編碼APC
7.3.3 G.721編碼及算法實(shí)現(xiàn)
7.4 語音信號(hào)參數(shù)編碼
7.4.1 LPC聲碼器原理
7.4.2 LPC?10編碼器
7.5 語音信號(hào)混合編碼
7.5.1 合成分析技術(shù)和感覺加權(quán)濾波器
7.5.2 激勵(lì)模型的演變
7.5.3 G.728語音編碼標(biāo)準(zhǔn)簡(jiǎn)介
7.6 語音信號(hào)寬帶變速率編碼
習(xí)題7
第8章 語音合成
8.1 語音合成的原理及分類
8.1.1 波形合成法
8.1.2 參數(shù)合成法
8.1.3 規(guī)則合成法
8.2 共振峰合成法
8.2.1 級(jí)聯(lián)型共振峰模型
8.2.2 并聯(lián)型共振峰模型
8.2.3 混合型共振峰模型
8.3 線性預(yù)測(cè)參數(shù)合成法
8.4 基音同步疊加法
8.4.1 基音同步疊加PSOLA算法原理
8.4.2 基音同步疊加PSOLA算法實(shí)現(xiàn)步驟
8.5 文語轉(zhuǎn)換系統(tǒng)
8.5.1 文語轉(zhuǎn)換系統(tǒng)的組成
8.5.2 漢語按規(guī)則合成
習(xí)題8
第9章 語音識(shí)別基本原理與應(yīng)用
9.1 語音識(shí)別系統(tǒng)概述
9.1.1 語音信號(hào)預(yù)處理
9.1.2 語音識(shí)別特征提取
9.1.3 語音訓(xùn)練識(shí)別模型
9.2 HMM基本原理及在語音識(shí)別中的應(yīng)用
9.2.1 隱馬爾可夫模型
9.2.2 隱馬爾可夫模型的3個(gè)基本問題
9.2.3 隱馬爾可夫模型用于語音識(shí)別
9.3 支持向量機(jī)在語音識(shí)別中的應(yīng)用
9.3.1 支持向量機(jī)分類原理
9.3.2 支持向量機(jī)的模型參數(shù)選擇問題
9.3.3 支持向量機(jī)用于語音識(shí)別的MATLAB實(shí)現(xiàn)
習(xí)題9
第10章 語音增強(qiáng)原理及應(yīng)用
10.1 語音和噪聲的主要特性
10.1.1 語音的主要特性
10.1.2 噪聲的特性
10.2 語音增強(qiáng)算法的分類
10.3 單通道語音增強(qiáng)算法及MATLAB仿真實(shí)現(xiàn)
10.3.1 譜減法
10.3.2 維納濾波法
10.3.3 最小均方誤差估計(jì)法
10.3.4 子空間語音增強(qiáng)算法
10.4 多通道語音增強(qiáng)算法及MATLAB 仿真實(shí)現(xiàn)
10.4.1 陣列信號(hào)系統(tǒng)模型
10.4.2 麥克風(fēng)陣列近場(chǎng)模型與遠(yuǎn)場(chǎng)模型
10.4.3 經(jīng)典麥克風(fēng)陣列的語音增強(qiáng)算法
習(xí)題10
第11章 小波分析及在語音信號(hào)處理中的應(yīng)用
11.1 基礎(chǔ)理論
11.2 小波的特性
11.2.1 連續(xù)小波變換及性質(zhì)
11.2.2 離散小波變換及性質(zhì)
11.3 幾種常用的小波及特性
11.3.1 Haar小波
11.3.2 Daubechies(dbN)小波
11.3.3 Mexican Hat(Marr) 小波
11.3.4 Morlet小波
11.3.5 Meyer小波
11.4 小波變換在語音信號(hào)處理中的應(yīng)用
11.4.1 小波分析在語音信號(hào)預(yù)處理的應(yīng)用及MATLAB實(shí)現(xiàn)
11.4.2 小波分析在語音去噪中的應(yīng)用及MATLAB 實(shí)現(xiàn)
習(xí)題11
第12章 人工神經(jīng)網(wǎng)絡(luò)及在語音信號(hào)處理中的應(yīng)用
12.1 人工神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
12.2 人工神經(jīng)網(wǎng)絡(luò)構(gòu)成
12.2.1 神經(jīng)元
12.2.2 網(wǎng)絡(luò)拓?fù)?nbsp;
12.2.3 網(wǎng)絡(luò)的學(xué)習(xí)算法
12.3 幾種神經(jīng)網(wǎng)絡(luò)模型及其算法
12.3.1 單層感知器
12.3.2 多層感知器
12.3.3 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
12.3.4 自組織特征映射神經(jīng)網(wǎng)絡(luò)
12.4 神經(jīng)網(wǎng)絡(luò)在語音信號(hào)處理中的應(yīng)用
12.4.1 RBF神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用及MATLAB 實(shí)現(xiàn)
12.4.2 自組織神經(jīng)網(wǎng)絡(luò)在語音編碼中的應(yīng)用及MATLAB 實(shí)現(xiàn)
習(xí)題12
第13章 獨(dú)立分量分析及在語音信號(hào)處理中的應(yīng)用
13.1 基礎(chǔ)理論
13.1.1 ICA的定義與數(shù)學(xué)模型
13.1.2 ICA的基本假設(shè)、不確定性及求解過程
13.1.3 ICA中信號(hào)的預(yù)處理
13.1.4 ICA的目標(biāo)函數(shù)
13.1.5 ICA性能評(píng)價(jià)參數(shù)
13.2 經(jīng)典ICA算法
13.2.1 自然梯度算法
13.2.2 信息最大化法
13.2.3 快速ICA算法 (FASTICA)
13.3 ICA在語音信號(hào)處理中的應(yīng)用及MATLAB實(shí)現(xiàn)
13.3.1 INFORMAX算法在語音盲信號(hào)分離中的應(yīng)用及MATLAB實(shí)現(xiàn)
13.3.2 FASTICA算法在語音盲信號(hào)分離中的應(yīng)用及MATLAB實(shí)現(xiàn)
習(xí)題13
第14章 語音質(zhì)量評(píng)價(jià)和可懂度評(píng)價(jià)
14.1 語音質(zhì)量與可懂度
14.2 語音質(zhì)量的主觀評(píng)價(jià)方法
14.3 語音可懂度的主觀評(píng)價(jià)方法
14.4 語音質(zhì)量客觀評(píng)價(jià)方法
14.4.1 時(shí)域和頻域分段信噪比的方法及MATLAB 實(shí)現(xiàn)
14.4.2 基于LPC客觀評(píng)價(jià)方法及MATLAB實(shí)現(xiàn)
14.4.3 語音質(zhì)量的感知評(píng)價(jià)方法(PESQ)及MATLAB實(shí)現(xiàn)
14.5 語音可懂度客觀評(píng)價(jià)方法
14.5.1 加權(quán)頻帶信噪比評(píng)價(jià)方法及MATLAB實(shí)現(xiàn)
14.5.2 歸一化協(xié)方差評(píng)價(jià)方法(NCM)及MATLAB 實(shí)現(xiàn)
14.5.3 短時(shí)清晰度指數(shù)評(píng)價(jià)方法(AI-ST)及MATLAB實(shí)現(xiàn)
習(xí)題14
附錄A 專業(yè)術(shù)語縮寫英漢對(duì)照表
附錄B 程序索引
參考文獻(xiàn)