21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材:多媒體技術(shù)及其應(yīng)用(第2版)
定 價(jià):39 元
叢書名:21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材
- 作者:張明 編
- 出版時(shí)間:2013/1/1
- ISBN:9787301217528
- 出 版 社:北京大學(xué)出版社
- 中圖法分類:TP37
- 頁碼:313
- 紙張:膠版紙
- 版次:2
- 開本:16開
多媒體技術(shù)是集文字、圖形、圖像、動(dòng)畫、音頻、視頻于一體的信息處理技術(shù)。它綜合了當(dāng)代計(jì)算機(jī)硬件和軟件的最新成果,是計(jì)算機(jī)技術(shù)的重要發(fā)展方向!21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材:多媒體技術(shù)及其應(yīng)用(第2版)》較系統(tǒng)地介紹了多媒體計(jì)算機(jī)的基本原理、處理技術(shù)和具體應(yīng)用。
全書共10章,分別介紹了多媒體技術(shù)的基本概念、音頻信號處理技術(shù)、數(shù)字圖像與視頻處理技術(shù)、多媒體數(shù)據(jù)壓縮技術(shù)、計(jì)算機(jī)動(dòng)畫技術(shù)、多媒體信息的組織與管理、多媒體數(shù)據(jù)存儲技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、多媒體通信技術(shù)和多媒體技術(shù)實(shí)驗(yàn)。本書對多媒體技術(shù)的主要研究內(nèi)容、開發(fā)設(shè)計(jì)方法和應(yīng)用實(shí)例做了系統(tǒng)的闡述,并配有教案演示文稿、實(shí)驗(yàn)指導(dǎo)和相應(yīng)的實(shí)驗(yàn)素材。
在《21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材:多媒體技術(shù)及其應(yīng)用(第2版)》的編寫過程中,力求做到深入淺出,可讀易懂。在內(nèi)容的選取上,遵循多媒體計(jì)算機(jī)技術(shù)原理與多媒體技術(shù)應(yīng)用相結(jié)合的原則,全面系統(tǒng)地介紹多媒體計(jì)算機(jī)原理與多媒體技術(shù)應(yīng)用;既注重理論、方法和標(biāo)準(zhǔn)的介紹,又兼顧實(shí)際系統(tǒng)分析、具體技術(shù)討論和實(shí)際應(yīng)用舉例。
《21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材:多媒體技術(shù)及其應(yīng)用(第2版)》可作為“多媒體技術(shù)原理與應(yīng)用”或“多媒體應(yīng)用技術(shù)”等相關(guān)課程的教科書,也可作為科學(xué)技術(shù)人員、計(jì)算機(jī)愛好者以及從事計(jì)算機(jī)行業(yè)的工程技術(shù)人員的參考用書。
《21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材:多媒體技術(shù)及其應(yīng)用(第2版)》根據(jù)教學(xué)實(shí)踐,著眼于培養(yǎng)學(xué)生的創(chuàng)新實(shí)踐能力。融人一線教師多年的教學(xué)經(jīng)驗(yàn)與科研成果,幫助學(xué)生全面提高應(yīng)用技術(shù)。在普及科技知識的同時(shí),將人文知識融入理論講解,提高學(xué)生的綜合素質(zhì)。配套的教學(xué)課件、源代碼、素材和習(xí)題答案等教學(xué)資源,全面方便教與學(xué)。
第1章 多媒體技術(shù)概述
1.1 多媒體技術(shù)基本概念
1.1.1 數(shù)據(jù)、信息與媒體
1.1.2 多媒體與多媒體技術(shù)
1.1.3 多媒體技術(shù)的特點(diǎn)
1.2 多媒體技術(shù)的發(fā)展
1.3 多媒體系統(tǒng)的構(gòu)成
1.3.1 基本組成
1.3.2 多媒體系統(tǒng)的硬件結(jié)構(gòu)
1.3.3 多媒體系統(tǒng)的軟件結(jié)構(gòu)
1.3.4 工作站環(huán)境的多媒體體系結(jié)構(gòu)
1.4 多媒體系統(tǒng)中的若干技術(shù)
1.5 感知媒體的基本特性
1.5.1 文本
1.5.2 音頻
1.5.3 圖像
1.5.4 圖形
1.5.5 動(dòng)畫
1.5.6 視頻
1.6 多媒體技術(shù)的應(yīng)用與發(fā)展趨勢
1.6.1 多媒體技術(shù)的應(yīng)用概況
1.6.2 多媒體技術(shù)的發(fā)展趨勢
1.7 小結(jié)
1.8 習(xí)題
第2章 音頻信號處理技術(shù)
2.1 聲音的特性、類型與處理
2.1.1 聲音的特性
2.1.2 聲音的類型與處理
2.2 聲卡的構(gòu)成與功能
2.2.1 聲卡的組成
2.2.2 聲卡的主要功能
2.2.3 聲卡的性能指標(biāo)
2.3 波形聲音的數(shù)字化
2.3.1 采樣
2.3.2 量化
2.3.3 編碼
2.3.4 聲音的重構(gòu)
2.4 聲音文件的存儲格式
2.5 MIDI音樂
2.5.1 MIDI簡介
2.5.2 MIDI相關(guān)的術(shù)語
2.5.3 MIDI音樂合成方法
2.5.4 電子樂器數(shù)字接口(MIDI)系統(tǒng)
2.6 音頻信息的壓縮技術(shù)
2.7 數(shù)字語音的應(yīng)用
2.7.1 語音識別
2.7.2 語音合成
2.8 聲音媒體編輯軟件的應(yīng)用
2.8.1 Windows的錄音機(jī)軟件
2.8.2 聲音編輯軟件Cool Edit
2.9 小結(jié)
2.10 習(xí)題
第3章 數(shù)字圖像與視頻處理技術(shù)
3.1 概述
3.2 數(shù)字圖像數(shù)據(jù)的獲取與表示
3.2.1 數(shù)字圖像數(shù)據(jù)的獲取
3.2.2 數(shù)字圖像的表示
3.3 圖像的基本屬性
3.3.1 分辨率
3.3.2 像素深度
3.3.3 顏色空間
3.3.4 真彩色、偽彩色與直接色
3.3.5 常用圖像文件的格式
3.4 圖像處理軟件Photoshop應(yīng)用舉例
3.4.1 圖像處理軟件Photoshop簡介
3.4.2 Photoshop的運(yùn)行界面
3.4.3 Photoshop的圖層與濾鏡
3.4.4 Photoshop應(yīng)用舉例
3.5 視頻的基本知識
3.5.1 視頻信號的特性
3.5.2 彩色電視制式
3.6 視頻的數(shù)字化
3.6.1 視頻信息的獲取
3.6.2 視頻信息的數(shù)字化
3.6.3 視頻信號的采樣格式
3.7 數(shù)字視頻標(biāo)準(zhǔn)
3.8 視頻信息的壓縮編碼
3.8.1 概述
3.8.2 常用的圖像壓縮方案
3.9 Windows中的視頻編輯軟件
3.9.1 Windows Movie Maker的運(yùn)行
3.9.2 獲得要編輯的視頻
3.9.3 編輯視頻
3.9.4 使用視頻過渡、視頻效果、片頭/片尾
3.9.5 為視頻剪輯添加背景音樂
3.9.6 保存和發(fā)送電影
3.10 數(shù)字視頻的應(yīng)用
3.11 小結(jié)
3.12 習(xí)題
第4章 多媒體數(shù)據(jù)壓縮技術(shù)
4.1 數(shù)據(jù)壓縮的基本原理和方法
4.1.1 數(shù)據(jù)壓縮概述
4.1.2 數(shù)據(jù)壓縮的基本原理
4..3 常用的數(shù)據(jù)壓縮方法
4.2 靜態(tài)圖像的壓縮標(biāo)準(zhǔn)
4.2.1 JPEG標(biāo)準(zhǔn)簡介
4.2.2 JPEG標(biāo)準(zhǔn)中的主要技術(shù)
4.2.3 JPEG標(biāo)準(zhǔn)對靜態(tài)圖像的壓縮過程
4.2.4 JPEG 2000
4.3 運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)
4.3.1 MPEG系列標(biāo)準(zhǔn)
4.3.2 MPEG-1標(biāo)準(zhǔn)中的主要技術(shù)及壓縮過程
4.3.3 MPEG-2標(biāo)準(zhǔn)對MPEG-1的改進(jìn)
4.3.4 MPEG-4標(biāo)準(zhǔn)中的新技術(shù)
4.3.5 多媒體內(nèi)容描述接口標(biāo)準(zhǔn)MPEG-7
4.4 ITU-T H.26x 視聽通信編碼解碼標(biāo)準(zhǔn)
4.4.1 H.26x標(biāo)準(zhǔn)簡介
4.4.2 H.261標(biāo)準(zhǔn)中的主要技術(shù)
4.5 小結(jié)
4.6 習(xí)題
第5章 多媒體計(jì)算機(jī)動(dòng)畫技術(shù)
5.1 計(jì)算機(jī)動(dòng)畫
5.2 計(jì)算機(jī)動(dòng)畫的應(yīng)用
5.3 計(jì)算機(jī)動(dòng)畫的分類
5.4 計(jì)算機(jī)動(dòng)畫的生成
5.4.1 二維動(dòng)畫
5.4.2 三維動(dòng)畫
5.4.3 三維動(dòng)畫制作軟件3dS Max
5.5 計(jì)算機(jī)動(dòng)畫運(yùn)動(dòng)控制方法
5.6 動(dòng)畫語言、動(dòng)畫傳輸與發(fā)展趨勢
5.6.1 動(dòng)畫語言簡介
5.6.2 動(dòng)畫的傳輸
5.6.3 計(jì)算機(jī)動(dòng)畫的發(fā)展趨勢
5.7 FlashProfessional動(dòng)畫制作
5.7.1 Flash Professional的啟動(dòng)與用戶界面
5.7.2 利用工具箱中的工具畫圖
5.7.3 簡單動(dòng)畫的制作
5.8 小結(jié)
5.9 習(xí)題
第6章 多媒體信息的組織與管理
6.1 多媒體數(shù)據(jù)與數(shù)據(jù)管理
6.1.1 多媒體數(shù)據(jù)的特點(diǎn)
6.1.2 多媒體數(shù)據(jù)的管理技術(shù)
6.2 超文本與超媒體
6.2.1 超文本與超媒體的概念
……
第7章 多媒體數(shù)據(jù)存儲技術(shù)
第8章 虛擬現(xiàn)實(shí)技術(shù)
第9章 多媒體通信
第10章 多媒體技術(shù)實(shí)驗(yàn)
參考文獻(xiàn)
在這一技術(shù)中,通過補(bǔ)償語音速率變化來完成識別,而補(bǔ)償語音速率變化又是通過前面所述的稱為動(dòng)態(tài)時(shí)間變形的過程,以及把調(diào)整了的連接詞短語表示成沿時(shí)間軸滑過所存儲的單詞模板以找到可能的匹配這樣一個(gè)過程來實(shí)現(xiàn)的。如果在給定時(shí)間內(nèi),任何相似性顯示出已經(jīng)在說出的短語和模板中找到了相同的詞,識別器就定位出模板中的關(guān)鍵詞。將動(dòng)態(tài)時(shí)間變形技術(shù)用于連接詞短語上來消除或減少由于講話者個(gè)人或其他影響語音的因素,如因興奮而造成的講出單詞速率的變化。不同情況下,可以用不同的重音和速度說出同一短語。如果我們在每次用不同的重音說出短語時(shí),都抽取所說短語的瞬時(shí)寫照,并在時(shí)間域中生成幀,我們會很快發(fā)現(xiàn)每一獲取幀是如何相對其他幀而變化的。這就提供了表示所說短語中可能變化的時(shí)間變化參數(shù)范圍。當(dāng)把動(dòng)態(tài)時(shí)間變形技術(shù)用于連接詞語音識別時(shí),就可以用數(shù)學(xué)上的壓縮或擴(kuò)展幀去除可能的時(shí)間變化,然后把幀與存儲模板相比較來進(jìn)行識別。
為什么連接詞語音識別是有用的?這是一種命令識別的高級形式,其中命令是短語而不是單一的詞。例如,連接詞語音識別可以用于執(zhí)行操作的應(yīng)用中。如短語“給總部打電話”,會引起查詢總部電話并撥號。類似于孤立詞語音識別,連接詞語音識別可用于命令和控制應(yīng)用之中。
3)連續(xù)語音識別
這種方法比孤立單詞或連接詞語音識別都復(fù)雜許多。它提出了兩個(gè)主要問題:分割和標(biāo)志過程,在此過程中把語音段標(biāo)記成代表音素、半音節(jié)、音節(jié)和單詞等更小的單元,以及為跟上輸入語音并實(shí)時(shí)地識別詞序列所需要的計(jì)算能力。用現(xiàn)行的數(shù)字信號處理器,可以通過選擇正確的CPU體系結(jié)構(gòu)來獲得實(shí)時(shí)連續(xù)語音識別需要的計(jì)算能力。連續(xù)語音識別系統(tǒng)可以分以下3部分。
(1)數(shù)字化、幅度歸一化、時(shí)間歸一化和參數(shù)表示。
。2)分割并把語音段標(biāo)記成在基于知識或基于規(guī)則系統(tǒng)上的符號串。用于表征語言段特征的知識類型是:語音學(xué),它描述了語音聲音(英語中只有41個(gè)音素);詞匯學(xué),它描述了聲音類型;語法,它描述了語言的語法結(jié)構(gòu);語義學(xué),它描述了詞和句子語義;語用學(xué),它描述了句子的上下文。多數(shù)連續(xù)語音識別系統(tǒng)是使用基于語音學(xué)的、詞匯學(xué)的、語法的知識系統(tǒng)。
。3)識別詞序列并進(jìn)行語音段匹配。在連續(xù)語音識別系統(tǒng)中,語音信號的前端處理與孤立單詞語音識別系統(tǒng)中的一樣。它把模擬信號轉(zhuǎn)換成數(shù)字信號,進(jìn)行幅度和噪聲歸一化以使由于周圍噪聲、講話者的聲音、講話者相對于麥克風(fēng)的距離和位置、講話者的呼吸噪聲等引起的語音變化最小化。下一步由參數(shù)分析組成,它是一個(gè)抽取時(shí)間變化的語音參數(shù),如共振峰、輔音、線性可預(yù)測編碼系數(shù)等的預(yù)處理階段。這一步驟有兩個(gè)目的:首先,它抽取了與下一步相關(guān)的時(shí)間變化語音參數(shù);其次,它通過抽取相關(guān)語音參數(shù)而減少了數(shù)據(jù)量。
下一步完成把語音分割為10ms的段并標(biāo)記這些段。如何標(biāo)記語音段?孤立詞語音識別器使用了把未知發(fā)音與已知的參考模式相比較的技術(shù)。如果未知發(fā)音與已知參考模式之一相類似,那么就找到了一個(gè)匹配并識別出了發(fā)音。對于連續(xù)語音識別,例如,100個(gè)詞的詞匯表會需要超過1000個(gè)參考模式。這就要求更大的存儲和更快的計(jì)算引擎在模式中搜索并完成把模式輸入到系統(tǒng)中的處理。如果實(shí)時(shí)地完成上述處理,這將會是一個(gè)很高的要求。為解決這一問題,要把語音分割成更小的符號單元段,它們表示語音、音素、半音節(jié)、音節(jié)和單詞。分割過程生成了10ms的“快照”,并把語音的時(shí)間變化表示轉(zhuǎn)換成符號表示。
再下一步是對語音段作標(biāo)記,其中使用了由語音、詞匯語法和語義知識組成的知識系統(tǒng)。
……