成人黄色免费看,亚洲国产欧美在线成人AAAA

　　多媒體技術(shù)是集文字、圖形、圖像、動(dòng)畫、音頻、視頻于一體的信息處理技術(shù)。它綜合了當(dāng)代計(jì)算機(jī)硬件和軟件的最新成果，是計(jì)算機(jī)技術(shù)的重要發(fā)展方向�！�21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材：多媒體技術(shù)及其應(yīng)用（第2版）》較系統(tǒng)地介紹了多媒體計(jì)算機(jī)的基本原理、處理技術(shù)和具體應(yīng)用。
　　全書共10章，分別介紹了多媒體技術(shù)的基本概念、音頻信號處理技術(shù)、數(shù)字圖像與視頻處理技術(shù)、多媒體數(shù)據(jù)壓縮技術(shù)、計(jì)算機(jī)動(dòng)畫技術(shù)、多媒體信息的組織與管理、多媒體數(shù)據(jù)存儲技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、多媒體通信技術(shù)和多媒體技術(shù)實(shí)驗(yàn)。本書對多媒體技術(shù)的主要研究內(nèi)容、開發(fā)設(shè)計(jì)方法和應(yīng)用實(shí)例做了系統(tǒng)的闡述，并配有教案演示文稿、實(shí)驗(yàn)指導(dǎo)和相應(yīng)的實(shí)驗(yàn)素材。
　　在《21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材：多媒體技術(shù)及其應(yīng)用（第2版）》的編寫過程中，力求做到深入淺出，可讀易懂。在內(nèi)容的選取上，遵循多媒體計(jì)算機(jī)技術(shù)原理與多媒體技術(shù)應(yīng)用相結(jié)合的原則，全面系統(tǒng)地介紹多媒體計(jì)算機(jī)原理與多媒體技術(shù)應(yīng)用；既注重理論、方法和標(biāo)準(zhǔn)的介紹，又兼顧實(shí)際系統(tǒng)分析、具體技術(shù)討論和實(shí)際應(yīng)用舉例。
　　《21世紀(jì)全國應(yīng)用型本科計(jì)算機(jī)系列實(shí)用規(guī)劃教材：多媒體技術(shù)及其應(yīng)用（第2版）》可作為“多媒體技術(shù)原理與應(yīng)用”或“多媒體應(yīng)用技術(shù)”等相關(guān)課程的教科書，也可作為科學(xué)技術(shù)人員、計(jì)算機(jī)愛好者以及從事計(jì)算機(jī)行業(yè)的工程技術(shù)人員的參考用書。

　　在這一技術(shù)中，通過補(bǔ)償語音速率變化來完成識別，而補(bǔ)償語音速率變化又是通過前面所述的稱為動(dòng)態(tài)時(shí)間變形的過程，以及把調(diào)整了的連接詞短語表示成沿時(shí)間軸滑過所存儲的單詞模板以找到可能的匹配這樣一個(gè)過程來實(shí)現(xiàn)的。如果在給定時(shí)間內(nèi)，任何相似性顯示出已經(jīng)在說出的短語和模板中找到了相同的詞，識別器就定位出模板中的關(guān)鍵詞。將動(dòng)態(tài)時(shí)間變形技術(shù)用于連接詞短語上來消除或減少由于講話者個(gè)人或其他影響語音的因素，如因興奮而造成的講出單詞速率的變化。不同情況下，可以用不同的重音和速度說出同一短語。如果我們在每次用不同的重音說出短語時(shí)，都抽取所說短語的瞬時(shí)寫照，并在時(shí)間域中生成幀，我們會很快發(fā)現(xiàn)每一獲取幀是如何相對其他幀而變化的。這就提供了表示所說短語中可能變化的時(shí)間變化參數(shù)范圍。當(dāng)把動(dòng)態(tài)時(shí)間變形技術(shù)用于連接詞語音識別時(shí)，就可以用數(shù)學(xué)上的壓縮或擴(kuò)展幀去除可能的時(shí)間變化，然后把幀與存儲模板相比較來進(jìn)行識別。
　　為什么連接詞語音識別是有用的？這是一種命令識別的高級形式，其中命令是短語而不是單一的詞。例如，連接詞語音識別可以用于執(zhí)行操作的應(yīng)用中。如短語“給總部打電話”，會引起查詢總部電話并撥號。類似于孤立詞語音識別，連接詞語音識別可用于命令和控制應(yīng)用之中。
　　3）連續(xù)語音識別
　　這種方法比孤立單詞或連接詞語音識別都復(fù)雜許多。它提出了兩個(gè)主要問題：分割和標(biāo)志過程，在此過程中把語音段標(biāo)記成代表音素、半音節(jié)、音節(jié)和單詞等更小的單元，以及為跟上輸入語音并實(shí)時(shí)地識別詞序列所需要的計(jì)算能力。用現(xiàn)行的數(shù)字信號處理器，可以通過選擇正確的CPU體系結(jié)構(gòu)來獲得實(shí)時(shí)連續(xù)語音識別需要的計(jì)算能力。連續(xù)語音識別系統(tǒng)可以分以下3部分。
　　（1）數(shù)字化、幅度歸一化、時(shí)間歸一化和參數(shù)表示。
　�。�2）分割并把語音段標(biāo)記成在基于知識或基于規(guī)則系統(tǒng)上的符號串。用于表征語言段特征的知識類型是：語音學(xué)，它描述了語音聲音（英語中只有41個(gè)音素）；詞匯學(xué)，它描述了聲音類型；語法，它描述了語言的語法結(jié)構(gòu)；語義學(xué)，它描述了詞和句子語義；語用學(xué)，它描述了句子的上下文。多數(shù)連續(xù)語音識別系統(tǒng)是使用基于語音學(xué)的、詞匯學(xué)的、語法的知識系統(tǒng)。
　�。�3）識別詞序列并進(jìn)行語音段匹配。在連續(xù)語音識別系統(tǒng)中，語音信號的前端處理與孤立單詞語音識別系統(tǒng)中的一樣。它把模擬信號轉(zhuǎn)換成數(shù)字信號，進(jìn)行幅度和噪聲歸一化以使由于周圍噪聲、講話者的聲音、講話者相對于麥克風(fēng)的距離和位置、講話者的呼吸噪聲等引起的語音變化最小化。下一步由參數(shù)分析組成，它是一個(gè)抽取時(shí)間變化的語音參數(shù)，如共振峰、輔音、線性可預(yù)測編碼系數(shù)等的預(yù)處理階段。這一步驟有兩個(gè)目的：首先，它抽取了與下一步相關(guān)的時(shí)間變化語音參數(shù)；其次，它通過抽取相關(guān)語音參數(shù)而減少了數(shù)據(jù)量。
　　下一步完成把語音分割為10ms的段并標(biāo)記這些段。如何標(biāo)記語音段？孤立詞語音識別器使用了把未知發(fā)音與已知的參考模式相比較的技術(shù)。如果未知發(fā)音與已知參考模式之一相類似，那么就找到了一個(gè)匹配并識別出了發(fā)音。對于連續(xù)語音識別，例如，100個(gè)詞的詞匯表會需要超過1000個(gè)參考模式。這就要求更大的存儲和更快的計(jì)算引擎在模式中搜索并完成把模式輸入到系統(tǒng)中的處理。如果實(shí)時(shí)地完成上述處理，這將會是一個(gè)很高的要求。為解決這一問題，要把語音分割成更小的符號單元段，它們表示語音、音素、半音節(jié)、音節(jié)和單詞。分割過程生成了10ms的“快照”，并把語音的時(shí)間變化表示轉(zhuǎn)換成符號表示。
　　再下一步是對語音段作標(biāo)記，其中使用了由語音、詞匯語法和語義知識組成的知識系統(tǒng)。
　　……

你還可能感興趣

我要評論