中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項超值服

開通VIP
音頻處理基礎(chǔ)(二)

一、音頻信號的數(shù)字化

聲波在時間和幅度上都是連續(xù)的,是一種模擬信號。要到計算機(jī)里面能夠處理它,就必須要把它轉(zhuǎn)換成二進(jìn)制的“0”和“1”,這個過程叫數(shù)字化過程。數(shù)字化過程,就是采樣、量化和編碼的過程。

(1)采樣:聲音信號在時間上的離散化。即每隔一定時間抽取一個信號樣本。采極頻率,就是每秒采樣的次數(shù)。

奈奎斯特理論:采樣頻率不低于聲音信號最高頻率的兩倍,這樣就能把數(shù)字聲音還原成原來的聲音,稱為無損數(shù)字化。

語音的最高頻率約為3KHz,放大一點,到3.4KHz,。如果放大兩倍就是6.8KHz,再放大一點,就是電話采樣的頻率,定在8KHz。人的耳朵能夠感知到的音頻的最高頻率為20kHz, CD音質(zhì)的采樣頻率為44.1kHz;

(2)量化:聲音信號在幅度上的離散化。采樣過程中對每一個采樣點的幅度值用數(shù)字量來表示。

采樣精度:即量化的位數(shù),8位可以將幅度分成256等份,位數(shù)越多量化等級數(shù)也越多,所能表示的聲波幅度的動態(tài)范圍也越大,當(dāng)然需要的存儲空間也越大。如果幅度的劃分是等間隔的,則稱為線性量化,否則為非線性量化。上圖比被分成八個刻度,是等分的線性量化。而在實際的一些算法中都是采用非線性量化。這是因為我們聲音的幅度,絕大部分的波形,它的幅度都不是很高,但是突然會有一個聲音可能很響,這個波形它的幅度就會比較大。如果我們采用這樣的等分間隔,就不能把這個絕大多數(shù)的較低的這些波形更好的把它們表示出來。相反波形比較高的這一部分它很少,它就浪費(fèi)了這個量化的位數(shù)。不能更好的把這個波形更精確的表示出來。所在在實際當(dāng)中,可以采取這樣一種方式,就是幅度低的這一部分,把它的量化的位數(shù)增加,也就是把它的間隔縮得更短,而對于這個幅度比較高的波形,我們把它的量化的位數(shù)減少,把它的間隔拉大一些。這樣就能充分的利用量化的位數(shù)。把這個波形更精確的表示出來。

(3)編碼。

脈沖編碼調(diào)制法(PCM) :: 用二進(jìn)制來表示每一個有固定電平的量化值。寫成二進(jìn)制的過程就可以理解為編碼的過程。

如何計算數(shù)字化音頻的數(shù)據(jù)量?  數(shù)據(jù)量=采樣頻率*采樣精度*采樣時間*聲道數(shù)/8 就得到字節(jié)數(shù)。

例2.1計算1分鐘未壓縮的高保真立體聲數(shù)字聲音數(shù)據(jù)的大小。

60*( 44100*16*2)/8=10.09 MB    一分鐘等于60秒,高保真立體聲就說明它是CD音質(zhì),采樣頻率是44100Hz,它的量化的位數(shù)要達(dá)到16位,它是立體聲有兩個聲道,那就要乘以2,再除以8,才能獲得字節(jié)數(shù)。那這樣算出來的話,一分鐘要10.09MB,所以一首歌曲,錄制的時間大約在四分鐘左右的,不壓綜就需要40MB左右。一個容量為4GB的MP3播放器可存放100首這樣的歌曲。而我們現(xiàn)在聽的歌曲,一首歌它的長度大約是在4MB左右,所以它的壓綜就能達(dá)到10倍左右。

二、數(shù)字音頻壓縮標(biāo)準(zhǔn)

(1)電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)。G.711, G. 721,G.723,G. 729等,采樣頻率: 8kHz, 量化位數(shù): 8位

(2)調(diào)幅廣播語音壓縮標(biāo)準(zhǔn):G.722:第一個寬帶語音編碼算法,采樣頻率: 16kHz

(3)寬帶音頻壓縮標(biāo)準(zhǔn):MPEG-1的音頻,第一個高保真立體聲音頻壓縮國際標(biāo)準(zhǔn),提供三個獨(dú)立的壓縮層次,mp3則采用了其中第三層的標(biāo)準(zhǔn)。

三、常見的音頻文件

WAV文件:波形文件,文件大,適合存儲簡短的聲音片段和旁白。

MP3文件:是MPEG音頻第3層的簡稱,有損壓縮,壓縮比達(dá)12:1.

RA文件: Real Media音頻部分, 采用流式傳輸,適合在線聆聽。

WMA文件:微軟推出的流式音頻格式。

AC3文件:又叫杜比數(shù)碼環(huán)繞立體聲,提供5個全頻域聲道和1個超低音聲道,稱為5. 1聲道,一般作為DVD的伴音。

AIFF (音頻交換文件格式): Apple公司開發(fā),被Macintosh平臺 及其應(yīng)用程序所支持。

FLAC文件:無損壓縮,源碼開放,支持所有操作系統(tǒng)平臺。

AMR文件:移動通信中廣泛使用的語音標(biāo)準(zhǔn),用于保存手機(jī)錄音.

三、智能語音處理技術(shù)

(1)語音識別技術(shù):語音識別就是讓計算機(jī)能夠聽懂人說話。

Windows的語音識別:操作系統(tǒng)自帶的語音識別。Windows 7能上版本都帶有這個功能。打開Windows 輕松使用, 就能找到。打開后彈出:

歡迎使用語音識別

僅使用語音,便可以啟動程序、打開菜單、單擊屏幕上的按鈕和其他對象、將文本口述到文檔中以及書寫和發(fā)送電子郵件。只要是可以用健盤和鼠標(biāo)完成的所有事情,都可以僅用語音來完成。

首先,將此計算機(jī)設(shè)為識別語音,

注意:完成此設(shè)置向?qū)Ш?便能夠通過語音控制計算機(jī)。設(shè)置成功后會有一個小的窗口浮動在桌面上,默認(rèn)它就進(jìn)入到一個聆聽的狀態(tài)。這個時候我們只要把麥克風(fēng)準(zhǔn)備好了,就對著這個麥克風(fēng)說話,它就能夠開始聽。

(2)語音合成技術(shù)。語音合成,使計算機(jī)具有類似人的說話能力。語音合成分三個層次,從文字到語音,從概念到語音,從意向到語音。我們現(xiàn)在能夠使用的基本上是文字到語音。

語音合成的特點,標(biāo)準(zhǔn)清晰,但缺少感情色彩。語音合成的應(yīng)用,主要在文語轉(zhuǎn)換,語音杳詢。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
聲音、音頻采樣率、采樣精度等常識概念
利用PWM給單片機(jī)應(yīng)用增加語音功能
I2S音頻總線
使用PWM實現(xiàn)語音播放
如何將您的計算機(jī)用作任意波形發(fā)生器
音頻編碼過程
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服