pcm是一種多媒體音頻文件,被廣泛用于素材保存及音樂欣賞;PCM文件能夠一邊讀一邊播放,而不需要把這個文件全部讀出后然后回放,這樣就可以做到不用下載 就可以實現(xiàn)收聽了。PCM被稱為脈碼編碼調(diào)制,PCM中的聲音數(shù)據(jù)沒有被壓縮,它是由模擬信號經(jīng)過采樣、量化、編碼轉(zhuǎn)換成的標(biāo)準(zhǔn)的數(shù)字音頻數(shù)據(jù)。
本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。
PCM(Pulse Code Modulation)也被稱為脈碼編碼調(diào)制,PCM中的聲音數(shù)據(jù)沒有被壓縮,它是由模擬信號經(jīng)過采樣、量化、編碼轉(zhuǎn)換成的標(biāo)準(zhǔn)的數(shù)字音頻數(shù)據(jù)。采樣轉(zhuǎn)換方式參考下圖進行了解:
音頻采樣包含以下幾大要素:
采樣率表示音頻信號每秒的數(shù)字快照數(shù)。該速率決定了音頻文件的頻率范圍。采樣率越高,數(shù)字波形的形狀越接近原始模擬波形。低采樣率會限制可錄制的頻率范圍,這可導(dǎo)致錄音表現(xiàn)原始聲音的效果不佳。根據(jù)奈奎斯特采樣定理,為了重現(xiàn)給定頻率,采樣率必須至少是該頻率的兩倍。例如,一般CD唱片的采樣率為每秒 44,100 個采樣,因此可重現(xiàn)最高為 22,050 Hz 的頻率,此頻率剛好超過人類的聽力極限 20,000 Hz。
圖中A是低采樣率的音頻信號,其效果已經(jīng)將原始聲波進行了扭曲,B則是完全重現(xiàn)原始聲波的高采樣率的音頻信號。
數(shù)字音頻常用的采樣率如下:
位深度決定動態(tài)范圍。采樣聲波時,為每個采樣指定最接近原始聲波振幅的振幅值。較高的位深度可提供更多可能的振幅值,產(chǎn)生更大的動態(tài)范圍、更低的噪聲基準(zhǔn)和更高的保真度。
位深度越高,提供的動態(tài)范圍越大。
在上面的名詞解析中我們應(yīng)該對PCM有了一定的理解和認(rèn)識,下面我們將對PCM做更多的講解。
PCM文件具有流媒體特性,是數(shù)字通信的編碼方式之一。
PCM文件被廣泛用于素材保存及音樂欣賞,CD、DVD以及我們常見的 WAV文件中均有應(yīng)用,PCM文件能夠一邊讀一邊播放,而不需要把這個文件全部讀出后然后回放,這樣就可以做到不用下載 就可以實現(xiàn)收聽了。
如果是單聲道的文件,采樣數(shù)據(jù)按時間的先后順序依次存入。如果是單聲道的音頻文件,采樣數(shù)據(jù)按時間的先后順序依次存入(也可能采用 LRLRLR 方式存儲,只是另一個聲道的數(shù)據(jù)為 0)。
如果是雙聲道的話通常按照 LRLRLR 的方式存儲,存儲的時候還和機器的大小端有關(guān)。
PCM的存儲方式為小端模式,存儲Data數(shù)據(jù)排列如下圖所示:
描述 PCM 音頻數(shù)據(jù)的參數(shù)的時候有如下描述方式:
1 2 3 |
|
44100Hz 指的是采樣率,它的意思是每秒取樣 44100 次。采樣率越大,存儲數(shù)字音頻所占的空間就越大。
16bit 指的是采樣精度,意思是原始模擬信號被采樣后,每一個采樣點在計算機中用 16 位(兩個字節(jié))來表示。采樣精度越高越能精細(xì)地表示模擬信號的差異。
Stereo 指的是聲道數(shù),也即采樣時用到的麥克風(fēng)的數(shù)量,麥克風(fēng)越多就越能還原真實的采樣環(huán)境(當(dāng)然麥克風(fēng)的放置位置也是有規(guī)定的)。
PCM文件:模擬音頻信號經(jīng)模數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。Windows的Convert工具可以把PCM音頻格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。
將音頻數(shù)字化,其實就是將聲音數(shù)字化。最常見的方式是透過脈沖編碼調(diào)制PCM(Pulse Code Modulation) 。運作原理如下:首先我們考慮聲音經(jīng)過麥克風(fēng),轉(zhuǎn)換成一連串電壓變化的信號,如下圖所示。這張圖的橫座標(biāo)為秒,縱座標(biāo)為電壓大小。要將這樣的信號轉(zhuǎn)為 PCM 格式的方法,是使用三個參數(shù)來表示聲音,它們是:聲道數(shù)、采樣位數(shù)和采樣頻率。
采樣頻率:即取樣頻率,指每秒鐘取得聲音樣本的次數(shù)。采樣頻率越高,聲音的質(zhì)量也就越好,聲音的還原也就越真實,但同時它占的資源比較多。由于人耳的分辨率很有限,太高的頻率并不能分辨出來。在16位聲卡中有22KHz、44KHz等幾級,其中,22KHz相當(dāng)于普通FM廣播的音質(zhì),44KHz已相當(dāng)于CD音質(zhì)了,目前的常用采樣頻率都不超過48KHz。
采樣位數(shù):即采樣值或取樣值(就是將采樣樣本幅度量化)。它是用來衡量聲音波動變化的一個參數(shù),也可以說是聲卡的分辨率。它的數(shù)值越大,分辨率也就越高,所發(fā)出聲音的能力越強。
聲道數(shù):很好理解,有單聲道和立體聲之分,單聲道的聲音只能使用一個喇叭發(fā)聲(有的也處理成兩個喇叭輸出同一個聲道的聲音),立體聲的PCM 可以使兩個喇叭都發(fā)聲(一般左右聲道有分工) ,更能感受到空間效果。
下面再用圖解來看看采樣位數(shù)和采樣頻率的概念。讓我們來看看這幾幅圖。圖中的黑色曲線表示的是PCM 文件錄制的自然界的聲波,紅色曲線表示的是PCM 文件輸出的聲波,橫坐標(biāo)便是采樣頻率;縱坐標(biāo)便是采樣位數(shù)。這幾幅圖中的格子從左到右,逐漸加密,先是加大橫坐標(biāo)的密度,然后加大縱坐標(biāo)的密度。顯然,當(dāng)橫坐標(biāo)的單位越小即兩個采樣時刻的間隔越小,則越有利于保持原始聲音的真實情況,換句話說,采樣的頻率越大則音質(zhì)越有保證;同理,當(dāng)縱坐標(biāo)的單位越小則越有利于音質(zhì)的提高,即采樣的位數(shù)越大越好。
在計算機中采樣位數(shù)一般有8位和16位之分,但有一點請大家注意,8位不是說把縱坐標(biāo)分成8份,而是分成2的8次方即256份; 同理16位是把縱坐標(biāo)分成2的16次方65536份; 而采樣頻率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三種。
那么,現(xiàn)在我們就可以得到PCM文件所占容量的公式:存儲量 = (采樣頻率*采樣位數(shù)*聲道)*時間/8(單位:字節(jié)數(shù)).
例如,數(shù)字激光唱盤(CD-DA,紅皮書標(biāo)準(zhǔn))的標(biāo)準(zhǔn)采樣頻率為44.lkHz,采樣數(shù)位為16位,立體聲(2聲道),可以幾乎無失真地播出頻率高達22kHz的聲音,這也是人類所能聽到的最高頻率聲音。激光唱盤一分鐘音樂需要的存儲量為:
1 |
|
這個數(shù)值就是PCM聲音文件在硬盤中所占磁盤空間的存儲量。
計算機音頻文件的格式?jīng)Q定了其聲音的品質(zhì),日常生活中電話、收音機等均為模擬音頻信號,即不存在采樣頻率和采樣位數(shù)的概念,我們可以這樣比較一下:
44KHz,16BIT的聲音稱作:CD音質(zhì);
22KHz、16Bit的聲音效果近似于立體聲(FM Stereo)廣播,稱作:廣播音質(zhì);
11kHz、8Bit的聲音,稱作:電話音質(zhì)。
微軟的WAV文件就是PCM編碼的一種。
擴展知識:與PCM文件相關(guān)的其他文件類型
延期 | 文件類型開發(fā)人員 | 文件類別 | 文件類型描述 |
---|---|---|---|
.SMI | Apple | 磁盤映像文件 | Self-Mounting Disk Image |
.AC3 | Various Developers | 音頻文件 | Audio Codec 3 File |
.DV | Roxio | 視頻文件 | Digital Video File |
.YUV | WinXMedia Software | 視頻文件 | YUV Video File |
.MJP2 | Open Source | 視頻文件 | Motion JPEG 2000 Video |
.MP4V | Moving Picture Experts Group | 視頻文件 | MPEG-4 Video File |
.MP4 | Moving Picture Experts Group | 視頻文件 | MPEG-4 Video File |
.IVF | Intel Corporation | 視頻文件 | Indeo Video Format File |
.IFV | Intel Corporation | 視頻文件 | Indeo Video Format File |
.3GPP | Various Developers | 視頻文件 | 3GPP Media File |
更多相關(guān)知識,請訪問常見問題欄目!
以上就是pcm是什么文件的詳細(xì)內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章!
聯(lián)系客服