(1) pcm格式
pcm是經(jīng)過(guò)話(huà)筒錄音后直接得到的未經(jīng)壓縮的數(shù)據(jù)流
數(shù)據(jù)大小=采樣頻率*采樣位數(shù)*聲道*秒數(shù)/8
采樣頻率一般是22k或者44k,位數(shù)一般是8位或者16位,聲道一般是單聲道或者雙聲道
pcm屬于編碼格式,就是一串由多個(gè)樣本值組成的數(shù)據(jù)流, 本身沒(méi)有任何頭信息或者幀的概念,。如果不是音頻的錄制者,光憑一段PCM數(shù)據(jù),是沒(méi)有辦法知道它的采樣率等信息的。(網(wǎng)上有說(shuō)法指2048個(gè)采樣算一幀PCM,http://www.360doc.com/content/11/1230/19/2226925_176139396.shtml,不知道這種說(shuō)法是否正確)
參見(jiàn):
(2)WAV格式
WAV格式是封裝格式,里面本身可以存放多種編碼格式的數(shù)據(jù),不過(guò)一般都是存放的PCM數(shù)據(jù),存放其他編碼意義不是很大。
wav文件由wav文件頭部分和wav文件數(shù)據(jù)體部分組成,0-43字節(jié)存放采樣率、通道數(shù)、數(shù)據(jù)部分的標(biāo)識(shí)符等頭信息,44字節(jié)以后的就是數(shù)據(jù)部分。 很顯然,wav的頭信息很重要,一旦頭信息損壞了,播放估計(jì)會(huì)有問(wèn)題。
參見(jiàn):
(3)MP3格式
MP3是封裝格式,里面存放的數(shù)據(jù)使用的編碼方式稱(chēng)為MPEG1 Layer-3
MP3文件由TAG_V2(ID3V2)結(jié)構(gòu)體,一組Frame, TAG_V1(ID3V1)結(jié)構(gòu)體組成,頭部的TAG結(jié)構(gòu)體不一定存在,需要進(jìn)行判斷,尾部的TAG長(zhǎng)度為128個(gè)字節(jié),也需要進(jìn)行判斷。
中間的一組Frame,F(xiàn)rame長(zhǎng)度可以定長(zhǎng)也可以邊長(zhǎng),每一個(gè)Frame都由幀頭和數(shù)據(jù)實(shí)體組成,幀頭記錄了mp3的位率,采樣率,版本等信息,每個(gè)幀之間相互獨(dú)立,各幀相互獨(dú)立。也就是說(shuō)即使前面的幀損壞了,后面的也是可以播放的。
(4)AMR格式
AMR文件包含一個(gè)文件頭,后面就是一幀一幀的AMR幀。文件頭里面的值是固定值,用于標(biāo)識(shí)該文件為AMR文件。每個(gè)幀分為幀頭和數(shù)據(jù)部分,幀頭里面包含編碼方式以及輔助信息。AMR的采樣率根據(jù)編碼方式不同而不同,因此不像MP3一樣,在每個(gè)幀里面存放采樣率。
參見(jiàn):
(5)AAC格式
初步了解,AAC文件可以沒(méi)有文件頭,全部由幀序列組成,每個(gè)幀由幀頭和數(shù)據(jù)部分組成。幀頭包含采樣率、聲道數(shù)、幀長(zhǎng)度等,有點(diǎn)類(lèi)似MP3格式。
關(guān)于A(yíng)AC格式的文章網(wǎng)上非常少,只看到以下幾篇:
(6)CAF文件
CAF是蘋(píng)果的一種音頻封裝格式,與WAV差不多,里面可以存放LPCM、MP3等多種編碼數(shù)據(jù)。
參見(jiàn):
----------------------------------------------------------------------------------------
本人博客內(nèi)容系個(gè)人學(xué)習(xí)與研究的筆記,如存在謬誤或缺失,請(qǐng)見(jiàn)諒并指出,謝謝。
本文地址:http://www.cnblogs.com/gugupluto/p/3584320.html
轉(zhuǎn)載請(qǐng)注明來(lái)自:http://www.cnblogs.com/gugupluto/
----------------------------------------------------------------------------------------