從事音樂相關(guān)的app開發(fā)也已經(jīng)有一段時(shí)日了,在這過程中app的播放器幾經(jīng)修改我也因此對于iOS下的音頻播放實(shí)現(xiàn)有了一定的研究。寫這個(gè)系列的博客目的一方面希望能夠拋磚引玉,另一方面也是希望能幫助國內(nèi)其他的iOS開發(fā)者和愛好者少走彎路(我自己就遇到了不少的坑=。=)。
本篇為《iOS音頻播放》系列的第一篇,主要將對iOS下實(shí)現(xiàn)音頻播放的方法進(jìn)行概述。
先來簡單了解一下一些基礎(chǔ)的音頻知識。
目前我們在計(jì)算機(jī)上進(jìn)行音頻播放都需要依賴于音頻文件,音頻文件的生成過程是將聲音信息采樣、量化和編碼產(chǎn)生的數(shù)字信號的過程,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,因此音頻文件格式的最大帶寬是20KHZ。根據(jù)奈奎斯特的理論,只有采樣頻率高于聲音信號最高頻率的兩倍時(shí),才能把數(shù)字信號表示的聲音還原成為原來的聲音,所以音頻文件的采樣率一般在40~50KHZ,比如最常見的CD音質(zhì)采樣率44.1KHZ。
對聲音進(jìn)行采樣、量化過程被稱為脈沖編碼調(diào)制(Pulse Code Modulation),簡稱PCM
。PCM數(shù)據(jù)是最原始的音頻數(shù)據(jù)完全無損,所以PCM數(shù)據(jù)雖然音質(zhì)優(yōu)秀但體積龐大,為了解決這個(gè)問題先后誕生了一系列的音頻格式,這些音頻格式運(yùn)用不同的方法對音頻數(shù)據(jù)進(jìn)行壓縮,其中有無損壓縮(ALAC、APE、FLAC)和有損壓縮(MP3、AAC、OGG、WMA)兩種。
目前最為常用的音頻格式是MP3,MP3是一種有損壓縮的音頻格式,設(shè)計(jì)這種格式的目的就是為了大幅度的減小音頻的數(shù)據(jù)量,它舍棄PCM音頻數(shù)據(jù)中人類聽覺不敏感的部分,從下面的比較圖我們可以明顯的看到MP3數(shù)據(jù)相比PCM數(shù)據(jù)明顯矮了一截(圖片引自imp3論壇)。
上圖為pcm數(shù)據(jù)上圖為mp3數(shù)據(jù)
MP3格式中的碼率(BitRate)代表了MP3數(shù)據(jù)的壓縮質(zhì)量,現(xiàn)在常用的碼率有128kbit/s、160kbit/s、320kbit/s等等,這個(gè)值越高聲音質(zhì)量也就越高。MP3編碼方式常用的有兩種固定碼率(Constant bitrate,CBR)和可變碼率(Variable bitrate,VBR)。
MP3格式中的數(shù)據(jù)通常由兩部分組成,一部分為ID3用來存儲歌名、演唱者、專輯、音軌數(shù)等信息,另一部分為音頻數(shù)據(jù)。音頻數(shù)據(jù)部分以幀(frame)為單位存儲,每個(gè)音頻都有自己的幀頭,如圖所示就是一個(gè)MP3文件幀結(jié)構(gòu)圖(圖片同樣來自互聯(lián)網(wǎng))。MP3中的每一個(gè)幀都有自己的幀頭,其中存儲了采樣率等解碼必須的信息,所以每一個(gè)幀都可以獨(dú)立于文件存在和播放,這個(gè)特性加上高壓縮比使得MP3文件成為了音頻流播放的主流格式。幀頭之后存儲著音頻數(shù)據(jù),這些音頻數(shù)據(jù)是若干個(gè)PCM數(shù)據(jù)幀經(jīng)過壓縮算法壓縮得到的,對CBR的MP3數(shù)據(jù)來說每個(gè)幀中包含的PCM數(shù)據(jù)幀是固定的,而VBR是可變的。
了解了基礎(chǔ)概念之后我們就可以列出一個(gè)經(jīng)典的音頻播放流程(以MP3為例):
在iOS系統(tǒng)中apple對上述的流程進(jìn)行了封裝并提供了不同層次的接口(圖片引自官方文檔)。
下面對其中的中高層接口進(jìn)行功能說明:
可以看到apple提供的接口類型非常豐富,可以滿足各種類別類需求:
如果你只是想實(shí)現(xiàn)音頻的播放,沒有其他需求AVFoundation會很好的滿足你的需求。它的接口使用簡單、不用關(guān)心其中的細(xì)節(jié);
如果你的app需要對音頻進(jìn)行流播放并且同時(shí)存儲,那么AudioFileStreamer加AudioQueue能夠幫到你,你可以先把音頻數(shù)據(jù)下載到本地,一邊下載一邊用NSFileHandler等接口讀取本地音頻文件并交給AudioFileStreamer或者AudioFile解析分離音頻幀,分離出來的音頻幀可以送給AudioQueue進(jìn)行解碼和播放。如果是本地文件直接讀取文件解析即可。(這兩個(gè)都是比較直接的做法,這類需求也可以用AVFoundation+本地server的方式實(shí)現(xiàn),AVAudioPlayer會把請求發(fā)送給本地server,由本地server轉(zhuǎn)發(fā)出去,獲取數(shù)據(jù)后在本地server中存儲并轉(zhuǎn)送給AVAudioPlayer。另一個(gè)比較trick的做法是先把音頻下載到文件中,在下載到一定量的數(shù)據(jù)后把文件路徑給AVAudioPlayer播放,當(dāng)然這種做法在音頻seek后就回有問題了。);
如果你正在開發(fā)一個(gè)專業(yè)的音樂播放軟件,需要對音頻施加音效(均衡器、混響器),那么除了數(shù)據(jù)的讀取和解析以外還需要用到AudioConverter來把音頻數(shù)據(jù)轉(zhuǎn)換成PCM數(shù)據(jù),再由AudioUnit+AUGraph來進(jìn)行音效處理和播放(但目前多數(shù)帶音效的app都是自己開發(fā)音效模塊來坐PCM數(shù)據(jù)的處理,這部分功能自行開發(fā)在自定義性和擴(kuò)展性上會比較強(qiáng)一些。PCM數(shù)據(jù)通過音效器處理完成后就可以使用AudioUnit播放了,當(dāng)然AudioQueue也支持直接使對PCM數(shù)據(jù)進(jìn)行播放。)。下圖描述的就是使用AudioFile + AudioConverter + AudioUnit進(jìn)行音頻播放的流程(圖片引自官方文檔)。
下一篇將講述iOS音頻播放中必須面對的難(da)題(keng),AudioSession。
聯(lián)系客服