天天看點

pcm 采樣率轉換_數字音頻基礎從PCM說起

“不得不說,現在網上的文章,包括百科詞條,在數字音頻基礎概念上有太多混亂的表達,甚至存在錯誤。比如比特率、位率、位速和碼率這四個詞其實是同一個意思。再比如千比特kb表示1000bit,而不是普遍被認為的1024bit。在位元組Byte範疇,千位元組則表示1024位元組,1KB=1024B。”

本文從模拟信号的數字化方法講起,介紹幾個基礎概念,然後重點區分容易混淆的概念,最後做一些知識擴充。全文目錄如下:

pcm 采樣率轉換_數字音頻基礎從PCM說起

01

模拟信号的數字化方法:PCM

1.1 PCM的定義

最基本的概念:模拟信号是指随時間連續變化的實體量,将聲音在錄音帶上記錄成磁場強度的變化或在黑膠唱片上記錄成溝槽大小的變化就是以模拟方式進行存儲。數字信号則是離散的,計算機中的資料都是以數字方式存儲的。模拟信号和數字信号可以互相轉換,這裡我們讨論的就是把模拟信号轉換成數字信号。

脈沖編碼調制(Pulse Code Modulation, PCM)是一種模拟信号的數字化方法。它是最常用、最簡單的波形編碼方式,但是也存在其它方法,比如脈沖密度調制(Pulse Density Modulation, PDM)。

1.2 PCM的實作過程

下圖就是脈沖編碼調制的完整過程,簡單概括為:采樣,量化,編碼。

pcm 采樣率轉換_數字音頻基礎從PCM說起

具體來說就是:

  1. 将模拟信号按照同樣的時間間距(即采樣時間)進行采樣。
  2. 按某種運算法确定樣本值,即量化。
  3. 将樣本值用二進制表示,即編碼。

由上可見,脈沖編碼調制實際上并沒有"調制"的過程,而且也并沒有脈沖出現,隻因為PCM來源于PWM和PPM技術,是以也保留了"脈沖"二字。是以将脈沖編碼調制(PCM)了解為"一種模拟信号的數字化方法"是最準确的。

02

數字音頻基礎概念

2.1 采樣率 Sample Rate

采樣率(采樣頻率)即每秒内進行采樣的次數。符号是fs,機關是Hz。采樣率越高,數字波形的形狀就越接近原始模拟波形,聲音的還原就越真實。

如下是同一波形的兩種采樣率對比,可以看到低采樣率的A采樣波形嚴重失真,而高采樣率的B則幾乎完全重制原始波形:

pcm 采樣率轉換_數字音頻基礎從PCM說起

根據奈奎斯特-香農采樣定理,隻有采樣頻率高于原始模拟信号中最高頻率的兩倍時,才能把數字信号表示的模拟信号準确還原回去。例如,CD 的采樣率為每秒 44,100 個采樣,是以可重制最高為 22,050 Hz 的頻率,此頻率剛好超過人類的聽力極限 20,000 Hz。實際應用中采樣頻率一般為信号最高頻率的2.56~4倍。

數字音頻領域常用的采樣率如下表:

pcm 采樣率轉換_數字音頻基礎從PCM說起

2.2 采樣位數 Bit Depth

采樣位數(又稱位寬,位深,位深度),字面意義就是采樣值的二進制編碼的位數。采樣位數反應了采樣系統對聲音的辨析度,位數越高,對聲音的記錄就越精細,是以也稱之為采樣精度,采樣深度。

采樣位數的含義是用多少個點來描述聲音信号的強度,如1.2節的PCM編碼的位數就是3bit,即有2^3 = 8個點。如果是8bit,就有2^8 = 256個點。

采樣位數直接影響采集信号的信噪比/動态範圍。較高的采樣位數可提供更多可能的振幅值,産生更大的動态範圍、更低的噪聲基準和更高的保真度。

pcm 采樣率轉換_數字音頻基礎從PCM說起

總結一下,采樣率是相對于時間來說的,采樣位數是相對信号的幅度來說的,在1.2節中分别對應橫坐标和縱坐标。

2.3 聲道 Sound Channel

聲道是指聲音在錄制或播放時在不同空間位置采集或回放的互相獨立的音頻信号,通俗的說聲道數就是錄音時的麥克風數量,也是播放時的音響數量。聲道數,也叫通道數,軌道數,音軌數。

常見的聲道數有單聲道(Mono),雙聲道(即立體聲,Stereo),5.1聲道,7.1聲道等。這裡的 .1聲道指的是低音聲道。

如下是一個5.1聲道家庭影院示意圖,六個揚聲器分别是 :C(Central)中置,FL(Front Left)左前置,FR(Front Right)右前置,SL(Surround Left)左環繞,SR(Surround Right)右環繞和SW(Subwoofer)低音炮。

pcm 采樣率轉換_數字音頻基礎從PCM說起

2.4 比特率 Bit Rate

比特是由bit音譯而來,指二進制數中的位,它是數字資訊的最小度量機關。

在通信與計算領域,比特率就是指每秒傳送或處理的比特的數量(位數),是以比特率又稱為"二進制位速率",簡稱"位速或位率",常用于形容傳輸速度,帶寬。

在數字多媒體領域,比特率是每秒播放連續的音頻或視訊的比特的數量,是音視訊檔案的一個屬性。此時它相當于術語"數字帶寬消耗量或吞吐量",也俗稱為"碼率"。

比特率的統一含義是"二進制碼數量/時間",機關是比特每秒,bit per second,縮寫為bit/s(不是"bits/s"),簡寫為bps或b/s。有一些不正式的描述比如"128千比特音頻流"或"100兆比特網絡"則是省略了"每秒"。

常用比特率的表述:

pcm 采樣率轉換_數字音頻基礎從PCM說起

03

數字音頻概念區分

3.1 PCM與ADC

PCM(Pulse Code Modulation)是一種模拟信号的數字化方法,ADC(Analog to Digital Converter)晶片是實作這一方法的器件。

3.2 比特率與下載下傳速度

網絡帶寬常用比特率表示,機關bps,比如千比特每秒Kbps = Kb/s,兆比特每秒Mbps = Mb/s,這裡的b是bit(位)。而日常我們說的下載下傳速度的機關是KB/s,MB/s(簡寫為K/s,M/s),這裡的B是Byte(位元組),是用來表示檔案大小的機關。

位元組中的KB、MB、GB的遞進關系是1024,而比特率中的kb,Mb,Gb的遞進關系則是1000。而且1byte=8bit,是以說 1MB/s ≈ 8Mbps = 8Mb/s。實際上因為網絡損耗,營運商口中的帶寬bps(b/s)和我們實際了解的下載下傳速度B/s的關系一般是十倍左右。

3.3 音頻編碼格式和檔案格式

[注:在很多語義下,音頻編碼=音頻編碼格式,音頻檔案=音頻檔案格式]

3.3.1 PCM編碼與PCM檔案

如上所述,PCM(脈沖編碼調制)是一種模拟信号的數字化方法,PCM編碼就是這個方法中的數字音頻編碼方式。PCM編碼是最原始的音頻編碼,其他編碼都是在它基礎上再次編碼和壓縮的。

PCM檔案是以PCM編碼方式存儲音頻的檔案,是未經壓縮的原始數字音頻檔案,通常稱為PCM裸流/音頻裸資料/raw data。常用檔案擴充名是.pcm和.raw,通常它們是不能直接播放的。PCM裸流經過重新編碼,封裝(見下節)後,比如變為 .wav格式,就可以正常播放了。

3.3.2 編碼格式與檔案格式的含義

常見的音頻檔案都有兩部分格式:一是檔案格式,二是編碼格式。兩者是不同的概念:檔案格式專指存放音頻資料的檔案的格式,對應檔案的擴充名;編碼格式則是指音頻資料的特定格式,也叫資料格式,音頻編碼。

pcm 采樣率轉換_數字音頻基礎從PCM說起

3.3.3 常見的編碼格式與檔案格式

大部分情況下,一種檔案格式對應一種音頻編碼。但是也有例外,比如.caf的檔案格式就能包含MP3、LPCM和其他格式編碼的音頻資料,AAC編碼格式對應的檔案的擴充名就有.aac、 .mp4 和 .m4a。

檔案格式與音頻編碼的名稱有時相同,比如平時我們經常說的mp3既是檔案格式,又是編碼格式;也有時不同。而且有時它們的稱呼也不規範,比如為了友善人們一般稱Monkey's Audio音頻編碼格式為ape編碼。

常用的音頻編碼格式與檔案格式的對應關系總結如下:

pcm 采樣率轉換_數字音頻基礎從PCM說起

3.3.4 有損編碼與無損編碼

理論上說,任何數字音頻都是無法完全還原模拟信号的。不過PCM編碼是模拟信号轉換為數字信号時的原始編碼,它代表着數字音頻的最佳保真水準,是以PCM編碼就約定俗成為"無損編碼"。

上節中的音頻編碼是對PCM編碼進行了二次編碼,是為了減小原始PCM編碼的體積,是以也叫它們為壓縮編碼,對應的檔案叫壓縮格式。

二次編碼的音頻編碼也分為兩類:有損編碼和無損編碼,也稱為有損壓縮和無損壓縮。無損就是指相對PCM編碼來說音質相同,有損則是損失了一些音頻品質。

04

知識進階

4.1 比特率的計算

假設有一段采樣頻率44.1KHz,采樣位數16bit,立體聲的PCM音頻。也就是說,在産生這段音頻時間裡,1s内系統采樣的次數是44100次,每次采樣的資料位數是16位,同時進行2通道采樣。這就意味着,系統每秒采集的比特數為44100次×16位×2通道 = 1411200個。根據比特率的定義,這段音頻的比特率就是1411.2kbit/s。

音頻的比特率=采樣率×位深度×通道數

此外,如果還知道這段PCM音頻檔案的時長,還可以計算檔案的大小:假設檔案時長為1分鐘,那麼檔案大小為1411.2kbit/s × 60s = 84672kbit,而1byte=8bit,是以檔案大小為10,584,000B = 10,355.9KB = 10.1MB。

【注意】一個 kb(kilobit,千比特) 表示 1,000比特,而不是普遍被認為的1,024比特。 

音頻檔案大小(B)=比特率(b/s)×時長(s)÷8

對于mp3,wav等其他格式的音頻檔案,檔案裡還包括了幀頭等其他附加資訊,是以檔案體積還會稍大一些。

4.2 檢視音頻檔案的參數

對于音視訊檔案,檢視其比特率最簡單的方式是右鍵-屬性-詳細,就可以直接看到了。

pcm 采樣率轉換_數字音頻基礎從PCM說起

檢視更詳細的采樣率,聲道數,位深,可以将其在Adobe Audition軟體中打開:

pcm 采樣率轉換_數字音頻基礎從PCM說起

對于音樂播放軟體,左側網易雲的标準、較高和極高音質分别對應MP3音頻格式中的128、192和320kbit/s三個比特率,無損音質則是對應700~1000kbit/s的flac檔案格式。

pcm 采樣率轉換_數字音頻基礎從PCM說起

對于右側的QQ音樂,是用品質描述+檔案大小來表示,标準品質為128kbit/s的MP3,HQ (High Quality) 高音質則是高于128kbit/s的MP3,SQ (Super Quality) 無損品質則采用APE和FLAC無損檔案格式。

[ 全文完 ]