天天看點

音頻編解碼标準G.711與G.729

G.711和G.729協定是兩對用于語音壓縮的編碼方案,兩者具有一些相似之處,但不同于完全自由使用的G.711,使用G.729是需要付費的,而且,對于使用G.729的情況,CPU占有時間大約為G.711的4倍,是以大多數情況下,G.711的使用要廣泛于G.729,但G.729也有其獨特的優秀之處,G.729占用帶寬小,使用普通編碼的語音通訊需要占用64Kbps的帶寬,而G.729僅僅需要8Kbps。

G.711也稱為PCM(脈沖編碼調制),是ITU-T訂定出來的一套語音壓縮标準,主要用于電話。它主要用脈沖編碼調制對音頻采樣,采樣率為8k每秒。它利用一個 64Kbps 未壓縮通道傳輸語音訊号。起壓縮率為1:2,即把16位資料壓縮成8位。G.711是主流的波形聲音編解碼器。G.711 标準下主要有兩種壓縮算法:U-law algorithm和A-law algorithm,其中,後者是特别設計用來友善計算機處理的。

G.729編碼方案是電話帶寬的語音信号編碼的标準,對輸入語音性質的模拟信号用8kHz采樣,16比特線性PCM量化。G.729A是ITU最新推出的語音編碼标準G.729的簡化版本。G.729協定使用的算法是共轭結構的算術碼本激勵線性預測(CS-ACELP),它基于CELP編碼模型。由于G.729編解碼器具有很高的語音品質和很低的延時,被廣泛地應用在資料通信的各個領域,如VoIP和H.323網上多媒體通信系統等。

G.729協定編解碼算法:電話線路上的模拟語音信号,經話路帶寬濾波(符合ITU-T G.712建議)後,被8kHz采樣,量化成16bit線性PCM數字信号輸入到編碼器。該編碼器是基于線性預測分析合成技術,盡量減少實際語音與合成語音之間經聽覺權重後差分信号的能量為準則來進行編碼的。編碼器的其主要部分有:線性預測分析和LPC系數的量化、開環基音周期估計、自适應碼本搜尋、固定碼本搜尋和碼本增益量化。

G.729解碼算法:G.729的解碼也是按幀進行的,主要是對符合G.729協定的碼流進行解碼,得到相應的參數,根據語音産生的機理,合成語音。解碼過程主要分為:參數解碼;後濾波處理。并且具有線性預測分析和LPC系數的量化、開環基音周期估計、自适應碼本搜尋、固定碼本搜尋、碼本增益量化的特點。

首先解碼得到線譜對參數,并将線譜對參數轉換為線性預測系數。然後解碼出基音周期,獲得自适應碼本矢量V(n)。解碼出固定碼本矢量的四個脈沖的位置和符号,計算出固定碼本矢量c(n)。解碼出固定本預測增益gc和固定碼本增益,接着得到激勵信号。最後将激勵信号輸入到線性預測合成濾波器中,計算出重構語音。

後濾波處理主要是自适應後濾波。自适應後置濾波器是由三個濾波器級連而成:長時後置濾波器Hp(z),短時後置濾波器Hf(z),頻譜傾斜補償濾波器Ht(z),後面接着進行一個自适應增益控制過程。後置 濾波器的系數每一個子幀更新一次。後置濾波能夠有效地改善合成出的語音品質。