天天看点

Webrtc NS 音频降噪学习笔记(持续更新)

一、webrtc降噪共分为四个模式,0,1,2,3,分别可抑制6,10,15,20dB左右;调用函数 WebRtcNs_set_policy→WebRtcNs_set_policy_core进行初始化与配置;

二、函数 WebRtcNs_Analyze→WebRtcNs_AnalyzeCore 用于实现以下功能:

1、更新处理的数据。将新的160一帧,与上一帧拼接成256一帧,并存储在buffer内(self->analyzeBuf),相关函数为UpdateBuffer;

2、为上述的self->analyzeBuf加窗。并存放于windata中。函数为Windowing。

3、统计加窗后该帧的能量。若能量=0,则退出,不接收噪声估计等处理。函数为Energy。

4、更新处理块blockInd。若上述能量不为0,则blockInd+1.(因为webrtc ns 用前50帧有效数据用于初始噪声估计)。

5、对windata进行傅里叶变换,返回实数谱129、虚数谱129和幅度谱129;函数为FFT256点。

6、计算平滑的对数谱能量,log[i] * log(mag[i]),与总的对数谱能量。注意其跳过前五个频点才开始进行计算,即16000/256*(5-1)=250,即噪声估计从250Hz才开始;

7、计算并存储平均幅度谱(sum(mag))/mag_len与总幅度谱sum(mag)。

8、将幅度谱作为输入,进行分位数噪声估计[1]。

[1] Stahl V , Fischer A , Bippus R . Quantile based noise estimation for spectral subtraction and Wiener filtering[C]// 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No.00CH37100). IEEE, 2000.

继续阅读