Webrtc NS 音频降噪学习笔记(持续更新)

2023-06-26 08:48:54

一、webrtc降噪共分为四个模式，0，1，2，3，分别可抑制6，10，15，20dB左右；调用函数 WebRtcNs_set_policy→WebRtcNs_set_policy_core进行初始化与配置；

二、函数 WebRtcNs_Analyze→WebRtcNs_AnalyzeCore 用于实现以下功能：

1、更新处理的数据。将新的160一帧，与上一帧拼接成256一帧，并存储在buffer内（self->analyzeBuf），相关函数为UpdateBuffer；

2、为上述的self->analyzeBuf加窗。并存放于windata中。函数为Windowing。

3、统计加窗后该帧的能量。若能量=0，则退出，不接收噪声估计等处理。函数为Energy。

4、更新处理块blockInd。若上述能量不为0，则blockInd+1.（因为webrtc ns 用前50帧有效数据用于初始噪声估计）。

5、对windata进行傅里叶变换，返回实数谱129、虚数谱129和幅度谱129；函数为FFT256点。

6、计算平滑的对数谱能量，log[i] * log(mag[i])，与总的对数谱能量。注意其跳过前五个频点才开始进行计算，即16000/256*（5-1）=250，即噪声估计从250Hz才开始；

7、计算并存储平均幅度谱(sum(mag))/mag_len与总幅度谱sum(mag)。

8、将幅度谱作为输入，进行分位数噪声估计[1]。

[1] Stahl V , Fischer A , Bippus R . Quantile based noise estimation for spectral subtraction and Wiener filtering[C]// 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No.00CH37100). IEEE, 2000.

Webrtc NS 音频降噪学习笔记(持续更新)

继续阅读

Spring5学习笔记（十二）—— 事务操作

session与cookie

Run-Time Check Failure #2 - Stack around the variable 'cmd' was corrupted 的可能原因

常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。

优秀IT顾问的七大能力之六--宏观把控能力6 宏观把控能力

魔数（代码大全第12章：基本数据类型）

项管行知01--几个经理1 定义2 历史

《电磁学》学习笔记5——磁场强度H分子环流假说

项目管理二三事1、时间2、铁三角 3、PMBOK4、PMBOK版本变更5 小结

安卓学习笔记（2）----LinearLayoutLinearLayout

安卓学习笔记（3）------RelativeLayoutRelativeLayout参考文献

.NET中英文切换常见错误

阅读教材的最佳方法是什么？

标识符的命名规则和规范标识符命名规则标识符命名规范基础版Java代码规范详细版

蓝桥杯单片机比赛蜂鸣器与继电器模块（原理、代码详解）

UE学习笔记：材质错乱排序函数