当前位置: 首页 > 工具软件 > rnnoise > 使用案例 >

rnnoise 两篇

公良云
2023-12-01

深度学习降噪方案-RNNoise源码解析 - 特征提取

https://blog.csdn.net/danteLiujie/article/details/102799038?utm_medium=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.wap_blog_relevant_pic&depth_1-utm_source=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.wap_blog_relevant_pic

https://blog.csdn.net/u012514944/article/details/85338678?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control

rnnoise  总共提取了42个输入特征点:
a、针对输⼊入信号bark 22个频带的能量量做dct变换,得到22个BFCC系数。

b、针对22个中的前六个即1.2k 做导数处理,针对 当前及过去三帧处理理为(增加12个特征点):
6个:An+A(n-1)+A(n-2);
+6个:An -A(n-2);
+6个:An +A(n-2)-2A(n-1)。

c、针对基⾳周期相关性,做dct变换,得到前6组带的系数以及一个基⾳周期的 系数(增加一个特征点)。
d、通过计算过去8帧频带的差异值之和,求得稳定性系数1个(一个特征点)。

特征点的提取主要是考虑:

1、采样BFCC系数,是因为BFCC在降噪方面的效果比MFCC更好。

2、基音周期系数,主要因为噪声会导致基因周期变低,人声中浊音具有明显的周期性,噪声不具有。

rnnoise 具体训练、应用,测试,技术优化,欢迎大家加音频算法讨论群:153268894 (作者 zeark)。

 类似资料: