心胸决定格局,眼界决定境界...

深度学习语音降噪总结

  实时语音通信发展到今天,用户对通话语音质量提出了越来越高的要求。由于终端设备的多样性以及使用场景的差异,声音问题依然存在。传统的音频处理技术从声音信号本身出发,挖掘其时频特性,作出假设,建立物理模型,很多参数都需要人工进行精细化微调,比较费时费力。随着AI技术的发展,凭借着其强大的拟合能力,利用数据驱动,为改善音频体验提供了更多的可能性。

        关于理论部分,包括论文有很多,每种想法都存在一些问题,包括工程方面的,如需做落地,效果稳定良好,还需要做很多更多的工作,这里稍微做了下总结,深度学习降噪基本都在这份分享的PPT上面,降噪部分有些文章可能有些不太新了,但是还是有学习参考意义的。

   此处就分享几张DNN处理后的样本,增加一下新手的信心,处理非平稳噪声,效果还是非常明显的。

white:

     

 destroyerengine:

    

n32:

    

 n38

     

n61:

    

sil:

    

coffee:

    

 

PPT链接地址:

百度云盘

链接: https://pan.baidu.com/s/1vvUiiGtu-HUdZwclBSInZA 提取码: bsc5 

实时语音通信的总结和深度学习降噪资料都可以直接在QQ群下载到

QQ群:音频信号处理读书会 485186545

如上群已满,请加新群: 音频处理与机器学习 238816966

 

posted @ 2019-03-14 14:28  WELEN  阅读(8875)  评论(2编辑  收藏  举报