Vincent's Blog

[置顶] 关于作者

摘要: Wenzhe Liu (刘文哲) 苍山负雪,明烛天南 Institute of Acoustics, Chinese Academy of Sciences lwz_office@sina.com Vincent Liu wenzhe_liu Beijing, China HomePage: htt 阅读全文

posted @ 2022-04-02 21:19 WenzheLiu 阅读(218) 评论(0) 推荐(0) 编辑

2022年10月30日

高保真神经网络音频编码器

摘要: 高保真神经网络音频编码器 高保真神经网络音频编码器 本文介绍了meta推出的音频AI Codec,其整体风格深受Google的SoundStream的影响。在其影响下改进了原有的肩背起,引入语言模型进一步降低码率,并提出了一种提升稳定性的训练策略。 论文题目:High Fidelity Neural Audio Compre 阅读全文

posted @ 2022-10-30 20:11 WenzheLiu 阅读(850) 评论(0) 推荐(0) 编辑

2022年5月17日

基于深度神经网络的回声消除和噪声抑制的任务分割

摘要: 本文是微软对语音前端pipeline基于任务解耦方面的相关工作。区别于目前流行的传统线性AEC+以(线性AEC输出/传声器接收信号/远端信号)作为输入的深度神经网络的结构;采用了NN回声估计+以(估计回声和去回声后的粗谱)作为输入的神经网络的结构,继承了语音增强中任务解耦的思路[1][2]。 论文题 阅读全文

posted @ 2022-05-17 22:38 WenzheLiu 阅读(283) 评论(0) 推荐(0) 编辑

2022年4月30日

[论文] FRCRN:利用频率递归提升特征表征的单通道语音增强

摘要: 本文介绍了ICASSP2022 DNS Challenge第二名阿里和新加坡南阳理工大学的技术方案,该方案针对卷积循环网络对频率特征的提取高度受限于卷积编解码器(Convolutional Encoder-Decoder, CED)中卷积层有限的感受野的问题,将阿里达摩院之前的FSMN与发展自DCC 阅读全文

posted @ 2022-04-30 20:38 WenzheLiu 阅读(678) 评论(0) 推荐(1) 编辑

2022年4月29日

[论文] 基于轴向注意多尺度时频卷积网络的语音增强算法

摘要: 本文介绍了ICASSP2022 DNS Challenge和AEC Challenge第一名百度的技术方案。该方案提出了一种信号处理-深度学习混合式方法(hybrid method),同时抑制回声、噪声和混响。其中信号处理部分利用线性回声消除算法为深度神经网络提供条件信息(conditional i 阅读全文

posted @ 2022-04-29 21:52 WenzheLiu 阅读(1232) 评论(0) 推荐(0) 编辑

2022年4月24日

CRUSE: Convolutional Recurrent U-net for Speech Enhancement

摘要: CRUSE: Convolutional Recurrent U-net for Speech Enhancement 本文是关于TOWARDS EFFICIENT MODELS FOR REAL-TIME DEEP NOISE SUPPRESSION的介绍,作者是Microsoft Researc 阅读全文

posted @ 2022-04-24 18:25 WenzheLiu 阅读(420) 评论(0) 推荐(0) 编辑

2022年4月23日

国内语音信号处理团队

摘要: 国内语音信号处理团队(部分,排名不分先后) 中国科学技术大学人机语音通信实验室(戴礼荣老师、郭武老师、杜俊老师、凌震华等) 清华大学语言和语音技术中心(郑方老师、王东老师等) 清华大学语音处理与机器智能实验室(欧智坚老师等) 清华大学语音与音频技术实验室(刘加老师、张卫强老师等) 清华大学人机语音交 阅读全文

posted @ 2022-04-23 22:21 WenzheLiu 阅读(1056) 评论(0) 推荐(0) 编辑

语音前端书单

摘要: 语音前端书单 书籍: C.Loizou: Speech Enhancement: Theory and Practice Benesty, Y. Huang: Adaptive Signal Processing: Applications to Real-World Problems Haykin 阅读全文

posted @ 2022-04-23 20:36 WenzheLiu 阅读(268) 评论(0) 推荐(0) 编辑

[报告] Microsoft :Application of deep learning methods in speech enhancement

摘要: [报告] Microsoft :Application of deep learning methods in speech enhancement Application of deep learning methods in speech enhancement 语音增强中的深度学习应用 按: 本文是DNS,AEC,PLC等国际级语音竞赛的主办方——Microsoft Research Labs音频与声学研究组(Audio and Acous 阅读全文

posted @ 2022-04-23 19:03 WenzheLiu 阅读(469) 评论(0) 推荐(0) 编辑

导航