摘要: 音频信号的读写、播放及录音 python已经支持WAV格式的书写,而实时的声音输入输出需要安装pyAudio(http://people.csail.mit.edu/hubert/pyaudio)。最后我们还将使用pyMedia(http://pymedia.org)进行Mp3的解码和播放。 音频信 阅读全文
posted @ 2022-06-19 17:10 凌逆战 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 我自愿将博客园的文章搬移至CSDN 我还是第一时间将博客发布在 博客园,只不过是使用CSDN帮我引流而已 阅读全文
posted @ 2022-06-06 11:09 凌逆战 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 本文地址:https://www.cnblogs.com/LXP-Never/p/16011229.html (引用请注明出处) 本文代码:https://github.com/LXP-Never/perception_scale 作者: 凌逆战 | Never.Ling 梅尔刻度 梅尔刻度(Mel 阅读全文
posted @ 2022-05-28 19:42 凌逆战 阅读(595) 评论(0) 推荐(0) 编辑
摘要: 国内 【深蓝学院】语音信号处理——宋辉,李先刚 【深蓝学院】语音识别综述 【深蓝学院】语音识别:从入门到精通——谢磊、孙思宁、张彬彬、吕航、许开拓 【深蓝学院】语音合成算法:从HTS到端到端 【深蓝学院】语音合成:基础与前沿——谢磊、陈云琳、阳珊、张雨超 【深蓝学院】语音算法:前沿与应用——李先刚、 阅读全文
posted @ 2022-05-10 17:38 凌逆战 阅读(367) 评论(0) 推荐(2) 编辑
摘要: 论文地址:TinyLSTMs:助听器的高效神经语音增强 音频地址:https://github.com/Bose/efficient-neural-speech-enhancement 引用格式:Fedorov I,Stamenovic M,Jensen C,et al. TinyLSTMs:Eff 阅读全文
posted @ 2022-04-18 12:00 凌逆战 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 论文地址:在长短时记忆中学习内在的稀疏结构 论文代码:https://github.com/wenwei202/iss-rnns 引用格式:Wen W, He Y, Rajbhandari S, et al. Learning intrinsic sparse structures within l 阅读全文
posted @ 2022-04-11 22:02 凌逆战 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 论文地址:深度噪声抑制模型的性能优化 引用格式:Chee J, Braun S, Gopal V, et al. Performance optimizations on deep noise suppression models[J]. arXiv preprint arXiv:2110.0437 阅读全文
posted @ 2022-04-09 23:11 凌逆战 阅读(421) 评论(0) 推荐(1) 编辑
摘要: 论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model compression for deep learning based speech enhancem 阅读全文
posted @ 2022-04-08 10:58 凌逆战 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 论文地址:高效个性化的助听器处理声音 引用格式:Nielsen J B, Nielsen J. Efficient individualization of hearing aid processed sound[C]//2013 IEEE International Conference on A 阅读全文
posted @ 2022-03-10 18:55 凌逆战 阅读(63) 评论(0) 推荐(0) 编辑
摘要: 论文地址:DCCRN:用于相位感知语音增强的深度复杂卷积循环网络 论文代码:https://paperswithcode.com/paper/dccrn-deep-complex-convolution-recurrent-1 引用:Hu Y,Liu Y,Lv S,et al. DCCRN: Dee 阅读全文
posted @ 2022-03-09 15:23 凌逆战 阅读(741) 评论(5) 推荐(3) 编辑
摘要: 论文地址:双路信号变换LSTM网络的实时噪声抑制 论文代码:https://github.com/breizhn/DTLN 引用格式:Westhausen N L, Meyer B T. Dual-signal transformation LSTM network for real-time no 阅读全文
posted @ 2022-03-07 11:12 凌逆战 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 前言 至于为什么写这个教程,首先是为了自己学习做个记录,其次是因为Tensorflow的API写的很好,但是他的教程写的太乱了,不适合新手学习。tensorflow 1 和tensorflow 2 有相似之处但是不兼容,tensorflow 2将keras融合了。TensorFlow™ 是一个采用 阅读全文
posted @ 2022-03-01 16:40 凌逆战 阅读(934) 评论(2) 推荐(6) 编辑
摘要: 论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Zhu W P,et al. PACDNN: A phase-aware composite deep 阅读全文
posted @ 2022-02-15 15:39 凌逆战 阅读(537) 评论(0) 推荐(2) 编辑
摘要: 2013年 word Embedding 2017年 Transformer 2018年 ELMo、Transformer-decoder、GPT-1、BERT 2019年 Transformer-XL、XLNet、GPT-2 2020年 GPT-3 Transformer 谷歌提出的Transfo 阅读全文
posted @ 2022-01-29 11:22 凌逆战 阅读(904) 评论(0) 推荐(3) 编辑
摘要: 论文地址:DeepFilterNet:基于深度滤波器的全频带音频低复杂度语音增强框架 论文代码:https://github.com/Rikorose/DeepFilterNet 引用:Schröter H, Rosenkranz T, Maier A. DeepFilterNet: A Low C 阅读全文
posted @ 2022-01-20 21:21 凌逆战 阅读(480) 评论(0) 推荐(2) 编辑
摘要: 论文地址:TCNN:时域卷积神经网络用于实时语音增强 论文代码:https://github.com/LXP-Never/TCNN(非官方复现) 引用格式:Pandey A, Wang D L. TCNN: Temporal convolutional neural network for real 阅读全文
posted @ 2022-01-18 17:42 凌逆战 阅读(604) 评论(0) 推荐(2) 编辑
摘要: 论文地址:FLGCNN:一种新颖的全卷积神经网络,用于基于话语的目标函数的端到端单耳语音增强 论文代码:https://github.com/LXP-Never/FLGCCRN(非官方复现) 引用格式:Zhu Y, Xu X, Ye Z. FLGCNN: A novel fully convolut 阅读全文
posted @ 2022-01-12 10:48 凌逆战 阅读(429) 评论(2) 推荐(1) 编辑
摘要: 论文地址:MetricGAN+:用于语音增强的 MetricGAN 的改进版本 论文代码:https://github.com/JasonSWFu/MetricGAN 引用格式:Fu S W, Yu C, Hsieh T A, et al. MetricGAN+: An Improved Versi 阅读全文
posted @ 2021-12-21 17:02 凌逆战 阅读(773) 评论(0) 推荐(2) 编辑
摘要: 论文地址:使用感知动机目标和损失的低延迟语音增强 引用格式:Zhang X, Ren X, Zheng X, et al. Low-Delay Speech Enhancement Using Perceptually Motivated Target and Loss[J]. Proc. Inte 阅读全文
posted @ 2021-12-13 11:18 凌逆战 阅读(392) 评论(0) 推荐(2) 编辑
摘要: 论文地址:一种低复杂度实时增强全频带语音的感知激励方法 论文代码:https://github.com/search?q=PercepNet 引用格式:Valin J M, Isik U, Phansalkar N, et al. A Perceptually Motivated Approach 阅读全文
posted @ 2021-12-12 17:00 凌逆战 阅读(541) 评论(0) 推荐(1) 编辑
摘要: 论文地址:通过语音增强的电话强化感知损失提高感知质量 论文代码:https://github.com/aleXiehta/PhoneFortifiedPerceptualLoss 引用格式:Hsieh T A, Yu C, Fu S W, et al. Improving Perceptual Qu 阅读全文
posted @ 2021-12-09 08:11 凌逆战 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 论文地址:使用门控卷积循环网络学习复数谱映射以增强单耳语音 代码地址:https://github.com/JupiterEthan/GCRN-complex 作者主页:https://jupiterethan.github.io/ 引用格式:Tan K, Wang D L. Learning co 阅读全文
posted @ 2021-12-08 22:04 凌逆战 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 论文地址:用于实时语音增强的卷积递归神经网络 代码地址:https://github.com/JupiterEthan/CRN-causal 作者主页:https://jupiterethan.github.io/ 引用格式:Tan K, Wang D L. A Convolutional Recu 阅读全文
posted @ 2021-12-08 18:31 凌逆战 阅读(556) 评论(0) 推荐(1) 编辑
摘要: 论文地址:基于神经网络的实时语音增强的加权语音失真损失 论文代码:https://github.com/GuillaumeVW/NSNet 引用:Xia Y, Braun S, Reddy C K A, et al. Weighted speech distortion losses for neu 阅读全文
posted @ 2021-12-06 15:25 凌逆战 阅读(286) 评论(0) 推荐(1) 编辑
摘要: 论文地址:基于深度波形U-Net进行单耳语音增强 论文代码:https://github.com/Hguimaraes/SEWUNet 引用格式:Guimarães H R, Nagano H, Silva D W. Monaural speech enhancement through deep 阅读全文
posted @ 2021-12-01 18:48 凌逆战 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 论文地址:基于动态注意的递归网络单耳语音增强 论文代码:https://github.com/Andong-Li-speech/DARCN 引用格式:Li, A., Zheng, C., Fan, C., Peng, R., Li, X. (2020) A Recursive Network wit 阅读全文
posted @ 2021-12-01 16:01 凌逆战 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 论文地址:两阶段深度网络的解耦幅度和相位优化 引用格式:Li A, Liu W, Luo X, et al. ICASSP 2021 deep noise suppression challenge: Decoupling magnitude and phase optimization with 阅读全文
posted @ 2021-11-30 12:21 凌逆战 阅读(355) 评论(0) 推荐(1) 编辑
摘要: 论文名称:扩展卷积密集连接神经网络用于时域实时语音增强 论文代码:https://github.com/ashutosh620/DDAEC 引用:Pandey A, Wang D L. Densely connected neural network with dilated convolution 阅读全文
posted @ 2021-11-26 12:05 凌逆战 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 论文地址:MelGAN:条件波形合成的生成对抗网络 代码地址:https://github.com/descriptinc/melgan-neurips 音频实例:https://melgan-neurips.github.io/ 配有MelGAN解码器的音乐翻译网络:https://www.des 阅读全文
posted @ 2021-11-24 15:44 凌逆战 阅读(490) 评论(0) 推荐(1) 编辑
摘要: 论文地址:用于端到端语音增强的卷积递归神经网络 论文代码:https://github.com/aleXiehta/WaveCRN 引用格式:Hsieh T A, Wang H M, Lu X, et al. WaveCRN: An efficient convolutional recurrent 阅读全文
posted @ 2021-11-23 17:47 凌逆战 阅读(644) 评论(0) 推荐(0) 编辑
摘要: 论文地址:在波形域的实时语音增强 论文作者:facebook AI 研究所 论文代码:https://github.com/facebookresearch/denoiser 摘要 我们提出了一个基于原始波形的因果语音增强模型,该模型在笔记本电脑CPU上实时运行。所提出的模型是基于一个带有跳跃连接的 阅读全文
posted @ 2021-11-17 19:50 凌逆战 阅读(299) 评论(0) 推荐(2) 编辑
摘要: 论文地址:Fullsubnet:实时单通道语音增强的全频带和子频带融合模型 代码地址:https://github.com/haoxiangsnr/FullSubNet 引用格式:Hao X, Su X, Horaud R, et al. FullSubNet: A Full-Band and Su 阅读全文
posted @ 2021-11-10 11:59 凌逆战 阅读(421) 评论(0) 推荐(0) 编辑
摘要: 作为一个AI工程师,对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平。 要求1:基于SSH的远程访问(本篇文章) 能用一台笔记本电脑,远程登陆一台linux服务器 能随时使用笔记本电脑启动训练任务 能熟练的让代码和文件在笔记本电脑与LINUX服务器之间的传输 要求2:Linux系统的文 阅读全文
posted @ 2021-08-29 19:05 凌逆战 阅读(2515) 评论(0) 推荐(2) 编辑
摘要: 网上已经有很多人翻译了,但我做这工作只是想让自己印象更深刻 文章方向:语音增强 论文地址:基于DSP/深度学习的实时全频带语音增强方法 博客地址:https://www.cnblogs.com/LXP-Never/p/15144882.html 论文代码:https://github.com/xip 阅读全文
posted @ 2021-08-16 20:07 凌逆战 阅读(676) 评论(0) 推荐(0) 编辑
摘要: 这是很基础的教程,我只是写给自己看,作为一个学习笔记记录一下,如果正在阅读的你觉得简单,请不要批评,可以关掉选择离开 如何学好一门编程语言 掌握基础知识,为将来进一步学习打下良好的基础。 上机实践,通过大量的例题学习怎么设计算法,培养解题思路。 养成良好的编码习惯,注释一定要写,要不然保你一周后自己 阅读全文
posted @ 2021-07-14 12:17 凌逆战 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 论文:2019_Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis 翻译总结:只需5秒音源,这个网络就能实时“克隆”你的声音 代码:Real-Time-Voice-Cloning | 阅读全文
posted @ 2021-06-08 20:33 凌逆战 阅读(1124) 评论(0) 推荐(0) 编辑
摘要: TensorFlow Lite 开源企业:谷歌 GitHub地址:https://github.com/tensorflow/tflite-micro TensorFlow Lite for Microcontrollers 是TensorFlow Lite的实验端口,旨在在只有千字节内存的微控制器 阅读全文
posted @ 2021-06-02 19:45 凌逆战 阅读(2005) 评论(0) 推荐(1) 编辑
摘要: 深度神经网络在人工智能的应用中,包括语音识别、计算机视觉、自然语言处理等各方面,在取得巨大成功的同时,这些深度神经网络需要巨大的计算开销和内存开销,严重阻碍了资源受限下的使用。模型压缩是对已经训练好的深度模型进行精简,进而得到一个轻量且准确率相当的网络,压缩后的网络具有更小的结构和更少的参数,可以有 阅读全文
posted @ 2021-06-02 11:53 凌逆战 阅读(1185) 评论(0) 推荐(1) 编辑
摘要: 引言 深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中,并取得了巨大成功。然而,由于存储空间和功耗的限制,神经网络模型在嵌入式设备上的存储与计算仍然是一个巨大的挑战。 目前工业级和学术界设计轻量化神经网络模型主要有4个方向: 人工设计轻量化神经网络模型 基于神经网络架构搜索(Neura 阅读全文
posted @ 2021-06-02 10:34 凌逆战 阅读(1466) 评论(0) 推荐(0) 编辑
摘要: Group convolution ​ Group convolution最早出现在AlexNet中,是为了解决单卡显存不够,将网络部署到多卡上进行训练而提出。Group convolution可以减少单个卷积1/g的参数量。如何计算的呢? 假设 输入特征的的维度为$HWC_1$; 卷积核的维度为$ 阅读全文
posted @ 2021-06-02 09:22 凌逆战 阅读(203) 评论(0) 推荐(0) 编辑