随笔列表第2页 - 凌逆战

2022年3月9日

论文翻译：2020_DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement

摘要：论文地址：DCCRN：用于相位感知语音增强的深度复杂卷积循环网络论文代码：https://paperswithcode.com/paper/dccrn-deep-complex-convolution-recurrent-1 引用：Hu Y，Liu Y，Lv S，et al. DCCRN: Dee 阅读全文

posted @ 2022-03-09 15:23 凌逆战阅读(3202) 评论(5) 推荐(7)

2022年3月7日

论文翻译：2020_DTLN：Dual-Signal Transformation LSTM Network for Real-Time Noise Suppression

摘要：论文地址：双路信号变换LSTM网络的实时噪声抑制论文代码：https：//github.com/breizhn/DTLN 引用格式：Westhausen N L, Meyer B T. Dual-signal transformation LSTM network for real-time no 阅读全文

posted @ 2022-03-07 11:12 凌逆战阅读(3163) 评论(4) 推荐(1)

2022年3月1日

Tensorflow 2.x入门教程

摘要：前言至于为什么写这个教程，首先是为了自己学习做个记录，其次是因为Tensorflow的API写的很好，但是他的教程写的太乱了，不适合新手学习。tensorflow 1 和tensorflow 2 有相似之处但是不兼容，tensorflow 2将keras融合了。TensorFlow™ 是一个采用阅读全文

posted @ 2022-03-01 16:40 凌逆战阅读(3493) 评论(2) 推荐(10)

2022年2月15日

论文翻译：2022_PACDNN: A phase-aware composite deep neural network for speech enhancement

摘要：论文地址：PACDNN：一种用于语音增强的相位感知复合深度神经网络相似代码：https://github.com/phpstorm1/SE-FCN 引用格式：Hasannezhad M，Yu H，Zhu W P，et al. PACDNN： A phase-aware composite deep 阅读全文

posted @ 2022-02-15 15:39 凌逆战阅读(1999) 评论(0) 推荐(3)

2022年1月29日

Transformer模型详解

摘要： 2013年 word Embedding 2017年 Transformer 2018年 ELMo、Transformer-decoder、GPT-1、BERT 2019年 Transformer-XL、XLNet、GPT-2 2020年 GPT-3 Transformer 谷歌提出的Transfo 阅读全文

posted @ 2022-01-29 11:22 凌逆战阅读(3870) 评论(0) 推荐(7)

2022年1月20日

论文翻译：2021_DeepFilterNet: A Low Complexity Speech Enhancement Framework for Full-Band Audio based on Deep Filtering

摘要：博客作者：凌逆战论文地址：DeepFilterNet：基于深度滤波器的全频带音频低复杂度语音增强框架论文代码：https://github.com/Rikorose/DeepFilterNet 引用：Schröter H, Rosenkranz T, Maier A. DeepFilterNet 阅读全文

posted @ 2022-01-20 21:21 凌逆战阅读(5035) 评论(5) 推荐(5)

2022年1月18日

论文翻译：2019_TCNN: Temporal convolutional neural network for real-time speech enhancement in the time domain

摘要：论文地址：TCNN：时域卷积神经网络用于实时语音增强论文代码：https://github.com/LXP-Never/TCNN（非官方复现）引用格式：Pandey A, Wang D L. TCNN： Temporal convolutional neural network for real 阅读全文

posted @ 2022-01-18 17:42 凌逆战阅读(2854) 评论(1) 推荐(2)

2022年1月12日

论文翻译：2020_FLGCNN: A novel fully convolutional neural network for end-to-end monaural speech enhancement with utterance-based objective functions

摘要：论文地址：FLGCNN:一种新颖的全卷积神经网络，用于基于话语的目标函数的端到端单耳语音增强论文代码：https://github.com/LXP-Never/FLGCCRN(非官方复现) 引用格式：Zhu Y, Xu X, Ye Z. FLGCNN: A novel fully convolut 阅读全文

posted @ 2022-01-12 10:48 凌逆战阅读(1698) 评论(5) 推荐(1)

2021年12月21日

论文翻译：2021_MetricGAN+: An Improved Version of MetricGAN for Speech Enhancement

摘要：论文地址：MetricGAN+：用于语音增强的 MetricGAN 的改进版本论文代码：https://github.com/JasonSWFu/MetricGAN 引用格式：Fu S W, Yu C, Hsieh T A, et al. MetricGAN+: An Improved Versi 阅读全文

posted @ 2021-12-21 17:02 凌逆战阅读(2836) 评论(0) 推荐(3)

2021年12月13日

论文翻译：2021_Low-Delay Speech Enhancement Using Perceptually Motivated Target and Loss

摘要：论文地址：使用感知动机目标和损失的低延迟语音增强引用格式：Zhang X, Ren X, Zheng X, et al. Low-Delay Speech Enhancement Using Perceptually Motivated Target and Loss[J]. Proc. Inte 阅读全文

posted @ 2021-12-13 11:18 凌逆战阅读(1282) 评论(7) 推荐(4)

2021年12月12日

论文翻译：2021_PercepNet：A Perceptually Motivated Approach for Low-complexity, Real-time Enhancement of Fullband Speech

摘要：论文地址：一种低复杂度实时增强全频带语音的感知激励方法论文代码：https://github.com/search?q=PercepNet 引用格式：Valin J M, Isik U, Phansalkar N, et al. A Perceptually Motivated Approach 阅读全文

posted @ 2021-12-12 17:00 凌逆战阅读(3483) 评论(2) 推荐(2)

2021年12月9日

论文翻译：2020_Improving Perceptual Quality By Phone-Fortified Perceptual Loss For Speech Enhancement

摘要：论文地址：通过语音增强的电话强化感知损失提高感知质量论文代码：https://github.com/aleXiehta/PhoneFortifiedPerceptualLoss 引用格式：Hsieh T A, Yu C, Fu S W, et al. Improving Perceptual Qu 阅读全文

posted @ 2021-12-09 08:11 凌逆战阅读(1223) 评论(0) 推荐(0)

2021年12月8日

论文翻译：2020_GCRN_Learning Complex Spectral Mapping With Gated Convolutional Recurrent Networks for Monaural Speech Enhancement

摘要：论文地址：使用门控卷积循环网络学习复数谱映射以增强单耳语音代码地址：https://github.com/JupiterEthan/GCRN-complex 作者主页：https://jupiterethan.github.io/ 引用格式：Tan K, Wang D L. Learning co 阅读全文

posted @ 2021-12-08 22:04 凌逆战阅读(3016) 评论(0) 推荐(2)

论文翻译：2018_CRN_A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement

摘要：论文地址：用于实时语音增强的卷积递归神经网络代码地址：https://github.com/JupiterEthan/CRN-causal 作者主页：https://jupiterethan.github.io/ 引用格式：Tan K, Wang D L. A Convolutional Recu 阅读全文

posted @ 2021-12-08 18:31 凌逆战阅读(4919) 评论(2) 推荐(5)

2021年12月6日

论文翻译：2020_NSNet：Weighted speech distortion losses for neural-network-based real-time speech enhancement

摘要：论文地址：基于神经网络的实时语音增强的加权语音失真损失论文代码：https://github.com/GuillaumeVW/NSNet 引用：Xia Y, Braun S, Reddy C K A, et al. Weighted speech distortion losses for neu 阅读全文

posted @ 2021-12-06 15:25 凌逆战阅读(1659) 评论(0) 推荐(1)

2021年12月1日

论文翻译：2020_SEWUNet：Monaural Speech Enhancement Through Deep Wave-U-Net

摘要：论文地址：基于深度波形U-Net进行单耳语音增强论文代码：https://github.com/Hguimaraes/SEWUNet 引用格式：Guimarães H R, Nagano H, Silva D W. Monaural speech enhancement through deep 阅读全文

posted @ 2021-12-01 18:48 凌逆战阅读(2771) 评论(3) 推荐(0)

论文翻译：2020_DARCN_A Recursive Network with Dynamic Attention for Monaural Speech Enhancement

摘要：论文地址：基于动态注意的递归网络单耳语音增强论文代码：https://github.com/Andong-Li-speech/DARCN 引用格式：Li, A., Zheng, C., Fan, C., Peng, R., Li, X. (2020) A Recursive Network wit 阅读全文

posted @ 2021-12-01 16:01 凌逆战阅读(799) 评论(0) 推荐(0)

2021年11月30日

论文翻译：2021_DNS_1th：Decoupling magnitude and phase optimization with a two-stage deep network

摘要：论文地址：两阶段深度网络的解耦幅度和相位优化引用格式：Li A, Liu W, Luo X, et al. ICASSP 2021 deep noise suppression challenge: Decoupling magnitude and phase optimization with 阅读全文

posted @ 2021-11-30 12:21 凌逆战阅读(1245) 评论(2) 推荐(1)

2021年11月26日

论文翻译：2020_Densely connected neural network with dilated convolutions for real-time speech enhancement in the time domain

摘要：论文名称：扩展卷积密集连接神经网络用于时域实时语音增强论文代码：https://github.com/ashutosh620/DDAEC 引用：Pandey A, Wang D L. Densely connected neural network with dilated convolution 阅读全文

posted @ 2021-11-26 12:05 凌逆战阅读(1043) 评论(0) 推荐(1)

2021年11月24日

语音合成论文翻译：2019_MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

摘要：论文地址：MelGAN：条件波形合成的生成对抗网络代码地址：https://github.com/descriptinc/melgan-neurips 音频实例：https://melgan-neurips.github.io/ 配有MelGAN解码器的音乐翻译网络：https://www.des 阅读全文

posted @ 2021-11-24 15:44 凌逆战阅读(1622) 评论(0) 推荐(1)

2021年11月23日

论文翻译：2020_WaveCRN: An efficient convolutional recurrent neural network for end-to-end speech enhancement

摘要：论文地址：用于端到端语音增强的卷积递归神经网络论文代码：https://github.com/aleXiehta/WaveCRN 引用格式：Hsieh T A, Wang H M, Lu X, et al. WaveCRN: An efficient convolutional recurrent 阅读全文

posted @ 2021-11-23 17:47 凌逆战阅读(1524) 评论(0) 推荐(1)

2021年11月17日

论文翻译：2020_Demucs：Real Time Speech Enhancement in the Waveform Domain

摘要：论文地址：在波形域的实时语音增强论文作者：facebook AI 研究所论文代码：https://github.com/facebookresearch/denoiser 摘要我们提出了一个基于原始波形的因果语音增强模型，该模型在笔记本电脑CPU上实时运行。所提出的模型是基于一个带有跳跃连接的阅读全文

posted @ 2021-11-17 19:50 凌逆战阅读(2325) 评论(0) 推荐(3)

2021年11月10日

论文翻译：2021_FullSubNet: A Full-Band And Sub-Band Fusion Model For Real-Time Single-Channel Speech Enhancement

摘要：论文地址：Fullsubnet：实时单通道语音增强的全频带和子频带融合模型代码地址：https://github.com/haoxiangsnr/FullSubNet 引用格式：Hao X, Su X, Horaud R, et al. FullSubNet: A Full-Band and Su 阅读全文

posted @ 2021-11-10 11:59 凌逆战阅读(2221) 评论(0) 推荐(2)

2021年8月29日

linux系统下深度学习环境搭建和使用

摘要：作为一个AI工程师，对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平。要求1：基于SSH的远程访问（本篇文章）能用一台笔记本电脑，远程登陆一台linux服务器能随时使用笔记本电脑启动训练任务能熟练的让代码和文件在笔记本电脑与LINUX服务器之间的传输要求2：Linux系统的文阅读全文

posted @ 2021-08-29 19:05 凌逆战阅读(8543) 评论(0) 推荐(6)

2021年8月16日

论文翻译：2020_RNNoise：A Hybrid DSP/Deep Learning Approach to Real-Time Full-Band Speech Enhancement

摘要：网上已经有很多人翻译了，但我做这工作只是想让自己印象更深刻论文地址：基于DSP/深度学习的实时全频带语音增强方法博客地址：https://www.cnblogs.com/LXP-Never/p/15144882.html 论文代码：https://github.com/xiph/rnnoise 阅读全文

posted @ 2021-08-16 20:07 凌逆战阅读(3141) 评论(0) 推荐(4)

2021年7月14日

C语言：结构体和共用体

摘要：这是很基础的教程，我只是写给自己看，作为一个学习笔记记录一下，如果正在阅读的你觉得简单，请不要批评，可以关掉选择离开如何学好一门编程语言掌握基础知识，为将来进一步学习打下良好的基础。上机实践，通过大量的例题学习怎么设计算法，培养解题思路。养成良好的编码习惯，注释一定要写，要不然保你一周后自己阅读全文

posted @ 2021-07-14 12:17 凌逆战阅读(499) 评论(0) 推荐(0)

2021年6月8日

声音克隆_论文翻译：2019_Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis

摘要：论文：2019_Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis 翻译总结：只需5秒音源，这个网络就能实时“克隆”你的声音代码：Real-Time-Voice-Cloning | 阅读全文

posted @ 2021-06-08 20:33 凌逆战阅读(2026) 评论(0) 推荐(0)

2021年6月2日

移动端深度学习开源框架及部署

摘要： TensorFlow Lite 开源企业：谷歌 GitHub地址：https://github.com/tensorflow/tflite-micro TensorFlow Lite for Microcontrollers 是TensorFlow Lite的实验端口，旨在在只有千字节内存的微控制器阅读全文

posted @ 2021-06-02 19:45 凌逆战阅读(7191) 评论(0) 推荐(4)

深度学习模型压缩与加速

摘要：深度神经网络在人工智能的应用中，包括语音识别、计算机视觉、自然语言处理等各方面，在取得巨大成功的同时，这些深度神经网络需要巨大的计算开销和内存开销，严重阻碍了资源受限下的使用。模型压缩是对已经训练好的深度模型进行精简，进而得到一个轻量且准确率相当的网络，压缩后的网络具有更小的结构和更少的参数，可以有阅读全文

posted @ 2021-06-02 11:53 凌逆战阅读(5808) 评论(0) 推荐(2)

轻量级神经网络设计

摘要：引言深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中，并取得了巨大成功。然而，由于存储空间和功耗的限制，神经网络模型在嵌入式设备上的存储与计算仍然是一个巨大的挑战。目前工业级和学术界设计轻量化神经网络模型主要有4个方向：人工设计轻量化神经网络模型基于神经网络架构搜索（Neura 阅读全文

posted @ 2021-06-02 10:34 凌逆战阅读(2758) 评论(0) 推荐(2)

改变网络结构设计为什么会实现模型压缩和加速

摘要： Group convolution Group convolution最早出现在AlexNet中，是为了解决单卡显存不够，将网络部署到多卡上进行训练而提出。Group convolution可以减少单个卷积1/g的参数量。如何计算的呢？假设输入特征的的维度为$HWC_1$; 卷积核的维度为$ 阅读全文

posted @ 2021-06-02 09:22 凌逆战阅读(587) 评论(0) 推荐(1)

2021年5月21日

基于深度学习的回声消除系统与Pytorch实现

摘要：文章作者：凌逆战文章代码（pytorch实现）：https://github.com/LXP-Never/AEC_DeepModel 文章地址（转载请指明出处）：https://www.cnblogs.com/LXP-Never/p/14779360.html 写这篇文章的目的：降低全国想要做基阅读全文

posted @ 2021-05-21 22:11 凌逆战阅读(18002) 评论(69) 推荐(68)

2021年5月15日

论文翻译：Conv-TasNet: Surpassing Ideal Time–Frequency Magnitude Masking for Speech Separation

摘要：我醉了呀，当我花一天翻译完后，发现已经网上已经有现成的了，而且翻译的比我好，哎，造孽呀，但是他写的是论文笔记，而我是纯翻译，能给读者更多的思想和理解空间，并且还有参考文献，也不错哈，反正翻译是写给自己看的文章方向：语音分离，论文地址：Conv-TasNet：超越理想的语音分离时频幅度掩蔽博客地阅读全文

posted @ 2021-05-15 20:31 凌逆战阅读(4673) 评论(4) 推荐(8)

2021年1月9日

神经网络中的降维和升维方法 (tensorflow & pytorch)

摘要：大名鼎鼎的UNet和我们经常看到的编解码器模型，他们的模型都是先将数据下采样，也称为特征提取，然后再将下采样后的特征恢复回原来的维度。这个特征提取的过程我们称为“下采样”，这个恢复的过程我们称为“上采样”，本文就专注于神经网络中的下采样和上采样来进行一次总结。写的不好勿怪哈。神经网络中的降维方法阅读全文

posted @ 2021-01-09 19:46 凌逆战阅读(9028) 评论(0) 推荐(6)

2021年1月8日

论文翻译：2020_Residual Acoustic Echo Suppression Based On Efficient Multi-Task Convolutional Neural Network

摘要：论文地址：基于高效多任务卷积神经网络的残余声回波抑制摘要回声会降低语音通信系统的用户体验，因此需要完全抑制。提出了一种利用卷积神经网络实现实时残余声回波抑制的方法。在多任务学习的背景下，采用双语音检测器作为辅助任务来提高RAES的性能。该训练准则基于一种新的损失函数，我们称之为抑制损失，以平衡残阅读全文

posted @ 2021-01-08 15:58 凌逆战阅读(1610) 评论(2) 推荐(6)

2020年12月31日

论文翻译：2018_Deep Learning for Acoustic Echo Cancellation in Noisy and Double-Talk Scenarios

摘要：论文地址：深度学习用于噪音和双讲场景下的回声消除博客地址：https://www.cnblogs.com/LXP-Never/p/14210359.html 摘要传统的声学回声消除（AEC）通过使用自适应算法识别声学脉冲响应来工作。我们将AEC公式化为有监督的语音分离问题，该问题将说话人信号和阅读全文

posted @ 2020-12-31 16:17 凌逆战阅读(2933) 评论(5) 推荐(6)

2020年12月25日

基于深度学习的单通道语音增强

摘要：本文代码请见：https://github.com/Ryuk17/SpeechAlgorithms 博客地址（转载请指明出处）：https://www.cnblogs.com/LXP-Never/p/14142108.html 如果你觉得写得还不错，点赞👍，关注是对我最大的支持，谢谢😃 传统的语阅读全文

posted @ 2020-12-25 22:35 凌逆战阅读(21280) 评论(29) 推荐(35)

2020年12月15日

论文翻译：2020_Acoustic Echo Cancellation With The Dual-Signal Transformation Lstm Network

摘要：论文地址：声学回声消除与双信号变换LSTM网络预训练模型：https://github.com/breizhn/DTLN-aec 论文代码：https://github.com/breizhn/DTLN 博客作者：摘要本文将双信号变换LSTM网络(dual-signal transformat 阅读全文

posted @ 2020-12-15 19:13 凌逆战阅读(1826) 评论(0) 推荐(2)

2020年11月10日

tensorflow和pytorch中的参数初始化调用方法

摘要：神经网络中最重要的就是参数了，其中包括权重项$W$和偏置项$b$。我们训练神经网络的最终目的就是得到最好的参数，使得目标函数取得最小值。参数的初始化也同样重要，因此微调受到很多人的重视，只列一些常用的！ Tensorflow 常数初始化 tf.constant_initializer(value 阅读全文

posted @ 2020-11-10 17:45 凌逆战阅读(3094) 评论(0) 推荐(1)

2020年11月9日

pytorch训练GAN时的detach()

摘要：我最近在学使用Pytorch写GAN代码，发现有些代码在训练部分细节有略微不同，其中有的人用到了detach()函数截断梯度流，有的人没用detch()，取而代之的是在损失函数在反向传播过程中将backward(retain_graph=True)，本文通过两个 gan 的代码，介绍它们的作用，并分阅读全文

posted @ 2020-11-09 23:40 凌逆战阅读(6035) 评论(5) 推荐(5)

公告