摘要:大名鼎鼎的UNet和我们经常看到的编解码器模型,他们的模型都是先将数据下采样,也称为特征提取,然后再将下采样后的特征恢复回原来的维度。这个特征提取的过程我们称为“下采样”,这个恢复的过程我们称为“上采样”,本文就专注于神经网络中的下采样和上采样来进行一次总结。写的不好勿怪哈。 神经网络中的降维方法 阅读全文
posted @ 2021-01-09 19:46 凌逆战 阅读(440) 评论(0) 推荐(4) 编辑
摘要:众所周知,GitHub是一个巨大的开源宝库,以及程序员和编程爱好者的聚集地,包括我之前推荐的诸多优秀的开源项目全部都是位于GitHub上。但是每当我们看到优秀的开源项目,准备去 下(bai)载(piao) 时,会发现 git clone 的速度异常之慢!这简直太难受了。小项目倒还好,即便是下载,也需 阅读全文
posted @ 2021-01-08 22:56 凌逆战 阅读(409) 评论(0) 推荐(1) 编辑
摘要:论文地址:基于高效多任务卷积神经网络的残余声回波抑制 摘要 回声会降低语音通信系统的用户体验,因此需要完全抑制。提出了一种利用卷积神经网络实现实时残余声回波抑制的方法。在多任务学习的背景下,采用双语音检测器作为辅助任务来提高RAES的性能。该训练准则基于一种新的损失函数,我们称之为抑制损失,以平衡残 阅读全文
posted @ 2021-01-08 15:58 凌逆战 阅读(80) 评论(0) 推荐(0) 编辑
摘要:论文地址:深度学习用于噪音和双讲场景下的回声消除 博客地址:https://www.cnblogs.com/LXP-Never/p/14210359.html 摘要 传统的声学回声消除(AEC)通过使用自适应算法识别声学脉冲响应来工作。 我们将AEC公式化为有监督的语音分离问题,该问题将说话人信号和 阅读全文
posted @ 2020-12-31 16:17 凌逆战 阅读(276) 评论(0) 推荐(3) 编辑
摘要:本文代码请见:https://github.com/Ryuk17/SpeechAlgorithms 博客地址(转载请指明出处):https://www.cnblogs.com/LXP-Never/p/14142108.html 如果你觉得写得还不错,点赞👍,关注是对我最大的支持,谢谢😃 传统的语 阅读全文
posted @ 2020-12-25 22:35 凌逆战 阅读(645) 评论(2) 推荐(0) 编辑
摘要:数字信号 信号是信息的物理载体,信息是信号的具体内容。 连续时间信号:在连续时间范围内定义的信号,信号的幅度可以是连续的(模拟信号),也可以是离散的 离散时间信号:时间为离散变量的信号,即独立变量时间被量化了,而幅度仍是连续变化的 数字信号:时间离散而幅度量化的信号 从模拟信号到数字信号 我们经常处 阅读全文
posted @ 2020-12-21 10:05 凌逆战 阅读(308) 评论(0) 推荐(1) 编辑
摘要:论文地址:声学回声消除与双信号变换LSTM网络 预训练模型:https://github.com/breizhn/DTLN-aec 论文代码:https://github.com/breizhn/DTLN 博客作者: 摘要 本文将双信号变换LSTM网络(dual-signal transformat 阅读全文
posted @ 2020-12-15 19:13 凌逆战 阅读(147) 评论(0) 推荐(1) 编辑
摘要:神经网络中最重要的就是参数了,其中包括权重项$W$和偏置项$b$。 我们训练神经网络的最终目的就是得到最好的参数,使得目标函数取得最小值。参数的初始化也同样重要,因此微调受到很多人的重视, 只列一些常用的! Tensorflow 常数初始化 tf.constant_initializer(value 阅读全文
posted @ 2020-11-10 17:45 凌逆战 阅读(344) 评论(0) 推荐(0) 编辑
摘要:我最近在学使用Pytorch写GAN代码,发现有些代码在训练部分细节有略微不同,其中有的人用到了detach()函数截断梯度流,有的人没用detch(),取而代之的是在损失函数在反向传播过程中将backward(retain_graph=True),本文通过两个 gan 的代码,介绍它们的作用,并分 阅读全文
posted @ 2020-11-09 23:40 凌逆战 阅读(538) 评论(1) 推荐(0) 编辑
摘要:pytorch对一下常用的公开数据集有很方便的API接口,但是当我们需要使用自己的数据集训练神经网络时,就需要自定义数据集,在pytorch中,提供了一些类,方便我们定义自己的数据集合 torch.utils.data.Dataset:所有继承他的子类都应该重写 __len()__ , __geti 阅读全文
posted @ 2020-11-09 12:16 凌逆战 阅读(432) 评论(0) 推荐(0) 编辑
摘要:博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/13404523.html 音频时域波形具有以下特征:音调,响度,质量。我们在进行数据增强时,最好只做一些小改动,使得增强数据和源数据存在较小差异即可,切记不能改变原有数据的结构,不然将产生“脏数据” 阅读全文
posted @ 2020-10-02 22:05 凌逆战 阅读(1114) 评论(3) 推荐(1) 编辑
摘要:过拟合定义:模型在训练集上的表现很好,但在测试集和新数据上的表现很差。 训练集上的表现 测试集上的表现 结论 不好 不好 欠拟合 好 不好 过拟合 好 好 适度拟合 原因 训练数据集太小,过拟合出现的原因: 模型复杂度过高,参数过多 数量数据比较小 训练集和测试集分布不一致 样本里面的噪声数据干扰过 阅读全文
posted @ 2020-09-30 17:09 凌逆战 阅读(767) 评论(0) 推荐(0) 编辑
摘要:好用的网站 最让你震惊的网站有哪些? 如何优雅地使用 Windows 10 ? Github:开源代码95%都来自于这里。再附上另外几个找代码的网站:码云、开源中国、codeproject、Google Code paperswithcode:这个网站搜罗了所有领域的论文代码,只要在这个网站上的论文 阅读全文
posted @ 2020-09-20 21:51 凌逆战 阅读(743) 评论(0) 推荐(2) 编辑
摘要:论文地址:ICASSP 2021声学回声消除挑战:数据集和测试框架 回声消除挑战赛数据集地址:https://github.com/microsoft/AEC-Challenge 噪声抑制挑战赛数据集地址:https://github.com/microsoft/DNS-Challenge 主页:h 阅读全文
posted @ 2020-09-19 20:36 凌逆战 阅读(684) 评论(0) 推荐(1) 编辑
摘要:语音交互 你知道苹果手机有几个麦克风吗? · 语音交互(VUI)是指人与人/设备通过自然语音进行信息传递的过程。 语音交互的优势: 输入效率高。语音输入的速度是传统键盘输入方式的3倍以上。例如:语音电视选台、远场语音交互、语音支持组合指令输出(“播放周星驰电影、要免费的、4星以上的”) 使用门槛低。 阅读全文
posted @ 2020-09-06 10:47 凌逆战 阅读(820) 评论(0) 推荐(1) 编辑
摘要:博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12774058.html 文章代码:https://github.com/LXP-Never/blog_data/tree/master/tensorflow_model 我一直觉得TensorFl 阅读全文
posted @ 2020-06-02 10:02 凌逆战 阅读(1714) 评论(3) 推荐(7) 编辑
摘要:常常会碰到各种各样时间序列预测问题,如商场人流量的预测、商品价格的预测、股价的预测,等等。TensorFlow新引入了一个TensorFlow Time Series库(以下简称为TFTS),它可以帮助在TensorFlow中快速搭建高性能的时间序列预测系统,并提供包括AR、LSTM在内的多个模型。 阅读全文
posted @ 2020-05-03 22:59 凌逆战 阅读(1898) 评论(0) 推荐(0) 编辑
摘要:在NLP任务中,训练数据一般是一句话(中文或英文),输入序列数据的每一步是一个字母。我们需要对数据进行的预处理是:先对这些字母使用独热编码再把它输入到RNN中,如字母a表示为(1, 0, 0, 0, …,0),字母b表示为(0, 1, 0, 0, …, 0)。如果只考虑小写字母a~z,那么每一步输入 阅读全文
posted @ 2020-04-25 15:28 凌逆战 阅读(803) 评论(0) 推荐(2) 编辑
摘要:Deep Dream是谷歌公司在2015年公布的一项有趣的技术。在训练好的卷积神经网络中,只需要设定几个参数,就可以通过这项技术生成一张图像。 本文章的代码和图片都放在我的github上,想实现本文代码的同学建议大家可以先把代码Download下来,再参考本文的解释,理解起来会更加方便。 疑问: 卷 阅读全文
posted @ 2020-04-15 16:42 凌逆战 阅读(895) 评论(0) 推荐(0) 编辑
摘要:一、简介 AlexNet:(2012)主要贡献扩展 LeNet 的深度,并应用一些 ReLU、Dropout 等技巧。AlexNet 有 5 个卷积层和 3 个最大池化层,它可分为上下两个完全相同的分支,这两个分支在第三个卷积层和全连接层上可以相互交换信息。它是开启了卷积神经网络做图像处理的先河。 阅读全文
posted @ 2020-04-13 10:24 凌逆战 阅读(1172) 评论(0) 推荐(0) 编辑
摘要:博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/10940123.html 这篇文章主要介绍使用Keras框架来实现RNN家族模型,TensorFlow实现RNN的代码可以参考我的另外一篇博客:TensorFlow中实现RNN,彻底弄懂time_s 阅读全文
posted @ 2020-03-31 11:53 凌逆战 阅读(4121) 评论(4) 推荐(0) 编辑
摘要:博客作者:凌逆战 博客地址:https:////www.cnblogs.com/LXP-Never/p/11448661.html 相信各位和我一样也有同样的困恼,就是编写代码的时候,总是写一会要动一下鼠标,这样一来,其实大部分时间都用来把手移到鼠标的过程中。因此我写下这篇博客,来给大家总结一些作为 阅读全文
posted @ 2020-03-25 11:00 凌逆战 阅读(290) 评论(0) 推荐(1) 编辑
摘要:作者:凌逆战 地址:https://www.cnblogs.com/LXP-Never/p/12051532.html 波束成型(Beamforming)又叫波束赋形、空域滤波 作用:对多路麦克风信号进行合并处理,抑制非目标方向 的干扰信号,增强目标方向的声音信号。 原理:调整相位阵列的基本单元参数 阅读全文
posted @ 2020-03-01 15:38 凌逆战 阅读(5702) 评论(0) 推荐(9) 编辑
摘要:本文主要讲解的聚类算法有:k均值算法、均值漂移算法、凝聚层次算法、DBSCAN密度聚类算法,还介绍了聚类算法性能指标——轮廓系数。 聚类(cluster)与分类(class)不同,分类是有监督学习模型,聚类属于无监督学习模型。聚类讲究使用一些算法把样本划分为n个群落。一般情况下,这种算法都需要计算欧 阅读全文
posted @ 2020-02-29 17:19 凌逆战 阅读(598) 评论(0) 推荐(1) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2020-02-29 09:19 凌逆战 阅读(95) 评论(0) 推荐(0) 编辑
摘要:论文地址:基于码本映射的窄带语音宽带重建算法 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12144324.html 摘要 本文提出了一种从窄带语音中重构宽带语音的新算法,该算法有两个新的特点。第一是基于码本映射的频谱包络重构。第二是利用重构的 阅读全文
posted @ 2020-02-28 11:21 凌逆战 阅读(333) 评论(0) 推荐(0) 编辑
摘要:论文地址:基于隐马尔科夫模型的电话语音频带扩展 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12151866.html 摘要 本文提出了一种从lowpass-bandlimited(低通带限)语音中恢复宽带语音的算法。窄带输入信号被分类为有限数 阅读全文
posted @ 2020-02-27 09:04 凌逆战 阅读(317) 评论(0) 推荐(0) 编辑
摘要:论文地址:基于GMM的语音窄带到宽带转换 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12151027.html 摘要 在不改变现有通信网络的情况下,利用窄带语音重建宽带语音是一个很有吸引力的问题。本文提出了一种从窄带语音中恢复宽带语音的新方法 阅读全文
posted @ 2020-02-26 17:36 凌逆战 阅读(335) 评论(0) 推荐(0) 编辑
摘要:论文地址:基于DNN的语音带宽扩展及其在窄带语音自动识别中加入高频缺失特征的应用 论文代码:github 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12361112.html 摘要 我们提出了一些增强技术来提高从窄带到宽带扩频(BWE)中的语 阅读全文
posted @ 2020-02-26 11:31 凌逆战 阅读(521) 评论(9) 推荐(0) 编辑
摘要:论文地址:基于通用传递函数GSC和后置滤波的语音增强 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12232341.html 摘要 在语音增强应用中,麦克风阵列后置滤波可进一步减少波束形成器输出处的噪声成分。在麦克风阵列结构中,最近提出的通用传 阅读全文
posted @ 2020-02-25 09:16 凌逆战 阅读(532) 评论(0) 推荐(0) 编辑
摘要:论文地址:使用半监督堆栈式自动编码器实现包含记忆的人工带宽扩展 作者:Pramod Bachhav, Massimiliano Todisco and Nicholas Evans 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/10889975. 阅读全文
posted @ 2020-02-24 11:58 凌逆战 阅读(306) 评论(0) 推荐(1) 编辑
摘要:论文地址:2018_说话人验证的广义端到端损失 论文代码:https://google.github.io/speaker-id/publications/GE2E/ 地址:https://www.cnblogs.com/LXP-Never/p/11799985.html 作者:凌逆战 摘要 在本论 阅读全文
posted @ 2020-02-23 10:57 凌逆战 阅读(1315) 评论(0) 推荐(1) 编辑
摘要:论文地址:2018_用于音频超分辨率的时频网络 博客作者:凌逆战 代码地址:https://github.com/moodoki/tfnet 博客地址:https://www.cnblogs.com/LXP-Never/p/12345950.html 摘要 音频超分辨率(即带宽扩展)是提高音频信号时 阅读全文
posted @ 2020-02-22 22:42 凌逆战 阅读(572) 评论(5) 推荐(0) 编辑
摘要:JavaScript简称JS,是一种浏览器解释型语言,嵌套在HTML文件中交给浏览器解释执行。主要用来实现网页的行为,用户交互及前后端的数据传输等。 JavaScript 组成 脚本可位于 HTML 的 <body> 或 <head> 部分中,通常的做法是把函数放入 <head> 部分中,或者放在页 阅读全文
posted @ 2020-02-21 12:02 凌逆战 阅读(526) 评论(0) 推荐(1) 编辑
摘要:jQuery是JS的工具库,对原生JS中的DOM操作、事件处理、包括数据处理和Ajax技术等进行封装,使用 . 链式写法,提供更完善,更便捷的方法。 再使用jquery之前,我们需要先引入jquery文件,才能使用jquery语法,导入jQ文件的方法有两种。 从 jquery.com 下载 jQue 阅读全文
posted @ 2020-02-20 11:43 凌逆战 阅读(463) 评论(3) 推荐(0) 编辑
摘要:博客作者:凌逆战 论文地址:https://ieeexplore.ieee.xilesou.top/abstract/document/8683611/ 地址:https://www.cnblogs.com/LXP-Never/p/10714401.html 利用条件变分自动编码器进行人工带宽扩展的 阅读全文
posted @ 2020-02-19 21:37 凌逆战 阅读(362) 评论(0) 推荐(0) 编辑
摘要:博客作者:凌逆战 论文地址:基于GAN的音频超分辨率 博客地址:https://www.cnblogs.com/LXP-Never/p/10874993.html 论文作者:Sefik Emre Eskimez , Kazuhito Koishida 摘要 语音超分辨率(SSR)或语音带宽扩展的目标 阅读全文
posted @ 2020-02-19 10:35 凌逆战 阅读(532) 评论(0) 推荐(0) 编辑
摘要:作者:凌贤鹏 地址:https://www.cnblogs.com/LXP-Never/p/11235848.html CSS全称为层叠样式表(Cascading Style Sheets),与HTML相辅相成,CSS负责实现网页的排版布局与样式美化,使用CSS样式建议在当前文件夹下创建一个CSS文 阅读全文
posted @ 2020-02-18 22:01 凌逆战 阅读(357) 评论(0) 推荐(0) 编辑
摘要:作为损失函数 L1范数损失函数 L1范数损失函数,也被称之为平均绝对值误差(MAE)。总的来说,它把目标值$Y_i$与估计值$f(x_i)$的绝对差值的总和最小化。 $$S=\frac{1}{N}\sum_{i=1}^n|Y_i-f(x_i)|$$ # tensorflow tf.reduce_me 阅读全文
posted @ 2020-01-29 15:16 凌逆战 阅读(2137) 评论(0) 推荐(1) 编辑
摘要:题目:带后置滤波的双通道广义旁瓣相消器(GSC)的分析 代码地址:https://github.com/XiaoxiangGao/Dual_Channel_Beamformer_and_Postfilter 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Neve 阅读全文
posted @ 2020-01-02 13:59 凌逆战 阅读(596) 评论(0) 推荐(2) 编辑