摘要: 论文地址:ICASSP 2021声学回声消除挑战:数据集和测试框架 回声消除挑战赛数据集地址:https://github.com/microsoft/AEC-Challenge 噪声抑制挑战赛数据集地址:https://github.com/microsoft/DNS-Challenge 主页:h 阅读全文
posted @ 2020-09-19 20:36 凌逆战 阅读(3614) 评论(13) 推荐(5) 编辑
摘要: 语音交互 你知道苹果手机有几个麦克风吗? · 语音交互(VUI)是指人与人/设备通过自然语音进行信息传递的过程。 语音交互的优势: 输入效率高。语音输入的速度是传统键盘输入方式的3倍以上。例如:语音电视选台、远场语音交互、语音支持组合指令输出(“播放周星驰电影、要免费的、4星以上的”) 使用门槛低。 阅读全文
posted @ 2020-09-06 10:47 凌逆战 阅读(7591) 评论(0) 推荐(12) 编辑
摘要: 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12774058.html 文章代码:https://github.com/LXP-Never/blog_data/tree/master/tensorflow_model 我一直觉得TensorFl 阅读全文
posted @ 2020-06-02 10:02 凌逆战 阅读(4794) 评论(4) 推荐(10) 编辑
摘要: 常常会碰到各种各样时间序列预测问题,如商场人流量的预测、商品价格的预测、股价的预测,等等。TensorFlow新引入了一个TensorFlow Time Series库(以下简称为TFTS),它可以帮助在TensorFlow中快速搭建高性能的时间序列预测系统,并提供包括AR、LSTM在内的多个模型。 阅读全文
posted @ 2020-05-03 22:59 凌逆战 阅读(4505) 评论(0) 推荐(1) 编辑
摘要: 在NLP任务中,训练数据一般是一句话(中文或英文),输入序列数据的每一步是一个字母。我们需要对数据进行的预处理是:先对这些字母使用独热编码再把它输入到RNN中,如字母a表示为(1, 0, 0, 0, …,0),字母b表示为(0, 1, 0, 0, …, 0)。如果只考虑小写字母a~z,那么每一步输入 阅读全文
posted @ 2020-04-25 15:28 凌逆战 阅读(2303) 评论(0) 推荐(2) 编辑
摘要: Deep Dream是谷歌公司在2015年公布的一项有趣的技术。在训练好的卷积神经网络中,只需要设定几个参数,就可以通过这项技术生成一张图像。 本文章的代码和图片都放在我的github上,想实现本文代码的同学建议大家可以先把代码Download下来,再参考本文的解释,理解起来会更加方便。 疑问: 卷 阅读全文
posted @ 2020-04-15 16:42 凌逆战 阅读(2027) 评论(0) 推荐(0) 编辑
摘要: 简介 AlexNet:(2012)主要贡献扩展 LeNet 的深度,并应用一些 ReLU、Dropout 等技巧。AlexNet 有 5 个卷积层和 3 个最大池化层,它可分为上下两个完全相同的分支,这两个分支在第三个卷积层和全连接层上可以相互交换信息。它是开启了卷积神经网络做图像处理的先河。 VG 阅读全文
posted @ 2020-04-13 10:24 凌逆战 阅读(2551) 评论(0) 推荐(0) 编辑
摘要: 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/10940123.html 这篇文章主要介绍使用Keras框架来实现RNN家族模型,TensorFlow实现RNN的代码可以参考我的另外一篇博客:TensorFlow中实现RNN,彻底弄懂time_s 阅读全文
posted @ 2020-03-31 11:53 凌逆战 阅读(10304) 评论(5) 推荐(2) 编辑
摘要: 博客作者:凌逆战 博客地址:https:////www.cnblogs.com/LXP-Never/p/11448661.html 相信各位和我一样也有同样的困恼,就是编写代码的时候,总是写一会要动一下鼠标,这样一来,其实大部分时间都用来把手移到鼠标的过程中。因此我写下这篇博客,来给大家总结一些作为 阅读全文
posted @ 2020-03-25 11:00 凌逆战 阅读(875) 评论(0) 推荐(4) 编辑
摘要: 作者:凌逆战 地址:https://www.cnblogs.com/LXP-Never/p/12051532.html 预备知识 麦克风阵列结构 多个麦克风阵元在空间范围内按照不同的方式排列可以构成不同麦克风阵列拓扑结构。在实际的阵列设计和选择时要考虑麦克风数量、麦克风位置以及不同阵元间距对语音信号 阅读全文
posted @ 2020-03-01 15:38 凌逆战 阅读(30188) 评论(3) 推荐(34) 编辑
摘要: 本文主要讲解的聚类算法有:k均值算法、均值漂移算法、凝聚层次算法、DBSCAN密度聚类算法,还介绍了聚类算法性能指标——轮廓系数。 聚类(cluster)与分类(class)不同,分类是有监督学习模型,聚类属于无监督学习模型。聚类讲究使用一些算法把样本划分为n个群落。一般情况下,这种算法都需要计算欧 阅读全文
posted @ 2020-02-29 17:19 凌逆战 阅读(1413) 评论(0) 推荐(2) 编辑
摘要: 论文地址:原始音频的带宽扩展通过生成对抗网络 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/10661950.html 摘要 基于神经网络的方法最近在图像合成和超分辨率任务方面展示了最先进的结果,特别是通过使用具有监督特征损失的生成对抗网络(GA 阅读全文
posted @ 2020-02-29 09:19 凌逆战 阅读(884) 评论(0) 推荐(0) 编辑
摘要: 论文地址:基于码本映射的窄带语音宽带重建算法 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12144324.html 摘要 本文提出了一种从窄带语音中重构宽带语音的新算法,该算法有两个新的特点。第一是基于码本映射的频谱包络重构。第二是利用重构的 阅读全文
posted @ 2020-02-28 11:21 凌逆战 阅读(715) 评论(0) 推荐(1) 编辑
摘要: 论文地址:基于隐马尔科夫模型的电话语音频带扩展 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12151866.html 摘要 本文提出了一种从lowpass-bandlimited(低通带限)语音中恢复宽带语音的算法。窄带输入信号被分类为有限数 阅读全文
posted @ 2020-02-27 09:04 凌逆战 阅读(691) 评论(0) 推荐(0) 编辑
摘要: 论文地址:基于GMM的语音窄带到宽带转换 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12151027.html 摘要 在不改变现有通信网络的情况下,利用窄带语音重建宽带语音是一个很有吸引力的问题。本文提出了一种从窄带语音中恢复宽带语音的新方法 阅读全文
posted @ 2020-02-26 17:36 凌逆战 阅读(821) 评论(0) 推荐(0) 编辑
摘要: 论文地址:基于DNN的语音带宽扩展和添加高频缺失特征窄带语音 论文代码:github 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12361112.html 摘要 我们提出了一些增强技术来提高从窄带到宽带扩频(BWE)中的语音质量,解决了三个在 阅读全文
posted @ 2020-02-26 11:31 凌逆战 阅读(1245) 评论(13) 推荐(1) 编辑
摘要: 论文地址:基于通用传递函数GSC和后置滤波的语音增强 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12232341.html 摘要 在语音增强应用中,麦克风阵列后置滤波可进一步减少波束形成器输出处的噪声成分。在麦克风阵列结构中,最近提出的通用传 阅读全文
posted @ 2020-02-25 09:16 凌逆战 阅读(2193) 评论(4) 推荐(2) 编辑
摘要: 论文地址:使用半监督堆栈式自动编码器实现包含记忆的人工带宽扩展 作者:Pramod Bachhav, Massimiliano Todisco and Nicholas Evans 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/10889975. 阅读全文
posted @ 2020-02-24 11:58 凌逆战 阅读(669) 评论(0) 推荐(1) 编辑
摘要: 论文地址:2018_说话人验证的广义端到端损失 论文代码:https://google.github.io/speaker-id/publications/GE2E/ 地址:https://www.cnblogs.com/LXP-Never/p/11799985.html 作者:凌逆战 摘要 在本论 阅读全文
posted @ 2020-02-23 10:57 凌逆战 阅读(2848) 评论(1) 推荐(2) 编辑
摘要: 论文地址:2018_用于音频超分辨率的时频网络 博客作者:凌逆战 代码地址:https://github.com/moodoki/tfnet 博客地址:https://www.cnblogs.com/LXP-Never/p/12345950.html 摘要 音频超分辨率(即带宽扩展)是提高音频信号时 阅读全文
posted @ 2020-02-22 22:42 凌逆战 阅读(2056) 评论(8) 推荐(0) 编辑
摘要: JavaScript简称JS,是一种浏览器解释型语言,嵌套在HTML文件中交给浏览器解释执行。主要用来实现网页的行为,用户交互及前后端的数据传输等。 JavaScript 组成 脚本可位于 HTML 的 <body> 或 <head> 部分中,通常的做法是把函数放入 <head> 部分中,或者放在页 阅读全文
posted @ 2020-02-21 12:02 凌逆战 阅读(757) 评论(0) 推荐(1) 编辑
摘要: jQuery是JS的工具库,对原生JS中的DOM操作、事件处理、包括数据处理和Ajax技术等进行封装,使用 . 链式写法,提供更完善,更便捷的方法。 再使用jquery之前,我们需要先引入jquery文件,才能使用jquery语法,导入jQ文件的方法有两种。 从 jquery.com 下载 jQue 阅读全文
posted @ 2020-02-20 11:43 凌逆战 阅读(643) 评论(3) 推荐(0) 编辑
摘要: 博客作者:凌逆战 论文地址:https://ieeexplore.ieee.xilesou.top/abstract/document/8683611/ 地址:https://www.cnblogs.com/LXP-Never/p/10714401.html 利用条件变分自动编码器进行人工带宽扩展的 阅读全文
posted @ 2020-02-19 21:37 凌逆战 阅读(883) 评论(0) 推荐(0) 编辑
摘要: 博客作者:凌逆战 论文地址:基于GAN的音频超分辨率 博客地址:https://www.cnblogs.com/LXP-Never/p/10874993.html 论文作者:Sefik Emre Eskimez , Kazuhito Koishida 摘要 语音超分辨率(SSR)或语音带宽扩展的目标 阅读全文
posted @ 2020-02-19 10:35 凌逆战 阅读(1359) 评论(0) 推荐(0) 编辑
摘要: 作者:凌贤鹏 地址:https://www.cnblogs.com/LXP-Never/p/11235848.html CSS全称为层叠样式表(Cascading Style Sheets),与HTML相辅相成,CSS负责实现网页的排版布局与样式美化,使用CSS样式建议在当前文件夹下创建一个CSS文 阅读全文
posted @ 2020-02-18 22:01 凌逆战 阅读(694) 评论(0) 推荐(0) 编辑
摘要: 作者:凌逆战 地址:https://www.cnblogs.com/LXP-Never/p/11229886.html HTML称为超文本标记语言,不属于编程语言的范畴,HTML使用标记标签来描述网页。HTML运行在浏览器上,由浏览器来解析。网页运行在浏览器上,是数据展示的载体。网页由浏览器、服务器 阅读全文
posted @ 2020-02-17 16:47 凌逆战 阅读(671) 评论(0) 推荐(0) 编辑
摘要: 作为损失函数 L1范数损失函数 L1范数损失函数,也被称之为平均绝对值误差(MAE)。总的来说,它把目标值$y(n)$与估计值$\hat{y}(n)$的绝对差值的总和最小化。 $$Loss_{MAE}=\frac{1}{N}\sum_{n=1}^N|y(n)-\hat{y}(n)|$$ # tens 阅读全文
posted @ 2020-01-29 15:16 凌逆战 阅读(9955) 评论(0) 推荐(6) 编辑
摘要: 题目:带后置滤波的双通道广义旁瓣相消器(GSC)的分析 代码地址:https://github.com/XiaoxiangGao/Dual_Channel_Beamformer_and_Postfilter 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Neve 阅读全文
posted @ 2020-01-02 13:59 凌逆战 阅读(2194) 评论(0) 推荐(4) 编辑
摘要: 论文题目:利用WAVENET扩展语音带宽 作者:Archit Gupta, Brendan Shillingford, Yannis Assael, Thomas C. Walters 博客地址:https://www.cnblogs.com/LXP-Never/p/12090929.html 博客 阅读全文
posted @ 2019-12-26 11:43 凌逆战 阅读(1052) 评论(0) 推荐(1) 编辑
摘要: 论文地址:Adaptive Algorithms For Acoustic Echo Cancellation In Speech Processing 自适应滤波是数字信号处理的核心技术之一,在科学和工业上有着广泛的应用领域。自适应滤波技术应用广泛,包括回波抵消、自适应均衡、自适应噪声抵消和自适应 阅读全文
posted @ 2019-11-20 21:26 凌逆战 阅读(9903) 评论(7) 推荐(11) 编辑
摘要: 作者:凌逆战 地址:https://www.cnblogs.com/LXP-Never/p/11607551.html 电脑主要配件:主板、CPU、显卡、显示器、电源、机箱、内存条、硬盘。CPU、显卡、内存条、硬盘是插在主板上的,电源用来给主板上的部件进行供电,CPU,主板,显卡,内存条、硬盘、电源 阅读全文
posted @ 2019-11-15 11:00 凌逆战 阅读(10778) 评论(59) 推荐(170) 编辑
摘要: 回声消除应用平台 基于DSP等平台的回声消除技术 基于windows等非实时平台的回声消除技术 基于DSP平台的回声消除技术 回音抵消的核心就是一个采用自适应算法的滤波器,虽然以前自适应信号理论发展迅速,但由于受到硬件的限制而难以实现,一直到上世纪70年代末80年代初,随着世界上第一片单片可编程DS 阅读全文
posted @ 2019-11-13 15:42 凌逆战 阅读(1683) 评论(5) 推荐(0) 编辑
摘要: 作者:凌逆战时间:2019年11月1日博客园地址:https://www.cnblogs.com/LXP-Never/p/11415137.html OpenCV基础 OpenCV是一个开源的计算机视觉库。提供了很多图像处理常用的工具 批注:本文所有图片数据都在我的GitHub仓库 读取图片并显示 阅读全文
posted @ 2019-11-10 16:24 凌逆战 阅读(1868) 评论(3) 推荐(2) 编辑
摘要: 作者:凌逆战 文章地址:https://www.cnblogs.com/LXP-Never/p/11773190.html 并不是每个自适应滤波器的的代码我都实现了,我需要一定的时间,一有时间我就会来更新代码,记得关注我,如果有问题记得反馈 另外科研严谨,搞科研的建议多看论文,因为我是业余的,写这领 阅读全文
posted @ 2019-11-01 21:50 凌逆战 阅读(30124) 评论(18) 推荐(49) 编辑
摘要: 作者:凌逆战 时间:2019-11-01 文章地址:https://www.cnblogs.com/LXP-Never/p/11775413.html 扬声器摆放解决方案 恩智浦公司 参考网站:https://www.nxp.com.cn 恩智浦半导体公司宣布推出了一款回声消除及降噪解决方案,该解决 阅读全文
posted @ 2019-11-01 21:41 凌逆战 阅读(6888) 评论(0) 推荐(1) 编辑
摘要: 作者:凌逆战博客园地址:https://www.cnblogs.com/LXP-Never/p/11773190.html 想要降低汽车噪声,就要了解汽车室内噪声环境, 汽车噪声系统框图 外部激励:风噪、路噪以及环境噪声等激励噪声 内部激励:悬架系统、变速箱系统、发动机等系统在行车时造成的 振动激励 阅读全文
posted @ 2019-11-01 11:54 凌逆战 阅读(2036) 评论(0) 推荐(4) 编辑
摘要: 自然语言处理,通常简称为NLP,是人工智能的一个分支,处理使用自然语言的计算机与人之间的交互。NLP的最终目标是以有价值的方式阅读,解读,理解和理解人类语言。大多数NLP技术都依靠机器学习来从人类语言中获取含义。 Siri的工作流程: 听 懂 思考 组织语言 回答 其中分别涉及的技术: 语音识别 自 阅读全文
posted @ 2019-10-27 10:48 凌逆战 阅读(4579) 评论(0) 推荐(2) 编辑
摘要: 面向对象 对象:是指现实中的物体实体化,对象有很过属性(名字、年龄..),也有很多行为(学习、吃饭..),实例即对象。对象同时也是通过类定义的数据结构实例,对象包括两个数据成员(类变量和实例变量)和方法。对象可以包含任意数量和类型的数据。 实例化:创建一个类的实例,类的具体对象化,实例就是类的实例化 阅读全文
posted @ 2019-10-24 21:35 凌逆战 阅读(833) 评论(0) 推荐(1) 编辑
摘要: 论文题目:基于SincNet的原始波形说话人识别 代码地址:https://github.com/mravanelli/SincNet/ 论文作者:Mirco Ravanelli, Yoshua Bengio 博客作者:凌逆战 博客地址(引用请注明出处):https://www.cnblogs.co 阅读全文
posted @ 2019-10-24 09:50 凌逆战 阅读(1777) 评论(0) 推荐(1) 编辑
摘要: 论文地址:Some Commonly Used Speech Feature Extraction Algorithms 前言 语言是一种复杂的自然习得的人类运动能力。成人的特点是通过大约100块肌肉的协调运动,每秒发出14种不同的声音。说话人识别是指软件或硬件接收语音信号,识别语音信号中出现的说话 阅读全文
posted @ 2019-10-23 11:37 凌逆战 阅读(10767) 评论(7) 推荐(10) 编辑