摘要: 文章代码仓库:https://gitee.com/LXP-Never/window_fun 窗函数贯穿整个语音信号处理,语音信号是一个非平稳的时变信号,但“**短时间内可以认为语音信号是平稳时不变的,一般 10~30ms**。 对连续的语音分帧做STFT处理,等价于截取一段时间信号,对其进行周期性延 阅读全文
posted @ 2024-05-06 15:38 凌逆战 阅读(532) 评论(0) 推荐(2) 编辑
摘要: 那么作为门外汉,如何快速了解一个行业。可以从四个层面系统性地去了解 1、行业了解的目的 一般来说,从企业角度出发做行业分析的目的通常有三个: 了解所属行业的发展现状、竞争优劣、行业前景等,现在这个行业里竞争环境如何。 挖掘行业机会点,明确优势,看清劣势,寻找与领先企业的差距,改善资源配置,扬长避短。 阅读全文
posted @ 2024-02-15 12:26 凌逆战 阅读(2172) 评论(5) 推荐(23) 编辑
摘要: 论文地址:语义听觉:用双耳可听器编程声学场景 论文代码:https://semantichearing.cs.washington.edu/ 引用格式:Veluri B, Itani M, Chan J, et al. Semantic Hearing: Programming Acoustic S 阅读全文
posted @ 2023-12-06 11:19 凌逆战 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 当使用ssh进行远程代码运行时,控制端电脑通常不能出现任何意外。然而,运行深度学习程序通常需要数小时或数天的时间,这意味着我们的IDE不能关闭。一旦出现非人为因素(如断电、断网或IDE卡死关闭),远程程序也会中断。因此,将程序灵活地运行在服务器上,不受控制端因素的影响至关重要。 使用 & 将命令放到 阅读全文
posted @ 2023-12-04 17:06 凌逆战 阅读(401) 评论(0) 推荐(0) 编辑
摘要: 本文代码:https://gitee.com/LXP-Never/py-equalizer EQ 的全称是 Equalizer,EQ 是 Equalizer 的前两个字母,中文名字叫做“均衡器”。最早是用来提升电话信号在长距离的传输中损失的高频,由此得到一个各频带相对平衡的结果,它让各个频带的声音得 阅读全文
posted @ 2023-10-06 23:09 凌逆战 阅读(1696) 评论(0) 推荐(1) 编辑
摘要: 论文地址:微型循环U-Net实时降噪和去混响 论文代码: https://github.com/YangangCao/TRUNet https://github.com/Okrio/tinyrecurrentunet 引用格式:Choi H S, Park S, Lee J H, et al. Re 阅读全文
posted @ 2023-06-26 15:27 凌逆战 阅读(1128) 评论(0) 推荐(0) 编辑
摘要: 语音顶会 ICASSP 所有年份论文集下载地址:https://ieeexplore.ieee.org/xpl/conhome/1000002/all-proceedings Interspeech 所有年份论文集下载地址:https://www.isca-speech.org/archive/ 期 阅读全文
posted @ 2023-03-24 14:25 凌逆战 阅读(1838) 评论(0) 推荐(4) 编辑
摘要: 论文地址:THLNet: 用于单耳语音增强的两级异构轻量级网络 代码:https://github.com/dangf15/THLNet 引用格式:Dang F, Hu Q, Zhang P. THLNet: two-stage heterogeneous lightweight network f 阅读全文
posted @ 2023-03-21 14:18 凌逆战 阅读(1627) 评论(2) 推荐(5) 编辑
摘要: 论文地址:相位感知深度语音增强:这完全取决于帧长 论文代码:https://github.com/CarmiShimon/Phase-Aware-Deep-Speech-Enhancement 引用格式:Peer T, Gerkmann T. Phase-aware deep speech enha 阅读全文
posted @ 2023-02-08 20:05 凌逆战 阅读(1244) 评论(7) 推荐(3) 编辑
摘要: 论文地址:基于时移建模的入耳式耳机透听系统 引用格式: 摘要 透传(hear-through,HT)技术是通过增强耳机佩戴者对环境声音的感知来主动补偿被动隔离的。耳机中的材料会减少声音 500Hz以上的高频成分。HT算法利用麦克风和用户耳朵之间的相对传递函数(RTF)产生人造声音,从而弥补环境声音的 阅读全文
posted @ 2023-02-07 08:54 凌逆战 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 论文地址:ECAPA-TDNN:在基于TDNN的说话人验证中强调通道注意、传播和聚集 论文代码:https://github.com/TaoRuijie/ECAPA-TDNN 引用格式:Desplanques B, Thienpondt J, Demuynck K. Ecapa-tdnn: Emph 阅读全文
posted @ 2023-02-06 10:20 凌逆战 阅读(830) 评论(0) 推荐(2) 编辑
摘要: 博客地址:凌逆战 (转载请注明出处) 论文地址:PercepNet+: 用于实时语音增强的相位和信噪比感知 PercepNet 引用格式: Ge X, Han J, Long Y, et al. PercepNet+: A Phase and SNR Aware PercepNet for Real 阅读全文
posted @ 2023-02-05 17:03 凌逆战 阅读(1254) 评论(0) 推荐(1) 编辑
摘要: 论文地址:TEA-PSE: 用于ICASSP 2022 DNS挑战赛的Tencent-ethereal-audio-lab 个性化语音增强系统 论文代码: 引用格式:Ju Y, Rao W, Yan X, et al. TEA-PSE: Tencent-ethereal-audio-lab pers 阅读全文
posted @ 2023-02-03 16:06 凌逆战 阅读(1195) 评论(0) 推荐(2) 编辑
摘要: 论文地址:TEA-PSE 2.0:用于实时个性化语音增强的子带网络 引用:Ju Y, Zhang S, Rao W, et al. Tea-pse 2.0: Sub-band network for real-time personalized speech enhancement[C]//2022 阅读全文
posted @ 2023-02-02 10:47 凌逆战 阅读(668) 评论(0) 推荐(2) 编辑
摘要: DRC介绍 动态范围就是信号的最大幅值和最小幅值比值的对数(单位dB),动态范围会受到系统中各个环节的影响。例如同样是这段音乐,在一个40dB背景噪声的环境中播放,那么由于掩蔽效应等因素的影响,最终实际听到的音乐动态范围实际上是50dB。如果对响度和动态范围感兴趣的可以移步看鬼斧神工的文章《详解音频 阅读全文
posted @ 2023-01-11 18:45 凌逆战 阅读(3635) 评论(1) 推荐(4) 编辑
摘要: 论文地址:带轴向注意的多尺度时域频率卷积网络语音增强 论文代码:https://github.com/echocatzh/MTFAA-Net 引用:Zhang G, Yu L, Wang C, et al. Multi-scale temporal frequency convolutional n 阅读全文
posted @ 2022-12-09 09:41 凌逆战 阅读(1657) 评论(0) 推荐(1) 编辑
摘要: 博客地址:凌逆战 论文地址:DeepFilternet2: 面向嵌入式设备的全波段音频实时语音增强 论文代码:https://github.com/Rikorose/DeepFilterNet 引用格式:Schröter H, Rosenkranz T, Maier A. DeepFilterNet 阅读全文
posted @ 2022-11-16 11:59 凌逆战 阅读(2220) 评论(2) 推荐(1) 编辑
摘要: 在深度学习中,量化指的是使用更少的bit来存储原本以浮点数存储的tensor,以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点: 更少的模型体积,接近4倍的减少; 可以更快的计算,由于更少的内存访问和更快的int8计算,可以快2~4倍。 一个量化后的模型,其部分或者全部的 阅读全文
posted @ 2022-10-25 20:41 凌逆战 阅读(6514) 评论(2) 推荐(2) 编辑
摘要: TensorFlow Lite 是 TensorFlow 在移动和 IoT 等边缘设备端的解决方案,提供了 Java、Python 和 C++ API 库,可以运行在 Android、iOS 和 Raspberry Pi 等设备上。目前 TFLite 只提供了推理功能,在服务器端进行训练后,经过如下 阅读全文
posted @ 2022-10-24 12:13 凌逆战 阅读(2704) 评论(1) 推荐(5) 编辑
摘要: 博客地址:https://www.cnblogs.com/LXP-Never/p/15474948.html(转载请注明出处) 博客作者:凌逆战 语音数据集 TIMIT 官方提供的下载地址:https://catalog.ldc.upenn.edu/LDC93S1 免费下载地址:https://go 阅读全文
posted @ 2022-10-07 18:11 凌逆战 阅读(15556) 评论(2) 推荐(18) 编辑
摘要: 《古诗词里的快意人生》通过讲解诗人的一生让我了解每一首诗的来源背景。一生都在追求极致潇洒的天才诗人李白;一生遭遇很不幸,却心怀天下做狂歌的杜甫。为了功名来到边塞,从悔恨到渐渐爱上边塞的岑参。追求“不平则鸣”的韩愈;“世界以痛吻我,却报之以歌”的柳宗元;魅力四射的温庭筠,他写出了:玲珑骰子安红豆,入骨 阅读全文
posted @ 2022-09-18 19:45 凌逆战 阅读(522) 评论(0) 推荐(1) 编辑
摘要: 先上人物关系图 读后感 故事的开头是主人公西门闹因为地主身份被当做典型枪毙了,西门闹经过7次转世(驴,牛,猪,狗,猴,大头儿)亲眼见证了后世之事。 转世为驴,见证了自己的妻妾们改嫁与生儿,身处合作社的时代,跟着蓝脸坚持单干,但随之而来的大饥馑,人民饥不裹腹,驴被饿昏的人民手撕充饥。 转世为牛,除了蓝 阅读全文
posted @ 2022-09-18 16:00 凌逆战 阅读(383) 评论(2) 推荐(1) 编辑
摘要: 其实模型的参数量好算,但浮点运算数并不好确定,我们一般也就根据参数量直接估计计算量了。但是像卷积之类的运算,它的参数量比较小,但是运算量非常大,它是一种计算密集型的操作。反观全连接结构,它的参数量非常多,但运算量并没有显得那么大。 FLOPs(Floating-point Operations):浮 阅读全文
posted @ 2022-09-08 14:02 凌逆战 阅读(3519) 评论(0) 推荐(1) 编辑
摘要: 论文地址:一种新的基于循环神经网络的远场语音通信实时噪声抑制算法 引用格式:Chen B, Zhou Y, Ma Y, et al. A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Base 阅读全文
posted @ 2022-08-26 17:38 凌逆战 阅读(1556) 评论(0) 推荐(2) 编辑
摘要: 论文地址:基于分层递归神经网络的嵌入式设备轻量化在线降噪 引用格式:Schröter H, Rosenkranz T, Zobel P, et al. Lightweight Online Noise Reduction on Embedded Devices using Hierarchical 阅读全文
posted @ 2022-08-16 21:41 凌逆战 阅读(840) 评论(0) 推荐(0) 编辑
摘要: 论文地址:延迟约束的语音增强基音估计 引用格式:Schröter H, Rosenkranz T, Escalante-B A N, et al. LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement[C]//Inte 阅读全文
posted @ 2022-08-07 21:37 凌逆战 阅读(584) 评论(0) 推荐(3) 编辑
摘要: 论文地址:单耳语音增强的时频注意 引用格式:Zhang Q, Song Q, Ni Z, et al. Time-Frequency Attention for Monaural Speech Enhancement[C]//ICASSP 2022-2022 IEEE International C 阅读全文
posted @ 2022-08-04 11:29 凌逆战 阅读(1311) 评论(4) 推荐(3) 编辑
摘要: 语音信号有四个重要的参数:声道数、采样频率、量化位数(位深)和比特率。 声道数:可以是单声道、双声道 ... 采样率(Sample rate):声音是模拟信号,物理信号转化为数字信号的过程我们称之为采样,采样率则表示 每秒对声音信号(模拟信号)抽取的总采样点数,44100Hz采样频率意味着每秒钟信号 阅读全文
posted @ 2022-06-19 17:10 凌逆战 阅读(2404) 评论(0) 推荐(1) 编辑
摘要: 我自愿将博客园的文章搬移至CSDN 我还是第一时间将博客发布在 博客园,只不过是使用CSDN帮我引流而已 阅读全文
posted @ 2022-06-06 11:09 凌逆战 阅读(465) 评论(0) 推荐(1) 编辑
摘要: 本文地址:https://www.cnblogs.com/LXP-Never/p/16011229.html (引用请注明出处) 本文代码:https://github.com/LXP-Never/perception_scale 作者: 凌逆战 | Never.Ling 梅尔刻度 梅尔刻度(Mel 阅读全文
posted @ 2022-05-28 19:42 凌逆战 阅读(6095) 评论(2) 推荐(7) 编辑
摘要: 国内 【深蓝学院】语音信号处理——宋辉,李先刚 【深蓝学院】语音识别综述 【深蓝学院】语音识别:从入门到精通——谢磊、孙思宁、张彬彬、吕航、许开拓 【深蓝学院】语音合成算法:从HTS到端到端 【深蓝学院】语音合成:基础与前沿——谢磊、陈云琳、阳珊、张雨超 【深蓝学院】语音算法:前沿与应用——李先刚、 阅读全文
posted @ 2022-05-10 17:38 凌逆战 阅读(3413) 评论(26) 推荐(6) 编辑
摘要: 论文地址:TinyLSTMs:助听器的高效神经语音增强 音频地址:https://github.com/Bose/efficient-neural-speech-enhancement 引用格式:Fedorov I,Stamenovic M,Jensen C,et al. TinyLSTMs:Eff 阅读全文
posted @ 2022-04-18 12:00 凌逆战 阅读(826) 评论(0) 推荐(0) 编辑
摘要: 论文地址:在长短时记忆中学习内在的稀疏结构 论文代码:https://github.com/wenwei202/iss-rnns 引用格式:Wen W, He Y, Rajbhandari S, et al. Learning intrinsic sparse structures within l 阅读全文
posted @ 2022-04-11 22:02 凌逆战 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 论文地址:深度噪声抑制模型的性能优化 引用格式:Chee J, Braun S, Gopal V, et al. Performance optimizations on deep noise suppression models[J]. arXiv preprint arXiv:2110.0437 阅读全文
posted @ 2022-04-09 23:11 凌逆战 阅读(1098) 评论(0) 推荐(1) 编辑
摘要: 论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model compression for deep learning based speech enhancem 阅读全文
posted @ 2022-04-08 10:58 凌逆战 阅读(958) 评论(0) 推荐(0) 编辑
摘要: 论文地址:高效个性化的助听器处理声音 引用格式:Nielsen J B, Nielsen J. Efficient individualization of hearing aid processed sound[C]//2013 IEEE International Conference on A 阅读全文
posted @ 2022-03-10 18:55 凌逆战 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 论文地址:DCCRN:用于相位感知语音增强的深度复杂卷积循环网络 论文代码:https://paperswithcode.com/paper/dccrn-deep-complex-convolution-recurrent-1 引用:Hu Y,Liu Y,Lv S,et al. DCCRN: Dee 阅读全文
posted @ 2022-03-09 15:23 凌逆战 阅读(2183) 评论(5) 推荐(6) 编辑
摘要: 论文地址:双路信号变换LSTM网络的实时噪声抑制 论文代码:https://github.com/breizhn/DTLN 引用格式:Westhausen N L, Meyer B T. Dual-signal transformation LSTM network for real-time no 阅读全文
posted @ 2022-03-07 11:12 凌逆战 阅读(1887) 评论(4) 推荐(1) 编辑
摘要: 前言 至于为什么写这个教程,首先是为了自己学习做个记录,其次是因为Tensorflow的API写的很好,但是他的教程写的太乱了,不适合新手学习。tensorflow 1 和tensorflow 2 有相似之处但是不兼容,tensorflow 2将keras融合了。TensorFlow™ 是一个采用 阅读全文
posted @ 2022-03-01 16:40 凌逆战 阅读(2629) 评论(2) 推荐(10) 编辑
摘要: 论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Zhu W P,et al. PACDNN: A phase-aware composite deep 阅读全文
posted @ 2022-02-15 15:39 凌逆战 阅读(1392) 评论(0) 推荐(3) 编辑