凌逆战 - 博客园

2024年5月6日

摘要：文章代码仓库：https://gitee.com/LXP-Never/window_fun 窗函数贯穿整个语音信号处理，语音信号是一个非平稳的时变信号，但“**短时间内可以认为语音信号是平稳时不变的，一般 10~30ms**。对连续的语音分帧做STFT处理，等价于截取一段时间信号，对其进行周期性延阅读全文

posted @ 2024-05-06 15:38 凌逆战阅读(822) 评论(0) 推荐(3) 编辑

2024年2月15日

如何快速了解一个行业

摘要：那么作为门外汉，如何快速了解一个行业。可以从四个层面系统性地去了解 1、行业了解的目的一般来说，从企业角度出发做行业分析的目的通常有三个：了解所属行业的发展现状、竞争优劣、行业前景等，现在这个行业里竞争环境如何。挖掘行业机会点，明确优势，看清劣势，寻找与领先企业的差距，改善资源配置，扬长避短。阅读全文

posted @ 2024-02-15 12:26 凌逆战阅读(2274) 评论(5) 推荐(24) 编辑

2023年12月6日

论文阅读：2023_Semantic Hearing: Programming Acoustic Scenes with Binaural Hearables

摘要：论文地址：语义听觉:用双耳可听器编程声学场景论文代码：https://semantichearing.cs.washington.edu/ 引用格式：Veluri B, Itani M, Chan J, et al. Semantic Hearing: Programming Acoustic S 阅读全文

posted @ 2023-12-06 11:19 凌逆战阅读(545) 评论(0) 推荐(0) 编辑

2023年12月4日

Linux后台跑程序的方法总结

摘要：当使用ssh进行远程代码运行时，控制端电脑通常不能出现任何意外。然而，运行深度学习程序通常需要数小时或数天的时间，这意味着我们的IDE不能关闭。一旦出现非人为因素（如断电、断网或IDE卡死关闭），远程程序也会中断。因此，将程序灵活地运行在服务器上，不受控制端因素的影响至关重要。使用 & 将命令放到阅读全文

posted @ 2023-12-04 17:06 凌逆战阅读(492) 评论(0) 推荐(0) 编辑

2023年10月6日

EQ 均衡器

摘要：本文代码：https://gitee.com/LXP-Never/py-equalizer EQ 的全称是 Equalizer，EQ 是 Equalizer 的前两个字母，中文名字叫做“均衡器”。最早是用来提升电话信号在长距离的传输中损失的高频，由此得到一个各频带相对平衡的结果，它让各个频带的声音得阅读全文

posted @ 2023-10-06 23:09 凌逆战阅读(2086) 评论(0) 推荐(2) 编辑

2023年6月26日

论文翻译：2021_Real-Time Denoising and Dereverberation wtih Tiny Recurrent U-Net

摘要：论文地址：微型循环U-Net实时降噪和去混响论文代码： https://github.com/YangangCao/TRUNet https://github.com/Okrio/tinyrecurrentunet 引用格式：Choi H S, Park S, Lee J H, et al. Re 阅读全文

posted @ 2023-06-26 15:27 凌逆战阅读(1207) 评论(0) 推荐(0) 编辑

2023年3月24日

如何跟踪语音领域的论文

摘要：语音顶会 ICASSP 所有年份论文集下载地址：https://ieeexplore.ieee.org/xpl/conhome/1000002/all-proceedings Interspeech 所有年份论文集下载地址：https://www.isca-speech.org/archive/ 期阅读全文

posted @ 2023-03-24 14:25 凌逆战阅读(1967) 评论(0) 推荐(5) 编辑

2023年3月21日

论文翻译：2023_THLNet: two-stage heterogeneous lightweight network for monaural speech enhancement

摘要：论文地址：THLNet: 用于单耳语音增强的两级异构轻量级网络代码：https://github.com/dangf15/THLNet 引用格式：Dang F, Hu Q, Zhang P. THLNet: two-stage heterogeneous lightweight network f 阅读全文

posted @ 2023-03-21 14:18 凌逆战阅读(1684) 评论(2) 推荐(5) 编辑

2023年2月8日

论文翻译：2022_Phase-Aware Deep Speech Enhancement: It's All About The Frame Length

摘要：论文地址：相位感知深度语音增强:这完全取决于帧长论文代码：https://github.com/CarmiShimon/Phase-Aware-Deep-Speech-Enhancement 引用格式：Peer T, Gerkmann T. Phase-aware deep speech enha 阅读全文

posted @ 2023-02-08 20:05 凌逆战阅读(1270) 评论(7) 推荐(3) 编辑

2023年2月7日

论文翻译：2022_Time-Shift Modeling-Based Hear-Through System for In-Ear Headphones

摘要：论文地址：基于时移建模的入耳式耳机透听系统引用格式：摘要透传(hear-through，HT)技术是通过增强耳机佩戴者对环境声音的感知来主动补偿被动隔离的。耳机中的材料会减少声音 500Hz以上的高频成分。HT算法利用麦克风和用户耳朵之间的相对传递函数(RTF)产生人造声音，从而弥补环境声音的阅读全文

posted @ 2023-02-07 08:54 凌逆战阅读(333) 评论(0) 推荐(0) 编辑

2023年2月6日

论文翻译：2020：ECAPA-TDNN: Emphasized Channel Attention, Propagation and Aggregation in TDNN Based Speaker Verification

摘要：论文地址：ECAPA-TDNN：在基于TDNN的说话人验证中强调通道注意、传播和聚集论文代码：https://github.com/TaoRuijie/ECAPA-TDNN 引用格式：Desplanques B, Thienpondt J, Demuynck K. Ecapa-tdnn: Emph 阅读全文

posted @ 2023-02-06 10:20 凌逆战阅读(869) 评论(0) 推荐(2) 编辑

2023年2月5日

论文翻译：2022_PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement

摘要：博客地址：凌逆战 (转载请注明出处) 论文地址：PercepNet+: 用于实时语音增强的相位和信噪比感知 PercepNet 引用格式： Ge X, Han J, Long Y, et al. PercepNet+: A Phase and SNR Aware PercepNet for Real 阅读全文

posted @ 2023-02-05 17:03 凌逆战阅读(1319) 评论(0) 推荐(1) 编辑

2023年2月3日

论文翻译：2022_腾讯DNS 1th TEA-PSE: Tencent-ethereal-audio-lab personalized speech enhancement system for ICASSP 2022 DNS CHALLENGE

摘要：论文地址：TEA-PSE: 用于ICASSP 2022 DNS挑战赛的Tencent-ethereal-audio-lab 个性化语音增强系统论文代码：引用格式：Ju Y, Rao W, Yan X, et al. TEA-PSE: Tencent-ethereal-audio-lab pers 阅读全文

posted @ 2023-02-03 16:06 凌逆战阅读(1273) 评论(0) 推荐(2) 编辑

2023年2月2日

论文翻译：2022_TEA-PSE 2.0：Sub-Band Network For Real-Time Personalized Speech Enhancement

摘要：论文地址：TEA-PSE 2.0：用于实时个性化语音增强的子带网络引用：Ju Y, Zhang S, Rao W, et al. Tea-pse 2.0: Sub-band network for real-time personalized speech enhancement[C]//2022 阅读全文

posted @ 2023-02-02 10:47 凌逆战阅读(702) 评论(0) 推荐(2) 编辑

2023年1月11日

动态范围控制(Dynamic Range Control，DRC)原理

摘要： DRC介绍动态范围就是信号的最大幅值和最小幅值比值的对数(单位dB)，动态范围会受到系统中各个环节的影响。例如同样是这段音乐，在一个40dB背景噪声的环境中播放，那么由于掩蔽效应等因素的影响，最终实际听到的音乐动态范围实际上是50dB。如果对响度和动态范围感兴趣的可以移步看鬼斧神工的文章《详解音频阅读全文

posted @ 2023-01-11 18:45 凌逆战阅读(4197) 评论(1) 推荐(4) 编辑

2022年12月9日

论文翻译：2022_DNS_1th：Multi-scale temporal frequency convolutional network with axial attention for speech enhancement

摘要：论文地址：带轴向注意的多尺度时域频率卷积网络语音增强论文代码：https://github.com/echocatzh/MTFAA-Net 引用：Zhang G, Yu L, Wang C, et al. Multi-scale temporal frequency convolutional n 阅读全文

posted @ 2022-12-09 09:41 凌逆战阅读(1724) 评论(0) 推荐(1) 编辑

2022年11月16日

论文翻译：2022_DeepFilterNet2: Towards Real-Time Speech Enhancement On Embedded Devices For Fullband Audio

摘要：博客地址：凌逆战论文地址：DeepFilternet2: 面向嵌入式设备的全波段音频实时语音增强论文代码：https://github.com/Rikorose/DeepFilterNet 引用格式：Schröter H, Rosenkranz T, Maier A. DeepFilterNet 阅读全文

posted @ 2022-11-16 11:59 凌逆战阅读(2300) 评论(2) 推荐(1) 编辑

2022年10月25日

Pytorch模型量化

摘要：在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点：更少的模型体积，接近4倍的减少；可以更快的计算，由于更少的内存访问和更快的int8计算，可以快2~4倍。一个量化后的模型，其部分或者全部的阅读全文

posted @ 2022-10-25 20:41 凌逆战阅读(7027) 评论(2) 推荐(2) 编辑

2022年10月24日

Tensorflow Lite从入门到精通

摘要： TensorFlow Lite 是 TensorFlow 在移动和 IoT 等边缘设备端的解决方案，提供了 Java、Python 和 C++ API 库，可以运行在 Android、iOS 和 Raspberry Pi 等设备上。目前 TFLite 只提供了推理功能，在服务器端进行训练后，经过如下阅读全文

posted @ 2022-10-24 12:13 凌逆战阅读(2957) 评论(1) 推荐(5) 编辑

2022年10月7日

语音和噪声相关数据集(持续更新)

摘要：博客地址：https://www.cnblogs.com/LXP-Never/p/15474948.html（转载请注明出处）博客作者：凌逆战语音数据集 TIMIT 官方提供的下载地址：https://catalog.ldc.upenn.edu/LDC93S1 免费下载地址：https://go 阅读全文

posted @ 2022-10-07 18:11 凌逆战阅读(16549) 评论(2) 推荐(18) 编辑

2022年9月18日

《古诗词里的快意人生》读后感

摘要：《古诗词里的快意人生》通过讲解诗人的一生让我了解每一首诗的来源背景。一生都在追求极致潇洒的天才诗人李白；一生遭遇很不幸，却心怀天下做狂歌的杜甫。为了功名来到边塞，从悔恨到渐渐爱上边塞的岑参。追求“不平则鸣”的韩愈；“世界以痛吻我，却报之以歌”的柳宗元；魅力四射的温庭筠，他写出了：玲珑骰子安红豆，入骨阅读全文

posted @ 2022-09-18 19:45 凌逆战阅读(536) 评论(0) 推荐(1) 编辑

《生死疲劳》读书有感

摘要：先上人物关系图读后感故事的开头是主人公西门闹因为地主身份被当做典型枪毙了，西门闹经过7次转世（驴，牛，猪，狗，猴，大头儿）亲眼见证了后世之事。转世为驴，见证了自己的妻妾们改嫁与生儿，身处合作社的时代，跟着蓝脸坚持单干，但随之而来的大饥馑，人民饥不裹腹，驴被饿昏的人民手撕充饥。转世为牛，除了蓝阅读全文

posted @ 2022-09-18 16:00 凌逆战阅读(393) 评论(2) 推荐(1) 编辑

2022年9月8日

神经网络模型的参数量和计算量

摘要：其实模型的参数量好算，但浮点运算数并不好确定，我们一般也就根据参数量直接估计计算量了。但是像卷积之类的运算，它的参数量比较小，但是运算量非常大，它是一种计算密集型的操作。反观全连接结构，它的参数量非常多，但运算量并没有显得那么大。 FLOPs(Floating-point Operations)：浮阅读全文

posted @ 2022-09-08 14:02 凌逆战阅读(3697) 评论(0) 推荐(1) 编辑

2022年8月26日

论文翻译：2021_A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Based on Recurrent Neural Network

摘要：论文地址：一种新的基于循环神经网络的远场语音通信实时噪声抑制算法引用格式：Chen B, Zhou Y, Ma Y, et al. A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Base 阅读全文

posted @ 2022-08-26 17:38 凌逆战阅读(1610) 评论(0) 推荐(2) 编辑

2022年8月16日

论文翻译：2020_Lightweight Online Noise Reduction on Embedded Devices using Hierarchical Recurrent Neural Networks

摘要：论文地址：基于分层递归神经网络的嵌入式设备轻量化在线降噪引用格式：Schröter H, Rosenkranz T, Zobel P, et al. Lightweight Online Noise Reduction on Embedded Devices using Hierarchical 阅读全文

posted @ 2022-08-16 21:41 凌逆战阅读(866) 评论(0) 推荐(0) 编辑

2022年8月7日

论文翻译：2021_LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement

摘要：论文地址：延迟约束的语音增强基音估计引用格式：Schröter H, Rosenkranz T, Escalante-B A N, et al. LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement[C]//Inte 阅读全文

posted @ 2022-08-07 21:37 凌逆战阅读(595) 评论(0) 推荐(3) 编辑

2022年8月4日

论文翻译：2022_Time-Frequency Attention for Monaural Speech Enhancement

摘要：论文地址：单耳语音增强的时频注意引用格式：Zhang Q, Song Q, Ni Z, et al. Time-Frequency Attention for Monaural Speech Enhancement[C]//ICASSP 2022-2022 IEEE International C 阅读全文

posted @ 2022-08-04 11:29 凌逆战阅读(1331) 评论(4) 推荐(3) 编辑

2022年6月19日

音频编码格式及WAVE格式详解

摘要：语音信号有四个重要的参数：声道数、采样频率、量化位数(位深)和比特率。声道数：可以是单声道、双声道 ... 采样率（Sample rate）：声音是模拟信号，物理信号转化为数字信号的过程我们称之为采样，采样率则表示每秒对声音信号(模拟信号)抽取的总采样点数，44100Hz采样频率意味着每秒钟信号阅读全文

posted @ 2022-06-19 17:10 凌逆战阅读(2585) 评论(0) 推荐(1) 编辑

2022年6月6日

将博客搬至CSDN

摘要：我自愿将博客园的文章搬移至CSDN 我还是第一时间将博客发布在博客园，只不过是使用CSDN帮我引流而已阅读全文

posted @ 2022-06-06 11:09 凌逆战阅读(470) 评论(0) 推荐(1) 编辑

2022年5月28日

声学感知刻度(mel scale、Bark scale、ERB)与声学特征提取(MFCC、BFCC、GFCC)

摘要：本文地址：https://www.cnblogs.com/LXP-Never/p/16011229.html (引用请注明出处) 本文代码：https://github.com/LXP-Never/perception_scale 作者：凌逆战 | Never.Ling 梅尔刻度梅尔刻度（Mel 阅读全文

posted @ 2022-05-28 19:42 凌逆战阅读(6394) 评论(2) 推荐(7) 编辑

2022年5月10日

语音领域视频及书籍(不定期更新)

摘要：国内【深蓝学院】语音信号处理——宋辉，李先刚【深蓝学院】语音识别综述【深蓝学院】语音识别：从入门到精通——谢磊、孙思宁、张彬彬、吕航、许开拓【深蓝学院】语音合成算法：从HTS到端到端【深蓝学院】语音合成：基础与前沿——谢磊、陈云琳、阳珊、张雨超【深蓝学院】语音算法：前沿与应用——李先刚、阅读全文

posted @ 2022-05-10 17:38 凌逆战阅读(3518) 评论(26) 推荐(6) 编辑

2022年4月18日

论文翻译：2020_TinyLSTMs: Efficient Neural Speech Enhancement for Hearing Aids

摘要：论文地址：TinyLSTMs：助听器的高效神经语音增强音频地址：https://github.com/Bose/efficient-neural-speech-enhancement 引用格式：Fedorov I，Stamenovic M，Jensen C，et al. TinyLSTMs：Eff 阅读全文

posted @ 2022-04-18 12:00 凌逆战阅读(838) 评论(0) 推荐(0) 编辑

2022年4月11日

论文翻译：2018_LSTM剪枝_Learning intrinsic sparse structures within long short-term memory

摘要：论文地址：在长短时记忆中学习内在的稀疏结构论文代码：https://github.com/wenwei202/iss-rnns 引用格式：Wen W, He Y, Rajbhandari S, et al. Learning intrinsic sparse structures within l 阅读全文

posted @ 2022-04-11 22:02 凌逆战阅读(760) 评论(0) 推荐(0) 编辑

2022年4月9日

论文翻译：2021_语音增强模型压缩_Performance optimizations on deep noise suppression models

摘要：论文地址：深度噪声抑制模型的性能优化引用格式：Chee J, Braun S, Gopal V, et al. Performance optimizations on deep noise suppression models[J]. arXiv preprint arXiv:2110.0437 阅读全文

posted @ 2022-04-09 23:11 凌逆战阅读(1128) 评论(0) 推荐(1) 编辑

2022年4月8日

论文翻译：2021_语音增强模型压缩_Towards model compression for deep learning based speech enhancement

摘要：论文地址：面向基于深度学习的语音增强模型压缩论文代码：没开源，鼓励大家去向作者要呀，作者是中国人，在语音增强领域深耕多年引用格式：Tan K, Wang D L. Towards model compression for deep learning based speech enhancem 阅读全文

posted @ 2022-04-08 10:58 凌逆战阅读(980) 评论(0) 推荐(0) 编辑

2022年3月10日

论文翻译：2013_Efficient individualization of hearing aid processed sound

摘要：论文地址：高效个性化的助听器处理声音引用格式：Nielsen J B, Nielsen J. Efficient individualization of hearing aid processed sound[C]//2013 IEEE International Conference on A 阅读全文

posted @ 2022-03-10 18:55 凌逆战阅读(162) 评论(0) 推荐(0) 编辑

2022年3月9日

论文翻译：2020_DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement

摘要：论文地址：DCCRN：用于相位感知语音增强的深度复杂卷积循环网络论文代码：https://paperswithcode.com/paper/dccrn-deep-complex-convolution-recurrent-1 引用：Hu Y，Liu Y，Lv S，et al. DCCRN: Dee 阅读全文

posted @ 2022-03-09 15:23 凌逆战阅读(2257) 评论(5) 推荐(6) 编辑

2022年3月7日

论文翻译：2020_DTLN：Dual-Signal Transformation LSTM Network for Real-Time Noise Suppression

摘要：论文地址：双路信号变换LSTM网络的实时噪声抑制论文代码：https：//github.com/breizhn/DTLN 引用格式：Westhausen N L, Meyer B T. Dual-signal transformation LSTM network for real-time no 阅读全文

posted @ 2022-03-07 11:12 凌逆战阅读(1936) 评论(4) 推荐(1) 编辑

2022年3月1日

Tensorflow 2.x入门教程

摘要：前言至于为什么写这个教程，首先是为了自己学习做个记录，其次是因为Tensorflow的API写的很好，但是他的教程写的太乱了，不适合新手学习。tensorflow 1 和tensorflow 2 有相似之处但是不兼容，tensorflow 2将keras融合了。TensorFlow™ 是一个采用阅读全文

posted @ 2022-03-01 16:40 凌逆战阅读(2691) 评论(2) 推荐(10) 编辑

2022年2月15日

论文翻译：2022_PACDNN: A phase-aware composite deep neural network for speech enhancement

摘要：论文地址：PACDNN：一种用于语音增强的相位感知复合深度神经网络相似代码：https://github.com/phpstorm1/SE-FCN 引用格式：Hasannezhad M，Yu H，Zhu W P，et al. PACDNN： A phase-aware composite deep 阅读全文

posted @ 2022-02-15 15:39 凌逆战阅读(1455) 评论(0) 推荐(3) 编辑

公告