音频信号处理 - 随笔分类(第2页) - WELEN

虚拟立体环绕声

摘要：http://www.doc88.com/p-6781563333826.html 立体声虚拟环绕声空间感包围感声像定位应用 http://www.doc88.com/p-746875102309.html 声像展宽原理混响 matlab滤波器设计 matlab录音及显示阅读全文

posted @ 2016-11-23 16:35 WELEN 阅读(840) 评论(0) 推荐(0)

浊音经验阈值和条件

摘要：1.voice unvoice 归一化自相关函数 config.cutOffFreq = 900; [LowPass] = LowPassFilter(WaveIn, fs, config.cutOffFreq); cc = CenterClipping(x, 0.3); AutoCorr = xc 阅读全文

posted @ 2016-09-05 10:41 WELEN 阅读(326) 评论(0) 推荐(0)

重叠相加法与重叠保存法的原理实现输入长信号的线性卷积

该文被密码保护。

posted @ 2016-07-12 16:44 WELEN 阅读(126) 评论(0) 推荐(0)

自动音量控制

摘要：音量较小时，自适应放大。agc处理后：音量较大时，自适应放小。agc处理后：阅读全文

posted @ 2015-11-25 23:41 WELEN 阅读(1011) 评论(0) 推荐(0)

基于winner 滤波平稳降噪效果

摘要：https://en.wikipedia.org/wiki/Wiener_filterWiener filter solutionsThe Wiener filter problem has solutions for three possible cases: one where a noncau... 阅读全文

posted @ 2015-11-25 23:25 WELEN 阅读(1917) 评论(0) 推荐(0)

基于分类的Vad效果

摘要：提取出频谱特征，然后使用gmm、svm、dnn模型进行训练和分类，实时话语检测。原始文件VAD处理，剔除静音后的效果：阅读全文

posted @ 2015-11-25 23:18 WELEN 阅读(766) 评论(0) 推荐(0)

Dynamic range compression

摘要：这段时间终于把手头的东西都搞完了，还剩下一个AEC这个模块，这个模块跟整个系统机制有很大关系，单独的模块意义不大。另外，刚写完一个分类器，希望能大幅提升音乐流派分类的准确率。下周正式开搞AEC，把之前做的一些事情记录一下。https://en.wikipedia.org/wiki/Dynamic_r... 阅读全文

posted @ 2015-11-25 23:07 WELEN 阅读(1289) 评论(0) 推荐(0)

soundtouch变速wsola算法之改进

摘要：soundtouch变速算法很类似sola算法，细看才知道是wsola算法。上个星期有个需求，将该变速应用到直播的包处理，有点类似于webrtc的netEQ处理机制。直接使用soundtouch，会存在一些问题：1.一段正常，一段变速，中间会出现不连续，有冲击。或者不同速率的切换。越频繁，现象更明... 阅读全文

posted @ 2015-10-13 15:42 WELEN 阅读(3431) 评论(1) 推荐(0)

MFCC特征提取(C语言版本)

摘要：音频分析中，MFCC参数是经典参数之一。之前对于它的计算流程和原理，大体上是比较清楚的，所以仿真的时候，都是直接调用matlab的voicebox工具或者开发的时候直接调用第三方库。最近想整理一个纯C语言版本的MFCC函数，发现第三方开源的一部分是C++的，有些纯C的开源代码是针对语音固定了... 阅读全文

posted @ 2015-05-28 20:54 WELEN 阅读(7510) 评论(0) 推荐(0)

音频指纹(Philips)

摘要：参考《A Highly Robust Audio Fingerprinting System》 Philips 音频指纹提取流程：仿真效果：第一个图为歌曲1的第一个指纹。第二个图为歌曲1压缩为192kbps的第一个指纹。第三个图为歌曲2的第一个指纹。第四个图为，图1和图2的指纹差。第五个阅读全文

posted @ 2015-05-06 14:01 WELEN 阅读(2516) 评论(0) 推荐(0)

可变速率的语音变调效果

摘要：Time stretchingis the process of changing the speed or duration of anaudio signalwithout affecting itspitch.Pitch scalingorpitch shiftingis the opposi... 阅读全文

posted @ 2015-04-26 09:10 WELEN 阅读(755) 评论(0) 推荐(0)

低音增强

摘要：A harmonic sound is said to have a missing fundamental, suppressed fundamental, orphantom fundamental when its overtones suggest a fundamental frequen 阅读全文

posted @ 2015-04-26 08:47 WELEN 阅读(1132) 评论(0) 推荐(0)

低质量音频伪装高质量音频的检测方法

摘要：这里有篇论文《基于子带谱平滑度的音频篡改检测》，可供参考。这里的质量主要涉及到采样率，即低采样率伪装高采样率音频。大部分假无损就是上采样为高质量的音频，然后用无损格式封装。11025Hz 伪装重采样 22050Hz音频，重采样不会补充有用信息，即11025/2 ~ 22050/2仍然平坦。22050... 阅读全文

posted @ 2015-04-25 20:26 WELEN 阅读(943) 评论(0) 推荐(0)

离线版-端点检测代码重写

摘要：根据对双门限的理解和修改，重写了一个离线版端点检测。function [st,en]=VAD(x, fs)x=double(x);x=x/max(abs(x));framelen= floor(fs*40/1000);%frameinc= floor(fs*10/1000);%y=enframe(... 阅读全文

posted @ 2015-04-17 20:54 WELEN 阅读(1468) 评论(1) 推荐(0)

检测带人声的音乐

摘要：部分文献的结果：印度古典乐的几种简单乐器的演奏，谱减法消去部分背景音初步处理，区分结果：前提已知-音乐的曲调，消去部分背景音,实验结果：针对各类复杂的流行音乐，自己实验的结果：1120首10折交叉验证的准确率是87.2%5000首10折交叉验证的准确率是86.40% 耗时 15个小时截取中间3分钟5... 阅读全文

posted @ 2015-02-28 16:47 WELEN 阅读(1316) 评论(0) 推荐(0)

音乐流派分类初步结果

摘要：未来还有进一步提升的空间，测试结果只能说明部分问题1.原始结果Correctly Classified Instances 762 76.2%Incorrectly Classified Instances 238 23.8% a b c d e f g h i j <-- cl... 阅读全文

posted @ 2015-02-28 16:12 WELEN 阅读(682) 评论(0) 推荐(0)

音乐和人声自动判别小结

摘要：人声的平均识别率在89.31%，音乐的平均识别率在95.95%。相声和故事的结果较差，原因在于测试集中包含的相声现场录制环境较差，环境吵闹，频谱混乱；而讲故事有比较明显的音乐背景伴奏。表1 音乐和人声自动分类结果正确数目数目准确率电视节目59660.893939故事69880.784091评... 阅读全文

posted @ 2015-02-28 16:05 WELEN 阅读(2263) 评论(0) 推荐(0)

梳状滤波器滤除谐波

摘要：假设原始信号采样率为4000kHz，由200Hz为基波的一组幅度为1的谐波构成，此处由正弦函数模拟。由此得到200Hz,400Hz,600Hz...2000Hz，但是此处2000Hz的幅度几乎为0，后面详细说明。200Hz幅度为1的时域波形。 FFT变换之换，对应频率的幅度依然为1，频率依然在200... 阅读全文

posted @ 2015-01-19 11:25 WELEN 阅读(1474) 评论(0) 推荐(0)

人声音乐声检测的小例子

摘要：待检测音频：http://pan.baidu.com/s/14J0uy时间，类型阅读全文

posted @ 2014-10-13 11:30 WELEN 阅读(947) 评论(0) 推荐(0)

音乐节拍提取二

摘要：节拍点位置预测：阅读全文

posted @ 2014-10-10 14:30 WELEN 阅读(846) 评论(0) 推荐(0)

WELEN

随笔分类 - 音频信号处理

公告