心胸决定格局,眼界决定境界...

随笔分类 -  音频信号处理

摘要:http://www.doc88.com/p-6781563333826.html 立体声 虚拟环绕声 空间感 包围感 声像定位 应用 http://www.doc88.com/p-746875102309.html 声像展宽原理 混响 matlab滤波器设计 matlab录音及显示 阅读全文
posted @ 2016-11-23 16:35 WELEN 阅读(839) 评论(0) 推荐(0)
摘要:1.voice unvoice 归一化自相关函数 config.cutOffFreq = 900; [LowPass] = LowPassFilter(WaveIn, fs, config.cutOffFreq); cc = CenterClipping(x, 0.3); AutoCorr = xc 阅读全文
posted @ 2016-09-05 10:41 WELEN 阅读(326) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2016-07-12 16:44 WELEN 阅读(126) 评论(0) 推荐(0)
摘要:音量较小时,自适应放大。agc处理后:音量较大时,自适应放小。agc处理后: 阅读全文
posted @ 2015-11-25 23:41 WELEN 阅读(1009) 评论(0) 推荐(0)
摘要:https://en.wikipedia.org/wiki/Wiener_filterWiener filter solutionsThe Wiener filter problem has solutions for three possible cases: one where a noncau... 阅读全文
posted @ 2015-11-25 23:25 WELEN 阅读(1914) 评论(0) 推荐(0)
摘要:提取出频谱特征,然后使用gmm、svm、dnn模型进行训练和分类,实时话语检测。原始文件VAD处理,剔除静音后的效果: 阅读全文
posted @ 2015-11-25 23:18 WELEN 阅读(766) 评论(0) 推荐(0)
摘要:这段时间终于把手头的东西都搞完了,还剩下一个AEC这个模块,这个模块跟整个系统机制有很大关系,单独的模块意义不大。另外,刚写完一个分类器,希望能大幅提升音乐流派分类的准确率。下周正式开搞AEC,把之前做的一些事情记录一下。https://en.wikipedia.org/wiki/Dynamic_r... 阅读全文
posted @ 2015-11-25 23:07 WELEN 阅读(1287) 评论(0) 推荐(0)
摘要:soundtouch变速算法很类似sola算法,细看才知道是wsola算法。上个星期有个需求,将该变速应用到直播的包处理,有点类似于webrtc的netEQ处理机制。直接使用soundtouch,会存在一些问题:1.一段正常,一段变速,中间会出现不连续,有冲击。或者不同速率的切换。 越频繁,现象更明... 阅读全文
posted @ 2015-10-13 15:42 WELEN 阅读(3424) 评论(1) 推荐(0)
摘要:音频分析中,MFCC参数是经典参数之一。之前对于它的计算流程和原理,大体上是比较清楚的,所以仿真的时候,都是直接调用matlab的voicebox工具或者开发的时候直接调用第三方库。最近想整理一个纯C语言版本的MFCC函数,发现第三方开源的一部分是C++的,有些纯C的开源代码是针对语音固定了... 阅读全文
posted @ 2015-05-28 20:54 WELEN 阅读(7502) 评论(0) 推荐(0)
摘要:参考《A Highly Robust Audio Fingerprinting System》 Philips 音频指纹提取流程: 仿真效果: 第一个图为歌曲1的第一个指纹。 第二个图为歌曲1压缩为192kbps的第一个指纹。 第三个图为歌曲2的第一个指纹。 第四个图为,图1和图2的指纹差。 第五个 阅读全文
posted @ 2015-05-06 14:01 WELEN 阅读(2508) 评论(0) 推荐(0)
摘要:Time stretchingis the process of changing the speed or duration of anaudio signalwithout affecting itspitch.Pitch scalingorpitch shiftingis the opposi... 阅读全文
posted @ 2015-04-26 09:10 WELEN 阅读(754) 评论(0) 推荐(0)
摘要:A harmonic sound is said to have a missing fundamental, suppressed fundamental, orphantom fundamental when its overtones suggest a fundamental frequen 阅读全文
posted @ 2015-04-26 08:47 WELEN 阅读(1127) 评论(0) 推荐(0)
摘要:这里有篇论文《基于子带谱平滑度的音频篡改检测》,可供参考。这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。大部分假无损就是上采样为高质量的音频,然后用无损格式封装。11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。22050... 阅读全文
posted @ 2015-04-25 20:26 WELEN 阅读(940) 评论(0) 推荐(0)
摘要:根据对双门限的理解和修改,重写了一个离线版端点检测。function [st,en]=VAD(x, fs)x=double(x);x=x/max(abs(x));framelen= floor(fs*40/1000);%frameinc= floor(fs*10/1000);%y=enframe(... 阅读全文
posted @ 2015-04-17 20:54 WELEN 阅读(1468) 评论(1) 推荐(0)
摘要:部分文献的结果:印度古典乐的几种简单乐器的演奏,谱减法消去部分背景音初步处理,区分结果:前提已知-音乐的曲调,消去部分背景音,实验结果:针对各类复杂的流行音乐,自己实验的结果:1120首10折交叉验证的准确率是87.2%5000首10折交叉验证的准确率是86.40% 耗时 15个小时截取中间3分钟5... 阅读全文
posted @ 2015-02-28 16:47 WELEN 阅读(1316) 评论(0) 推荐(0)
摘要:未来还有进一步提升的空间,测试结果只能说明部分问题1.原始结果Correctly Classified Instances 762 76.2%Incorrectly Classified Instances 238 23.8% a b c d e f g h i j <-- cl... 阅读全文
posted @ 2015-02-28 16:12 WELEN 阅读(682) 评论(0) 推荐(0)
摘要:人声的平均识别率在89.31%,音乐的平均识别率在95.95%。相声和故事的结果较差,原因在于测试集中包含的相声现场录制环境较差,环境吵闹,频谱混乱;而讲故事有比较明显的音乐背景伴奏。表1 音乐和人声自动分类结果正确数目数目准确率电视节目59660.893939故事69880.784091评... 阅读全文
posted @ 2015-02-28 16:05 WELEN 阅读(2263) 评论(0) 推荐(0)
摘要:假设原始信号采样率为4000kHz,由200Hz为基波的一组幅度为1的谐波构成,此处由正弦函数模拟。由此得到200Hz,400Hz,600Hz...2000Hz,但是此处2000Hz的幅度几乎为0,后面详细说明。200Hz幅度为1的时域波形。 FFT变换之换,对应频率的幅度依然为1,频率依然在200... 阅读全文
posted @ 2015-01-19 11:25 WELEN 阅读(1469) 评论(0) 推荐(0)
摘要:待检测音频:http://pan.baidu.com/s/14J0uy时间,类型 阅读全文
posted @ 2014-10-13 11:30 WELEN 阅读(947) 评论(0) 推荐(0)
摘要:节拍点位置预测: 阅读全文
posted @ 2014-10-10 14:30 WELEN 阅读(845) 评论(0) 推荐(0)