随笔分类 -  Audio Processing

A category for collecting knowledge about Audio Processing
摘要:MIREX作为国际最权威音频检索评测大赛,竟然在百度上找不到任何介绍,只有几个与什么搜狗、腾讯获得什么成绩相关的检索内容,相比而言,TRECVID的内容收到重视多了...由于研究生阶段主要研究音频领域,需要对整个领域有一个大致的了解,感觉还是从MIREX入手比较合适,所以借此机会也与大家分享一记。 阅读全文
posted @ 2016-03-29 00:11 CarlGoodman 阅读(2317) 评论(0) 推荐(0)
摘要:LPC即基于人发声机理的特征,在成人小孩识别、性别识别、说话人鉴别上有较好表现 具体步骤如下: Step 1. 激励函数e(n) Step 2. 使e(n)的平方最小 step 3. 将step 2中俩式子结合,有下列等式 step 4. 接下来的就是解方程组,经典解法有两种:一种是自相关法,一种是 阅读全文
posted @ 2016-03-16 14:20 CarlGoodman 阅读(3114) 评论(0) 推荐(0)
摘要:Harmonic change detection function (HCDF) 是根据 Tonal Centroid (TC)实现的,首先TC如何提取? Step 1. 提取PCP特征 Step 2. 根据协和度的概念,给出3*2向量的计算方法 阅读全文
posted @ 2016-03-16 13:52 CarlGoodman 阅读(428) 评论(0) 推荐(0)
摘要:1、下载Jar包后引入 现在的问题是jAudio通常是给人UI进行操作的,直接使用怎么办? 看了源码,发现特征提取是通过类之间交叉调用实现的,是否有办法整合一下? 阅读全文
posted @ 2016-03-16 13:45 CarlGoodman 阅读(822) 评论(0) 推荐(0)
摘要:合并多个文件,需要包含1、文件读取和写入功能,2、数组合并 阅读全文
posted @ 2016-03-15 23:08 CarlGoodman 阅读(849) 评论(0) 推荐(0)
摘要:直接读取wav文件是int数组,但是有一些实现返回的是double数组,还有些输入是double数组;那我们要互相调用的时候还是要看看两者到底有什么关系,其实很简单。 以单身道,16bit为例 对于更广泛的情况来说,floatScale并不是2^16 = 32768 阅读全文
posted @ 2016-03-15 23:05 CarlGoodman 阅读(901) 评论(0) 推荐(0)