摘要:
【官网】http://www.webrtc.org/reference/getting-started【步骤】参照官网的步骤,要下载和编译源码,需要安装两个工具 depot_tools 和 git1. 安装githttp://www.cnblogs.com/ccdev/archive/2012/09/12/2682098.html2.安装depot_toolsa 启动终端,当前路径为:/Users/xxx :b git 命令获取depot_tools:git clone https://chromium.googlesource.com/chromium/tools/depot_tools.g
阅读全文
posted @ 2014-03-21 20:24
tkppain
阅读(575)
推荐(0)
摘要:
变调的方法也可以分为三类:时域法、频域法、参量法。时域法中,Crochiere等人于1983年提出了重采样的方法[42],该方法是实现变速变调最简单、最常用的方法之一。假设重采样因子为P/Q,其中,P为上采样因子,Q为下采样因子。上采样过程就是往原始信号相邻两点间内插P-1个采样点,这样使得基音周期变为原来的P倍,频谱压缩为原来的1/P倍,时长变为原来的P倍,即基频变为原来的1/P倍,音调降为原来的1/P倍,语速变为原来的1/P倍。同样地,下采样过程就是每隔Q-1个点进行抽取,这样会使得基音周期长度为原来的1/Q倍,频谱扩展为原来的Q倍,时长变为原来的1/Q倍,即基频变为原来的Q倍,音调升为原
阅读全文
posted @ 2013-10-22 15:34
tkppain
阅读(1137)
推荐(0)
摘要:
自然语音的产生可以简化为图2-1模型,激励源出来的声门波信号与声道模型进行卷积,最后通过嘴唇辐射模型产生语音。其中,激励源决定说话人的基频的大小,即音调的高低。声道模型反映“润色”的频谱信息,具体的讲,共振峰决定了语义信息,谐波分布决定了音色,单位时间的音节数决定了语速。图2-1 语音产生模型下面将根据语音产生模型来阐述变速变调的基本原理。变速变调的改变可以包括变速不变调和变调不变速两个部分。语音变速不变调是指保持音调和语义保持不变,语速变快或变慢[28]。该过程表现为语谱图在时间轴上如手风琴般压缩或者扩展。那也就是说,基频值几乎不变,对应于音调不变;整个时间过程被压缩或者扩展,声门周期的数目
阅读全文
posted @ 2013-10-22 15:33
tkppain
阅读(902)
推荐(0)
摘要:
语音变速不变调,即语音时长规整,是指不改变原说话人的音调及语义信息,只改变说话人的语速。语音变速不变调算法有三大类:时域法、频域法、参量法,如表2-1所示。表2-1 变速不变调算法分类时域法频域法参量法剪贴法LSEE-MSTFTM相位声码器SOLA、SOLA-FS正弦模型TD-PSOLA时域法包括:...
阅读全文
posted @ 2013-10-22 15:32
tkppain
阅读(2816)
推荐(1)
摘要:
归一化频率与实际频率是如何对应的?有没有通用的公式,在滤波器设计中经常看到归一化是对采样频率来说的,f'=f/fs,因此f'就落在[-pi,pi],对于数字频率而言,就是[-0.5,0.5]。归一化的目的:模拟信号 y(t)=cos(2*pi*f*t)采样后数字信号 x(n)=y(n/fs)=cos(2*pi*f*n/fs)因为 cos(n+2n*pi)=cos(n),所以假设 f/fs=m+delta ,其中m为整数,delta为-0.5至0.5之间的数。那么 x(n)=cos(2*pi*n*(m+delta))=cos(2*pi*delta*n).因此可以说频率 f/fs
阅读全文
posted @ 2013-06-20 14:24
tkppain
阅读(3548)
推荐(0)
摘要:
最近把一些在网上见到的自然语言处理的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。转载请标明出处(http://blog.csdn.net/xuh5156/article/details/7437475)论文、博客1.Google在研究博客中总结了他们2011年的精彩论文《Excellent Papers for 2011》,包括社会网络、机器学习、人机交互、信息检索、自然语言处理、多媒体、系统等各个领域,很精彩的论文集锦。http://googleres
阅读全文
posted @ 2013-06-07 18:31
tkppain
阅读(275)
推荐(0)
摘要:
1.研学论坛——语音板块http://bbs.matwav.com/forumdisplay.php?fid=1932.苏统华http://hi.baidu.com/sutonghua3.matlab中文论坛http://www.ilovematlab.cn/index.php?sid=5s2DwH4.语音QQ群5.领域内的人6.DSP与音频技术论坛http://www.91dsp.com/index.php7.奋进(嵌入式,dsp)http://www.cnblogs.com/huaping-audio/archive/2010/06/05/1752147.html8.王贵平(嵌入式,dsp
阅读全文
posted @ 2013-06-07 18:30
tkppain
阅读(544)
推荐(1)
摘要:
1)视频会议系统的服务器一般都有视频转码/编码的功能。这是为了混速组网,因为不同的客户端可能有不同的速率。比如骨干网是2M,下面是768k,需要入同一个会议,需要将2M的重新转码成768k的2)嵌入式的,专网用户,转码的容量都不大,能支持一两百路的转码就不错了3)在专业视频会议里,转码叫适配,包括,速率适配,协议适配,分辨率适配等4)在传统视频会议里为了考虑跟老设备兼容,而且很多设备速率是恒定的,所以服务器一般都是做全解全编,运算量很大。可以借鉴SVC,让服务器不做转码。
阅读全文
posted @ 2013-06-07 10:52
tkppain
阅读(180)
推荐(0)
摘要:
一、特点声卡作为语音信号与计算机的接口卡件,其最基本的一项功能就是A/D转换。实际,除了语音外,很多信号的频率都落在音频范围内(比如机械量信号,过程量信号等,当我们需要对这些信号进行采集时,使用声卡作为采集卡是一种相当令人满意的解决方 案,其理由如下:1. 价格便宜。一般声卡的价格才一百多元,比起自己从头到尾开发一块采集卡的成本 低 得多。比起目前市场上的采集卡的价格,更是不可同日而语。相应地,产品成本也会降低。2. 即买即用。完全省略了A/D卡的的硬件开发过程,很大程度上缩短了产品的开发周期3. 灵活性好。量化位数可编程(8位或16位);采样频率可编程(一般声卡的最高采样频率可达200KHz
阅读全文
posted @ 2013-06-07 10:50
tkppain
阅读(935)
推荐(0)
摘要:
http://white313.blog.163.com/blog/static/2102620116314827580/在某篇对google敬仰的日志中,已经提到过WebRTC,具体介绍不不说了,网上一大摞,今天讲讲怎么编译WebRTC。在项目源码中,并没有直接提供解决方案(sln)和工程文件,是因为WebRTC和Chromium一样,使用了depot_tools这个工具用来自动生成项目文件。Google也能搜索出一堆的编译方案,但基本上就是对https://sites.google.com/site/webrtc/reference/getting-started的翻译。其实还应该有几个前
阅读全文
posted @ 2013-06-07 10:49
tkppain
阅读(2555)
推荐(0)