tkppain - 博客园

2014年3月21日

摘要：【官网】http://www.webrtc.org/reference/getting-started【步骤】参照官网的步骤，要下载和编译源码，需要安装两个工具 depot_tools 和 git1. 安装githttp://www.cnblogs.com/ccdev/archive/2012/09/12/2682098.html2.安装depot_toolsa 启动终端，当前路径为：/Users/xxx :b git 命令获取depot_tools：git clone https://chromium.googlesource.com/chromium/tools/depot_tools.g 阅读全文

posted @ 2014-03-21 20:24 tkppain 阅读(582) 评论(0) 推荐(0)

2013年10月22日

变调不变速方法

摘要：变调的方法也可以分为三类：时域法、频域法、参量法。时域法中，Crochiere等人于1983年提出了重采样的方法[42]，该方法是实现变速变调最简单、最常用的方法之一。假设重采样因子为P/Q，其中，P为上采样因子，Q为下采样因子。上采样过程就是往原始信号相邻两点间内插P-1个采样点，这样使得基音周期变为原来的P倍，频谱压缩为原来的1/P倍，时长变为原来的P倍，即基频变为原来的1/P倍，音调降为原来的1/P倍，语速变为原来的1/P倍。同样地，下采样过程就是每隔Q-1个点进行抽取，这样会使得基音周期长度为原来的1/Q倍，频谱扩展为原来的Q倍，时长变为原来的1/Q倍，即基频变为原来的Q倍，音调升为原阅读全文

posted @ 2013-10-22 15:34 tkppain 阅读(1157) 评论(1) 推荐(0)

变速与变调原理

摘要：自然语音的产生可以简化为图2-1模型，激励源出来的声门波信号与声道模型进行卷积，最后通过嘴唇辐射模型产生语音。其中，激励源决定说话人的基频的大小，即音调的高低。声道模型反映“润色”的频谱信息，具体的讲，共振峰决定了语义信息，谐波分布决定了音色，单位时间的音节数决定了语速。图2-1 语音产生模型下面将根据语音产生模型来阐述变速变调的基本原理。变速变调的改变可以包括变速不变调和变调不变速两个部分。语音变速不变调是指保持音调和语义保持不变，语速变快或变慢[28]。该过程表现为语谱图在时间轴上如手风琴般压缩或者扩展。那也就是说，基频值几乎不变，对应于音调不变；整个时间过程被压缩或者扩展，声门周期的数目阅读全文

posted @ 2013-10-22 15:33 tkppain 阅读(941) 评论(0) 推荐(0)

变速不变调方法

摘要：语音变速不变调，即语音时长规整，是指不改变原说话人的音调及语义信息，只改变说话人的语速。语音变速不变调算法有三大类：时域法、频域法、参量法，如表2-1所示。表2-1 变速不变调算法分类时域法频域法参量法剪贴法LSEE-MSTFTM相位声码器SOLA、SOLA-FS正弦模型TD-PSOLA时域法包括：... 阅读全文

posted @ 2013-10-22 15:32 tkppain 阅读(2881) 评论(0) 推荐(1)

2013年6月20日

归一化频率问题

摘要：归一化频率与实际频率是如何对应的？有没有通用的公式，在滤波器设计中经常看到归一化是对采样频率来说的，f'=f/fs,因此f'就落在[-pi,pi],对于数字频率而言，就是[-0.5,0.5]。归一化的目的：模拟信号 y(t)=cos(2*pi*f*t)采样后数字信号 x(n)=y(n/fs)=cos(2*pi*f*n/fs)因为 cos(n+2n*pi)=cos(n)，所以假设 f/fs=m+delta ，其中m为整数，delta为-0.5至0.5之间的数。那么 x(n)=cos(2*pi*n*(m+delta))=cos(2*pi*delta*n).因此可以说频率 f/fs 阅读全文

posted @ 2013-06-20 14:24 tkppain 阅读(3611) 评论(0) 推荐(0)

2013年6月7日

【转】自然语言处理（NLP）网上资源整理

摘要：最近把一些在网上见到的自然语言处理的资源整理了一下，包括论文列表、软件资源和一些实验室主页、个人主页等，希望能对NLP研究者有所帮助，由于个人视野有限，目前只整理了这些，以后会持续更新。在此也感谢这些资源的提供者和维护者。转载请标明出处（http://blog.csdn.net/xuh5156/article/details/7437475）论文、博客1.Google在研究博客中总结了他们2011年的精彩论文《Excellent Papers for 2011》，包括社会网络、机器学习、人机交互、信息检索、自然语言处理、多媒体、系统等各个领域，很精彩的论文集锦。http://googleres 阅读全文

posted @ 2013-06-07 18:31 tkppain 阅读(280) 评论(0) 推荐(0)

转语音处理资源

摘要： 1.研学论坛——语音板块http://bbs.matwav.com/forumdisplay.php?fid=1932.苏统华http://hi.baidu.com/sutonghua3.matlab中文论坛http://www.ilovematlab.cn/index.php?sid=5s2DwH4.语音QQ群5.领域内的人6.DSP与音频技术论坛http://www.91dsp.com/index.php7.奋进（嵌入式，dsp）http://www.cnblogs.com/huaping-audio/archive/2010/06/05/1752147.html8.王贵平(嵌入式，dsp 阅读全文

posted @ 2013-06-07 18:30 tkppain 阅读(555) 评论(1) 推荐(1)

视频会议1

摘要： 1）视频会议系统的服务器一般都有视频转码/编码的功能。这是为了混速组网，因为不同的客户端可能有不同的速率。比如骨干网是2M，下面是768k，需要入同一个会议，需要将2M的重新转码成768k的2）嵌入式的，专网用户，转码的容量都不大，能支持一两百路的转码就不错了3）在专业视频会议里,转码叫适配,包括,速率适配,协议适配,分辨率适配等4）在传统视频会议里为了考虑跟老设备兼容，而且很多设备速率是恒定的，所以服务器一般都是做全解全编，运算量很大。可以借鉴SVC，让服务器不做转码。阅读全文

posted @ 2013-06-07 10:52 tkppain 阅读(184) 评论(0) 推荐(0)

声卡编程讲解

摘要：一、特点声卡作为语音信号与计算机的接口卡件，其最基本的一项功能就是A/D转换。实际,除了语音外，很多信号的频率都落在音频范围内（比如机械量信号，过程量信号等，当我们需要对这些信号进行采集时，使用声卡作为采集卡是一种相当令人满意的解决方案，其理由如下：1．价格便宜。一般声卡的价格才一百多元，比起自己从头到尾开发一块采集卡的成本低得多。比起目前市场上的采集卡的价格，更是不可同日而语。相应地，产品成本也会降低。2．即买即用。完全省略了A/D卡的的硬件开发过程，很大程度上缩短了产品的开发周期3．灵活性好。量化位数可编程（8位或16位）；采样频率可编程（一般声卡的最高采样频率可达200KHz 阅读全文

posted @ 2013-06-07 10:50 tkppain 阅读(948) 评论(0) 推荐(0)

编译WebRTC

摘要： http://white313.blog.163.com/blog/static/2102620116314827580/在某篇对google敬仰的日志中，已经提到过WebRTC，具体介绍不不说了，网上一大摞，今天讲讲怎么编译WebRTC。在项目源码中，并没有直接提供解决方案(sln)和工程文件，是因为WebRTC和Chromium一样，使用了depot_tools这个工具用来自动生成项目文件。Google也能搜索出一堆的编译方案，但基本上就是对https://sites.google.com/site/webrtc/reference/getting-started的翻译。其实还应该有几个前阅读全文

posted @ 2013-06-07 10:49 tkppain 阅读(2582) 评论(2) 推荐(0)