语音特征参数分析平台(一) General
刚刚开始工作,心烦气躁,想整理一下blog,删除了大把垃圾贴....
我的毕设题目是“基于HMM模型的语音特征参数分析”,主要过程是:
1)语音采集:使用录音软件采集语音,保存为wav文件,供进一步分析,我使用的是cool edit pro。
2)语音信号的预处理:包括对原始语音信号的分帧、加窗处理。
3)提取语音信号的时域特征参数:包括时域波形、短时平均过零率、短时平均振幅、短时平均能量。
4)端点检测:采用改进的滑动连续帧法实现对孤词语音的端点检测。
5)对语音信号进行短时FFT。
6)提取语音信号的频域特征参数:包括功率谱、对数功率谱和LPC倒谱。
7)取倒谱特征参数进行VQ(矢量量化)。
8)取矢量量化所得码本为参数构建孤立汉语数字0-9的HMM模型
9)HMM模型的构建、训练和识别系统的建设。
下载:见毕设也博客
在进行毕设的时候,我大量参考了万方的硕博论文,但是发现国内在语音处理方面的硕博论文出现了很多的抄袭现象,比起老美的博士论文必须要提出相关领域的新观点差的太多。最可恶的是,关于HMM模型的论文没有一篇能把HMM说明白,起码我是看了没明白,一直到拜读了 [Rabiner & Juang, 1986] and [Charniak, 1993]. 才明白HMM到底是怎么一回事!
本人水平有限,在HMM模型的构建上存在着明显的错误,所以在讲述HMM模型的部分,不值得大家参考。但是其他的部分是语音处理的一般过程,我都很好的实现了。
All the posts in this blog are provided "AS IS" with no warranties, and confer no rights. Except where otherwise noted, content on this site is licensed under a Creative Commons Attribution 2.5 China Mainland License.
浙公网安备 33010602011771号