语音特征参数分析平台(一) General

刚刚开始工作,心烦气躁,想整理一下blog,删除了大把垃圾贴....

我的毕设题目是“基于HMM模型的语音特征参数分析”,主要过程是:
1)语音采集:使用录音软件采集语音,保存为wav文件,供进一步分析,我使用的是cool edit pro。
2)语音信号的预处理:包括对原始语音信号的分帧、加窗处理。
3)提取语音信号的时域特征参数:包括时域波形、短时平均过零率、短时平均振幅、短时平均能量。
4)端点检测:采用改进的滑动连续帧法实现对孤词语音的端点检测。
5)对语音信号进行短时FFT。
6)提取语音信号的频域特征参数:包括功率谱、对数功率谱和LPC倒谱。
7)取倒谱特征参数进行VQ(矢量量化)。
8)取矢量量化所得码本为参数构建孤立汉语数字0-9的HMM模型
9)HMM模型的构建、训练和识别系统的建设。

下载:见毕设也博客

在进行毕设的时候,我大量参考了万方的硕博论文,但是发现国内在语音处理方面的硕博论文出现了很多的抄袭现象,比起老美的博士论文必须要提出相关领域的新观点差的太多。最可恶的是,关于HMM模型的论文没有一篇能把HMM说明白,起码我是看了没明白,一直到拜读了 [Rabiner & Juang, 1986] and [Charniak, 1993]. 才明白HMM到底是怎么一回事!

本人水平有限,在HMM模型的构建上存在着明显的错误,所以在讲述HMM模型的部分,不值得大家参考。但是其他的部分是语音处理的一般过程,我都很好的实现了。

posted @ 2005-07-31 23:33  海南K.K  阅读(2330)  评论(2)    收藏  举报