语音特征参数分析平台（一） General

刚刚开始工作，心烦气躁，想整理一下blog，删除了大把垃圾贴....

我的毕设题目是“基于HMM模型的语音特征参数分析”，主要过程是：
1）语音采集：使用录音软件采集语音，保存为wav文件，供进一步分析，我使用的是cool edit pro。
2）语音信号的预处理：包括对原始语音信号的分帧、加窗处理。
3）提取语音信号的时域特征参数：包括时域波形、短时平均过零率、短时平均振幅、短时平均能量。
4）端点检测：采用改进的滑动连续帧法实现对孤词语音的端点检测。
5）对语音信号进行短时FFT。
6）提取语音信号的频域特征参数：包括功率谱、对数功率谱和LPC倒谱。
7）取倒谱特征参数进行VQ（矢量量化）。
8）取矢量量化所得码本为参数构建孤立汉语数字0-9的HMM模型
9）HMM模型的构建、训练和识别系统的建设。

下载：见毕设也博客

在进行毕设的时候，我大量参考了万方的硕博论文，但是发现国内在语音处理方面的硕博论文出现了很多的抄袭现象，比起老美的博士论文必须要提出相关领域的新观点差的太多。最可恶的是，关于HMM模型的论文没有一篇能把HMM说明白，起码我是看了没明白，一直到拜读了 [Rabiner & Juang, 1986] and [Charniak, 1993]. 才明白HMM到底是怎么一回事！

本人水平有限，在HMM模型的构建上存在着明显的错误，所以在讲述HMM模型的部分，不值得大家参考。但是其他的部分是语音处理的一般过程，我都很好的实现了。

posted @ 2005-07-31 23:33 海南K.K 阅读(2330) 评论(2) 收藏举报

刷新页面返回顶部

语音特征参数分析平台（一） General

公告