2019 年 8月 12 日随笔档案 - davidtym

2019年8月12日

摘要：在基于GMM-HMM的传统语音识别里，比音素（phone）更小的单位是状态（state）。一般每个音素由三个状态组成，特殊的是静音（SIL）由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态，而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示（这个GMM模型的参数是通过训练得到阅读全文

posted @ 2019-08-12 08:05 davidtym 阅读(1970) 评论(0) 推荐(0) 编辑

谈谈音频开发

公告