摘要:
在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到 阅读全文
posted @ 2019-08-12 08:05
davidtym
阅读(2044)
评论(0)
推荐(0)

浙公网安备 33010602011771号