心胸决定格局,眼界决定境界...

语音识别概述

后验概率最大,即为判别结果

HTK Hvite解码器   Sphinx解码器 TODE解码器,生硬,修改繁琐。

WFST 扩充,简单高效。

有限状态机模型被用于大词汇量连续中文语音识别系统中。

其操作思路是将传统语音识别系统中的数学模型,分别转换成有限状态机模型,再将转换后的模型进行有效地整合及优化,得到搜索空间。

 

有限状态自动机(Finite-state Automata,FSA)

 用点表示状态,带箭头的方向线段表示转移,转移上的字符为输入字元;用加粗圆圈表示初始状态,双线圆圈表示终止状态

节点 (Node) 即状态 (state

 由字元所构成的有限长度词序列成为字串

将两个字串连接在一起的操作称为连接运算例:𝑎 · 𝑏 = 𝑐 表示在字串 后面连接上字串 形成字串 c

 一个字串不包含任何字元,则称为空字串

 

加权有限状态转换器(WFST)是有限状态机的一种特殊形式

合并前

 

 

 合并后

 

 

 

            隐马尔可夫模型

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

         

 

 

 

 

 

 参考文献:基于WFST的中文语音识别解码器的研究

posted @ 2017-09-07 15:40  WELEN  阅读(2705)  评论(0编辑  收藏  举报