中文分词--HMM用于切词

原理介绍,cppjieba作者对于HMM的介绍和分词中的应用:

http://yanyiwu.com/work/2014/04/07/hmm-segment-xiangjie.html

 

读后感:

1.基于统计模型

2.利用HMM模型公式简化,简化到可以根据大规模语料进行增强

3.3个矩阵

一个是初始矩阵,即第一个字分别是B、E、M、S的概率

一个是转移概率矩阵,即前一个状态A转移到当前状态B的概率

一个是发射概率矩阵,即字A分别在B、E、M、S状态出现的概率

4.计算优化

计算权重使用log函数分别计算之后相加,效果等于

log函数里面的概率相乘

5.文中3重for循环,理解如下

 

posted @ 2017-06-26 17:16  dodng  阅读(439)  评论(0)    收藏  举报