中文分词--HMM用于切词
原理介绍,cppjieba作者对于HMM的介绍和分词中的应用:
http://yanyiwu.com/work/2014/04/07/hmm-segment-xiangjie.html
读后感:
1.基于统计模型
2.利用HMM模型公式简化,简化到可以根据大规模语料进行增强
3.3个矩阵
一个是初始矩阵,即第一个字分别是B、E、M、S的概率
一个是转移概率矩阵,即前一个状态A转移到当前状态B的概率
一个是发射概率矩阵,即字A分别在B、E、M、S状态出现的概率
4.计算优化
计算权重使用log函数分别计算之后相加,效果等于
log函数里面的概率相乘
5.文中3重for循环,理解如下


浙公网安备 33010602011771号