摘要: 在研究结巴分词的代码的时候 发现结巴分词 有好几个状态好像跟hmm算法有一点不一样 结巴分词中 汉字为观测状态 隐藏状态 有位置(b:开始;e:结束;m:中间;s:单词成词;) 还有词性标注集 不明白具体是有何原因??求高手解答 阅读全文
posted @ 2016-12-14 10:47 sonja-z 阅读(250) 评论(0) 推荐(0)