摘要: 在 "前一篇" 中介绍了用HMM做中文分词,对于未登录词(out of vocabulary, OOV)有良好的识别效果,但是缺点也十分明显——对于词典中的(in vocabulary, IV)词却未能很好地识别。主要是因为,HMM本质上是一个Bigram的语法模型,未能深层次地考虑上下文(cont阅读全文
posted @ 2016-12-15 15:43 Treant 阅读(345) 评论(6) 编辑