摘要: "Ansj" 是由孙健(ansjsun)开源的一个中文分词器,为 "ICTLAS的Java版本" ,也采用了Bigram + HMM分词模型(可参考我之前写的 "文章" ):在Bigram分词的基础上,识别未登录词,以提高分词准确度。虽然基本分词原理与ICTLAS的一样,但是Ansj做了一些工程上的阅读全文
posted @ 2017-01-11 19:21 Treant 阅读(411) 评论(0) 编辑