Fork me on GitHub
摘要: 在使用jieba分词时,发现分词准确度不高。特别是一些专业词汇,比如 ,只能分出 ,并不能分出 。这样导致的问题是很多时候检索并不准确。 经过对比测试,发现 "nlpir" 进行分词效果更好。但是nlpir的效率和各种支持又没有jieba那么好,因此采用了一种折中的方案。 就是先用nlpir生成字典 阅读全文
posted @ 2018-10-09 10:24 xinkun 阅读(2646) 评论(0) 推荐(0) 编辑