会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xinkun的博客
工程实践和技术研究的思考与笔记,包括容器、docker、kubernetes、大数据等相关技术领域。
博客园
首页
新随笔
联系
订阅
管理
2018年10月9日
使用pynlpir增强jieba分词的准确度
摘要: 在使用jieba分词时,发现分词准确度不高。特别是一些专业词汇,比如 ,只能分出 ,并不能分出 。这样导致的问题是很多时候检索并不准确。 经过对比测试,发现 "nlpir" 进行分词效果更好。但是nlpir的效率和各种支持又没有jieba那么好,因此采用了一种折中的方案。 就是先用nlpir生成字典
阅读全文
posted @ 2018-10-09 10:24 xinkun
阅读(2684)
评论(0)
推荐(0)
编辑
公告