摘要:
要使用分词器来看下各个分词器对文本数据的分词效果,找了很多资料发现有推荐最多的开源分词工具就是结巴(jieba)分词和清华NLP分词库(thulac),下面简单说下中文分词器的jieba分词,只写了切词和用户自定义词典两种方法,其他的功能后面再补充: 一、分词 1 import jieba 2 st 阅读全文
posted @ 2019-06-09 14:14
HankCui
阅读(1326)
评论(0)
推荐(0)
浙公网安备 33010602011771号