jieba基础使用

1.常用函数

jieba库分词的三种模式:
  1、精准模式:把文本精准地分开,不存在冗余
  2、全模式:把文中所有可能的词语都扫描出来,存在冗余
  3、搜索引擎模式:在精准模式的基础上,再次对长词进行切分

函数 功能
jieba.lcut(s) 精确模式,返回list类型
jieba.lcut(s,cut_all=True) 全模式模式,返回list类型
jieba.lcut_for_search(s) 搜索引擎模式,返回list类型
jieba.cut(s) 精确模式,返回可迭代对象
jieba.cut(s,cut_all=True) 全模式模式,返回可迭代对象
jieba.cut_for_search(s) 搜索引擎模式,返回可迭代对象
jieba.add_word("新增词") 在分词词典中添加新词

 

posted @ 2020-05-31 22:11  orz_cc  阅读(432)  评论(0)    收藏  举报