Python学习笔记——jieba库

lcut()函数:分割字符串,返回一个列表。

lcut_for_search()函数:比lcut( )更加精准,但是会产生重复。

add_word( ) 函数:往分词词库里添加词语。

del_word( ) 函数:往分词词库里删除词语。

import jieba
s = "思考快与慢的作者是丹尼尔卡尼曼"

ls1 = jieba.lcut(s)
print(ls1)
jieba.add_word("思考快与慢")
ls1 = jieba.lcut(s)
print(ls1)
jieba.del_word("思考快与慢")

ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.add_word("思考快与慢")
ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.del_word("思考快与慢")

ls3 = jieba.lcut_for_search(s)
print(ls3)
jieba.add_word("思考快与慢")
ls3 = jieba.lcut_for_search(s)
print(ls3)

输出:
['思考', '', '', '', '', '作者', '', '丹尼尔', '卡尼曼']
['思考', '', '', '', '', '作者', '', '丹尼', '丹尼尔', '尼尔', '', '', '']
['思考', '', '', '', '', '作者', '', '丹尼', '尼尔', '丹尼尔', '卡尼曼']


['思考快与慢', '', '作者', '', '丹尼尔', '卡尼曼']
['思考', '思考快与慢', '', '作者', '', '丹尼', '丹尼尔', '尼尔', '', '', '']
['思考', '思考快与慢', '', '作者', '', '丹尼', '尼尔', '丹尼尔', '卡尼曼']

 

posted @ 2020-02-02 22:50  Mqqq  阅读(405)  评论(0)    收藏  举报