分词-1

# encoding=utf-8
import jieba
 
jieba.enable_paddle()# 启动paddle模式。
strs=["我关注了数据STUDIO","我是数据分析师","四川大学"]
for str in strs:
    seg_list = jieba.cut(str,use_paddle=True) # 使用paddle模式
    print("Paddle Mode: " + '/'.join(list(seg_list)))
 
seg_list = jieba.cut("我毕业于四川大学,我关注了数据STUDIO", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list))  # 全模式
 
seg_list = jieba.cut("我毕业于四川大学,我关注了数据STUDIO", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list))  # 精确模式
 
seg_list = jieba.cut("他来到了网易杭研大厦")  # 默认是精确模式
print(", ".join(seg_list))
 
seg_list = jieba.cut_for_search("我是云朵君,我关注了数据STUDIO")  # 搜索引擎模式
print(", ".join(seg_list))

Paddle enabled successfully......
Paddle Mode: 我/关注/了/数据/STUDIO
Paddle Mode: 我/是/数据/分析师
Paddle Mode: 四川大学
Full Mode: 我/ 毕业/ 于/ 四川/ 四川大学/ 大学/ ,/ 我/ 关注/ 了/ 数据/ STUDIO
Default Mode: 我/ 毕业/ 于/ 四川大学/ ,/ 我/ 关注/ 了/ 数据/ STUDIO
他, 来到, 了, 网易, 杭研, 大厦
我, 是, 云朵, 君, ,, 我, 关注, 了, 数据, STUDIO

posted @ 2024-04-02 17:27  小张睡醒了  阅读(9)  评论(0)    收藏  举报