python 自然语言处理(二) jieba 分词
import jieba
s ='我想和女朋友一起去北京故宫博物院参观和闲逛。'
#精确模式
cut = jieba.cut(s)
print (','.join(cut))
我,想,和,女朋友,一起,去,北京故宫博物院,参观,和,闲逛,。
#全模式
print ( ','.join(jieba.cut(s,cut_all = True)))
我,想,和,女朋友,朋友,一起,去,北京,北京故宫,北京故宫博物院,故宫,故宫博物院,博物,博物院,参观,和,闲逛,,
#搜索引擎模式
print (','.join(jieba.cut_for_search(s)))
我,想,和,朋友,女朋友,一起,去,北京,故宫,博物,博物院,北京故宫博物院,参观,和,闲逛,。
#并行分词
jieba.enable_parallel(3)
s1 = [x for x in jieba.cut_for_search(s) if len(x) >= 2]
jieba.disable_parallel()
print(s1)

浙公网安备 33010602011771号