WordCloud教程(上)

先贴代码:

import wordcloud,jieba
with open('datas/1.txt') as rt:#,encoding='utf-8'
    comment_text=rt.read()
    cut_text = " ".join(jieba.cut(comment_text))
    wordclud = wordcloud.WordCloud(scale=4,background_color="white", width=1000, height=860, margin=2).generate(cut_text)
    wordclud.to_file('test.png')
    print('OK,Please Look!')

(1.txt就是随便一段中文文本)

jieba:

jieba是中文分词的一个模块,用cut函数就可以分词得到结果对象,在list一下即可。

如:

import jieba
a = list(jieba.cut('我爱你'))
#以英文单词分割符:空格分割分词后的数据,以便传入Wordcloud。
cuts = ' '.join(a)
print(cuts)

wordcloud:

这个模块里面的WordCloud对象可以生成可视化的图片(按词的出现频率统计),只要指定一下宽、高、背景颜色即可。(生成要用generate函数)

wordcloud.WordCloud(scale = 缩放度(越大越清晰),background_color = '颜色英文名(red,blue)',width = 宽度,height = 高度,margin = 2)

还有就是要把字体给设置一下,参考这里:https://t.cn/A6h0F59e

posted @ 2020-03-30 12:18  liangbojian  阅读(385)  评论(0编辑  收藏  举报
点击打开宝藏