WordCloud教程（上）

先贴代码：

import wordcloud,jieba
with open('datas/1.txt') as rt:#,encoding='utf-8'
    comment_text=rt.read()
    cut_text = " ".join(jieba.cut(comment_text))
    wordclud = wordcloud.WordCloud(scale=4,background_color="white", width=1000, height=860, margin=2).generate(cut_text)
    wordclud.to_file('test.png')
    print('OK,Please Look!')

（1.txt就是随便一段中文文本）

jieba:

jieba是中文分词的一个模块，用cut函数就可以分词得到结果对象，在list一下即可。

如：

import jieba
a = list(jieba.cut('我爱你')）
#以英文单词分割符：空格分割分词后的数据，以便传入Wordcloud。
cuts = ' '.join(a)
print(cuts)

wordcloud：

这个模块里面的WordCloud对象可以生成可视化的图片（按词的出现频率统计），只要指定一下宽、高、背景颜色即可。(生成要用generate函数）

wordcloud.WordCloud(scale = 缩放度（越大越清晰）,background_color = '颜色英文名（red，blue）',width = 宽度,height = 高度,margin = 2)

还有就是要把字体给设置一下，参考这里：https://t.cn/A6h0F59e

posted @ 2020-03-30 12:18 liangbojian 阅读(452) 评论(0) 收藏举报

刷新页面返回顶部

liangbojian

WordCloud教程（上）

公告