十四五规划纲要的词云统计

词云统计     

     作者:鲁凌凯 时间:2021.4.18.11.41

具体步骤:

     1.先安装好必备的第三方库

     2.从网上搜索到关于十四五规划的纲要

     3.将所需文件进行保存

     4.打开Python编辑器进行代码编辑

     5.生成图片即可

所遇问题:

    1.使用pip下载第三方库时,会遇到如下情况:

'pip' 不是内部或外部命令,也不是可运行的程序 或批处理文件。

此时,登入Python123,重新下载一个Python即可解决

    3.使用pip下载词云第三方库时,需要连接外网下载Visial C++,下载时,应注意不要下载病毒和附加软件

    4.文档搜索时,文件路径的书写出现错误(解决:通过属性进行查找路径,并将路径中的斜杠反向)

    5.显示出图片以后,会出现很多不必要的词汇,此时需要增加一个集合

excludes={'的','和','完善','加强','促进','加快','实现','优化','推进','推动',\
'评估','健全','增强','实施','提升','以','水平','提高','等','更加','为','强化','坚持','全面'\
'四中','处理','机制','支持','基础','在','重要','深化','重大','领域','新','对','各','二〇'}

在使用词云库时,使用stopwords=excludes代码,便可以解决

 

源代码如下:

 

 

import jieba
from wordcloud import WordCloud
excludes={'的','和','完善','加强','促进','加快','实现','优化','推进','推动',\
'评估','健全','增强','实施','提升','以','水平','提高','等','更加','为','强化','坚持','全面'\
'四中','处理','机制','支持','基础','在','重要','深化','重大','领域','新','对','各','二〇'}
f=open('C:/Users/pc/Desktop/重要文库/十四五.txt','r',encoding='utf-8')
txt=f.read()
txt=jieba.lcut(txt)
count={}
for word in txt:
if len(word)==1:
pass
else:
count[word]=count.get(word,0)+1
item=list(count.items())
item.sort(key=lambda x:x[1],reverse=True)
for i in range(1000):
word,shu=item[i]
print('{0:<10}{1:>5}'.format(word,shu))

txt=' '.join(txt)
w=WordCloud(font_path='msyh.ttc',background_color='white',stopwords=excludes).generate(txt)
w.to_file('词云统计.png')

 

 

 

 

 

posted @ 2021-04-18 11:43  LLKLLK  阅读(365)  评论(0)    收藏  举报