摘要:
下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 1 # _*_coding:utf-8_*_ 2 import jieba 3 # 实例:词频统计 4 # 打开文件 5 fr = open('tridebody.txt','r',encoding= 'utf-8') 6 str = ... 阅读全文
posted @ 2017-09-29 09:49
AllianceHacke
阅读(294)
评论(0)
推荐(0)

浙公网安备 33010602011771号