文件方式实现完整的英文词频统计实例
可以下载一长篇的英文小说,进行词频的分析。
1.读入待分析的字符串
2.分解提取单词
3.计数字典
4.排除语法型词汇
5.排序
6.输出TOP(20)
7.对输出结果的简要说明。
fo=open('test.txt','r') s=fo.read() r=s.lower() for i in ',.?!': r=r.replace(i,' ') r=r.split(' ') exp={'the','in','for','out','on','and','to','a','has'} word=set(r)-exp dic={} for i in word: dic[i]=r.count(i) r=list(dic.items()) r.sort(key=lambda x:x[1],reverse=True) print('统计单词出现次数并输出top(20):') for i in range(20): print(r[i]) fo.close()

浙公网安备 33010602011771号