摘要: 中文词频统计 1. 下载《三国演义》 2. 从文件读取待分析文本。 3.调用jieba库,并对文档进行分词 import jieba jieba.lcut(text) 5. 生成词频统计 6. 排序 7. 排除语法型词汇,代词、冠词、连词等停用词。 8. 输出词频最大TOP20,把结果存放到文件里 阅读全文
posted @ 2021-04-18 15:15 娇娇candy 阅读(102) 评论(1) 推荐(1)