摘要:
中文词频统计 1. 下载《三国演义》 2. 从文件读取待分析文本。 3.调用jieba库,并对文档进行分词 import jieba jieba.lcut(text) 5. 生成词频统计 6. 排序 7. 排除语法型词汇,代词、冠词、连词等停用词。 8. 输出词频最大TOP20,把结果存放到文件里 阅读全文
posted @ 2021-04-18 15:15
娇娇candy
阅读(102)
评论(1)
推荐(1)
浙公网安备 33010602011771号