摘要: 一、词频统计 A.分步骤实现 1.准备文件读文件创建RDD 下载小说或长篇新闻稿 上传到hdfs上 2.分词文件传入 3.排除大小写,标点符号,停用词,长度小于2的词 排除标点符号: 大小写: 停用词: 长度小于2: 4.统计词频 5.排序 6.输出到文件 7.查看结果 B.一句话实现:文件入文件出 阅读全文
posted @ 2022-04-12 08:35 软工1901-吴兴 阅读(51) 评论(0) 推荐(0)