会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
软工1901-吴兴
博客园
首页
新随笔
联系
订阅
管理
2022年4月12日
5.RDD操作综合实例
摘要: 一、词频统计 A.分步骤实现 1.准备文件读文件创建RDD 下载小说或长篇新闻稿 上传到hdfs上 2.分词文件传入 3.排除大小写,标点符号,停用词,长度小于2的词 排除标点符号: 大小写: 停用词: 长度小于2: 4.统计词频 5.排序 6.输出到文件 7.查看结果 B.一句话实现:文件入文件出
阅读全文
posted @ 2022-04-12 08:35 软工1901-吴兴
阅读(51)
评论(0)
推荐(0)
公告