5.RDD操作综合实例

1.准备文件,上传到hdfs上

 

 

 

2.读文件、分词、排除大小写,标点符号,停用词,长度小于2的词

 

 

 

 

 

统计词频、排序

 

 

 

 

输出

 

 

保存到本地

求TOP值

 

 

 

 

 

posted @ 2022-04-06 17:40  LYH2022  阅读(8)  评论(1编辑  收藏  举报