摘要: welcome to 肥怡滴blog~~ 1、词频统计 A. 分步骤实现 1.准备文件 下载小说或长篇新闻稿 上传到hdfs上 2.读文件创建RDD 3.分词 4.标点符号[re.split(pattern,str),flatMap()] # 导入正则表达式re库,使用re.split分词 # 再次 阅读全文
posted @ 2022-04-01 00:16 *啥也不是* 阅读(77) 评论(2) 推荐(1) 编辑