摘要: 1.准备文本文件 从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2.生成单词的列表 从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() 3.筛 阅读全文
posted @ 2021-03-27 22:21 红烧鸿宝 阅读(63) 评论(0) 推荐(0) 编辑