摘要:
spark-算子 groupBy -分组 package com.core import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object Demo7GroupBy { def main 阅读全文
posted @ 2022-07-12 08:49
a-tao必须奥利给
阅读(51)
评论(0)
推荐(0)
摘要:
Spark内核 RDD ResilientDistributedDataset (弹性分布式数据集 ) 五大特性: A list of partitions A function for computing each split A list of dependencies on other RDD 阅读全文
posted @ 2022-07-12 08:39
a-tao必须奥利给
阅读(277)
评论(0)
推荐(0)
摘要:
Spark初识 回顾一下前面的MapReduce流程,可以更好的学习spark spark的框架 spark为什么比hadoop速度快 spark支持哪些语言 spark的运行模式有哪些 spark的单词统计 package com.core import org.apache.spark.rdd. 阅读全文
posted @ 2022-07-12 08:19
a-tao必须奥利给
阅读(47)
评论(0)
推荐(0)

浙公网安备 33010602011771号