摘要: Spark核心编程_累加器和广播变量 1. 累加器 累加器用来把Executor端变量信息聚合到Driver端。在Driver程序中... 阅读全文
posted @ 2021-06-02 09:22 Yanko24 阅读(52) 评论(0) 推荐(0)
摘要: Spark核心编程_RDD 1. RDD创建 从集合(内存)中创建RDD 从集合中创建RDD,Spark主要提供了两个方法:par... 阅读全文
posted @ 2021-06-02 09:21 Yanko24 阅读(65) 评论(0) 推荐(0)
摘要: Spark核心编程 Spark计算框架为了能够进行高并发和高吞吐的数据处理,封装了三大数据结构,用于处理不同的应用场景。三大数据结构... 阅读全文
posted @ 2021-06-02 09:20 Yanko24 阅读(36) 评论(0) 推荐(0)