Loading

摘要: Java 的序列化能够序列化任何的类。但是比较重(字节多),序列化后,对象的提交也比较大。Spark 出于性能的考虑,Spark2.0 开始支持另外一种 Kryo 序列化机制。Kryo 速度是 Serializable 的 10 倍。当 RDD 在 Shuffle 数据的时候,简单数据类型、数组和字 阅读全文
posted @ 2022-01-20 12:35 Zhbeii 阅读(381) 评论(0) 推荐(0)
摘要: Spark的transformation算子(不少于8个)(重点) 单Value (1)map:将处理的数据逐条进行映射转换,这里的转换可以是类型的转换,也可以是值的转换 (2)mapPartitions:将待处理的数据以分区为单位发送到计算节点进行处理,这里的处理是指可以进行任意的处理,哪怕是过滤 阅读全文
posted @ 2022-01-20 12:05 Zhbeii 阅读(302) 评论(0) 推荐(0)
摘要: ![image](https://img2022.cnblogs.com/blog/2138338/202201/2138338-20220120113654584-823662731.png) 阅读全文
posted @ 2022-01-20 11:39 Zhbeii 阅读(45) 评论(0) 推荐(0)
摘要: 第一次启动 非第一次启动 阅读全文
posted @ 2022-01-20 10:52 Zhbeii 阅读(22) 评论(0) 推荐(0)