摘要:
考察spark自定义排序 方式一:自定义一个类继承Ordered和序列化,Driver端将数据变成RDD,整理数据转成自定义类类型的RDD,使用本身排序即可。 方式2:自定义一个类继承Ordered和序列化,Driver端将数据变成RDD,整理数据转成元组类型的RDD,使用就自定义类做排序规则。 方 阅读全文
posted @ 2019-04-06 01:52
RZ_Lee
阅读(623)
评论(0)
推荐(1)
摘要:
主要考察的是广播变量的使用: 1、将要广播的数据 IP 规则数据存放在HDFS上,(广播出去的内容一旦广播出去产就不能改变了,如果需要实时改变的规则,可以将规则放到Redis中) 2、在Spark中转成RDD,然后收集到Driver端, 3、把 IP 规则数据广播到Executor中。Driver端 阅读全文
posted @ 2019-04-06 00:15
RZ_Lee
阅读(859)
评论(0)
推荐(1)

浙公网安备 33010602011771号