摘要: http://spark.apache.org/docs/1.6.1/tuning.html1) 代码优化 a. 对于多次使用的RDD,进行数据持久化操作(eg: cache、persist) b. 如果对同一个份数据进行操作,那么尽量公用一个RDD c. 优先使用reduceByKey和aggre 阅读全文
posted @ 2017-03-15 15:00 liuming_1992 阅读(4590) 评论(0) 推荐(0) 编辑