摘要: 概述 在高层次上,每个Spark应用程序都由一个运行用户main方法的driver program组成,并在集群上执行各种 parallel operations。Spark提供的主要抽象是resilient distributed dataset (RDD),它是可以并行操作的群集节点之间分配的元 阅读全文
posted @ 2017-09-12 18:01 Mr.Ming2 阅读(251) 评论(0) 推荐(0) 编辑