摘要: spark单个master节点的提交方式 spark的HA模式的提交方式 阅读全文
posted @ 2017-09-07 10:28 一心行走 阅读(1112) 评论(0) 推荐(0)
摘要: 1、spark是什么? 快速,通用,可扩展的分布式计算引擎 2、弹性分布式数据集RDD RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点:自动容错、位 阅读全文
posted @ 2017-09-07 10:04 一心行走 阅读(10949) 评论(0) 推荐(0)