摘要: /** * 判断Str是否是选择题选择项 * @param str 内容 * @return */ public static boolean isSelecteTitele(String str) { Pattern pattern = Pattern.compile("^([a-zA-Z]+[\ 阅读全文
posted @ 2018-04-01 15:47 Dlimeng 阅读(17) 评论(0) 推荐(0)
摘要: url:Spark介绍系列04--RDD 一.Lineage RDD只支持粗粒度转换,即在大量记录上执行的单个操作。将创建RDD的一系列Lineage(即血统)记录下来,以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数据丢失时,它可以根据这些信息来 阅读全文
posted @ 2018-04-01 12:11 Dlimeng 阅读(10) 评论(0) 推荐(0)
摘要: url:Spark介绍系列03--RDD 一.RDD的依赖关系 RDD和它依赖的父RDD(s)的关系有两种不同的类型,即窄依赖(narrow dependency)和宽依赖(wide dependency)。 1.窄依赖 上图左侧是父级 窄依赖指的是每一个父RDD的Partition最多被子RDD的 阅读全文
posted @ 2018-04-01 11:26 Dlimeng 阅读(16) 评论(0) 推荐(0)
摘要: 有些基础用法就不详细介绍,有疑问的伙伴互相交流。 一.RDD的介绍 RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点:自动容错、位置感知性调度和可伸缩 阅读全文
posted @ 2018-04-01 10:56 Dlimeng 阅读(10) 评论(0) 推荐(0)
摘要: 有些基础用法就不详细介绍,有疑问的伙伴互相交流。 一.RDD的介绍 RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点:自动容错、位置感知性调度和可伸缩 阅读全文
posted @ 2018-04-01 10:56 Dlimeng 阅读(8) 评论(0) 推荐(0)