2018 年 4月 1 日随笔档案 - Dlimeng

2018年4月1日

摘要： /** * 判断Str是否是选择题选择项 * @param str 内容 * @return */ public static boolean isSelecteTitele(String str) { Pattern pattern = Pattern.compile("^([a-zA-Z]+[\ 阅读全文

posted @ 2018-04-01 15:47 Dlimeng 阅读(18) 评论(0) 推荐(0)

Spark介绍系列05--RDD

摘要： url:Spark介绍系列04--RDD 一.Lineage RDD只支持粗粒度转换，即在大量记录上执行的单个操作。将创建RDD的一系列Lineage（即血统）记录下来，以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为，当该RDD的部分分区数据丢失时，它可以根据这些信息来阅读全文

posted @ 2018-04-01 12:11 Dlimeng 阅读(13) 评论(0) 推荐(0)

Spark介绍系列04--RDD

摘要： url:Spark介绍系列03--RDD 一.RDD的依赖关系 RDD和它依赖的父RDD（s）的关系有两种不同的类型，即窄依赖（narrow dependency）和宽依赖（wide dependency）。 1.窄依赖上图左侧是父级窄依赖指的是每一个父RDD的Partition最多被子RDD的阅读全文

posted @ 2018-04-01 11:26 Dlimeng 阅读(16) 评论(0) 推荐(0)

Spark介绍系列03--RDD

摘要：有些基础用法就不详细介绍，有疑问的伙伴互相交流。一.RDD的介绍 RDD（Resilient Distributed Dataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点：自动容错、位置感知性调度和可伸缩阅读全文

posted @ 2018-04-01 10:56 Dlimeng 阅读(10) 评论(0) 推荐(0)

Spark介绍系列03--RDD_李孟_新浪博客

posted @ 2018-04-01 10:56 Dlimeng 阅读(8) 评论(0) 推荐(0)

dlimeng

公告