摘要:
引言 Checkpoint 到底是什么和需要用 Checkpoint 解决什么问题: Checkpoint 运行原理图 Checkpoint 源码解析 1、RDD.iterator 方法,它会先在缓存中查看数据 (内部会查看 Checkpoint 有没有相关数据),然后再从 CheckPoint 中 阅读全文
posted @ 2018-06-19 14:44
大葱拌豆腐
阅读(848)
评论(0)
推荐(0)
摘要:
一、概述 本文将介绍ResourceManager在Yarn中的功能作用,从更细的粒度分析RM内部组成的各个组件功能和他们相互的交互方式。 二、ResourceManager的交互协议与基本职能 1、ResourceManager交互协议 在整个Yarn框架中主要涉及到7个协议,分别是Applica 阅读全文
posted @ 2018-06-19 14:09
大葱拌豆腐
阅读(15384)
评论(1)
推荐(2)
摘要:
概述 checkpoint 的机制保证了需要访问重复数据的应用 Spark 的DAG执行图可能很庞大,task 中计算链可能会很长,这时如果 task 中途运行出错,那么 task 的整个需要重算非常耗时,因此,有必要将计算代价较大的 RDD checkpoint 一下,当下游 RDD 计算出错时, 阅读全文
posted @ 2018-06-19 10:48
大葱拌豆腐
阅读(954)
评论(0)
推荐(0)
摘要:
1、sql语句的模块解析 当我们写一个查询语句时,一般包含三个部分,select部分,from数据源部分,where限制条件部分,这三部分的内容在sql中有专门的名称: 当我们写sql时,如上图所示,在进行逻辑解析时会把sql分成三个部分,project,DataSource,Filter模块,当生 阅读全文
posted @ 2018-06-19 09:46
大葱拌豆腐
阅读(1407)
评论(0)
推荐(0)
浙公网安备 33010602011771号