posted @ 2016-05-28 22:49
随笔分类 - Spark Streaming 进阶
摘要:一、Spark Streaming 数据安全性的考虑: Executor容错方式: 1. 最简单的容错是副本方式,基于底层BlockManager副本容错,也是默认的容错方式。 2.WAL日志方式 3. 接收到数据之后不做副本,支持数据重放,所谓重放就是支持反复读取数据。 BlockManager备
阅读全文
摘要:上篇文章详细解析了Receiver不断接收数据的过程,在Receiver接收数据的过程中会将数据的元信息发送给ReceiverTracker: 本文将详细解析ReceiverTracker的的架构设计和具体实现 本文将详细解析ReceiverTracker的的架构设计和具体实现 一、Receiver
阅读全文
posted @ 2016-05-28 12:32
摘要:原创文章,转载请注明:转载自 听风居士博客(http://www.cnblogs.com/zhouyf/) 上篇博客讨论了Spark Streaming 程序动态生成Job的过程,并留下一个疑问: JobScheduler将动态生成的Job提交,然后调用了Job对象的run方法,最后run方法的调用
阅读全文
posted @ 2016-05-20 12:29
摘要:1 spark streaming 程序代码实例 代码如下: [html] view plain copy object OnlineTheTop3ItemForEachCategory2DB { def main(args: Array[String]){ val conf = new Spark
阅读全文
posted @ 2016-05-11 11:16
摘要:首先,我们必须知道什么是事务及其一致性? 事务应该具有4个属性:原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。 原子性(atomicity)。一个事务是一个不可分割的工作单位,事务中包括的诸操作要么都做,要么都不做。 一致性(consistency)。事务必须是使数据库从一个一致性
阅读全文
posted @ 2016-05-09 18:57
摘要:1 解密Spark Streaming运行机制 上节课我们谈到了技术界的寻龙点穴。这就像过去的风水一样,每个领域都有自己的龙脉,Spark就是龙脉之所在,它的龙穴或者关键点就是SparkStreaming。这是上一节课我们非常清晰知道的结论之一。而且上一节课,我们采用了降维的方式。所谓降维的方式,是
阅读全文
posted @ 2016-05-08 20:59
摘要:1 Spark源码定制选择从Spark Streaming入手 我们从第一课就选择Spark子框架中的SparkStreaming。 那么,我们为什么要选择从SparkStreaming入手开始我们的Spark源码版本定制之路? 有下面几个方面的理由: 1)Spark大背景 Spark 最开始没有我
阅读全文
posted @ 2016-05-08 20:40
摘要:一.Spark streaming Job 架构 SparkStreaming框架会自动启动Job并每隔BatchDuration时间会自动触发Job的调用。 Spark Streaming的Job 分为两大类: 每隔BatchInterval时间片就会产生的一个个Job,这里的Job并不是Spar
阅读全文
posted @ 2016-05-08 18:37
浙公网安备 33010602011771号