摘要:
本期内容 : 数据接收架构设计模式 数据接收源码彻底研究 一、Spark Streaming数据接收设计模式 Spark Streaming接收数据也相似MVC架构: 1、 Mode相当于Receiver存储数据,C级别的,Receiver是个抽象因为他有好多的Receiver 2、 Receive 阅读全文
posted @ 2016-05-24 18:53
xuanlin的专栏
阅读(253)
评论(0)
推荐(0)
摘要:
本期内容 : Receiver启动的方式设想 Receiver启动源码彻底分析 多个输入源输入启动,Receiver启动失败,只要我们的集群存在就希望Receiver启动成功,运行过程中基于每个Teark启动都有可能运行失败。 启动一个应用程序的不同Receiver采用一个不同RDD的partion 阅读全文
posted @ 2016-05-24 18:52
xuanlin的专栏
阅读(344)
评论(0)
推荐(0)
摘要:
本期内容 : DStream与RDD关系彻底研究 Streaming中RDD的生成彻底研究 问题的提出 : 1、 RDD是怎么生成的,依靠什么生成 2、执行时是否与Spark Core上的RDD执行有什么不同的 3、 运行之后我们要怎么处理 为什么有第三点 : 是因为Spark Streaming 阅读全文
posted @ 2016-05-24 18:51
xuanlin的专栏
阅读(629)
评论(0)
推荐(0)
摘要:
本期内容 : JobScheduler内幕实现 JobScheduler深度思考 JobScheduler 是整个Spark Streaming调度的核心,需要设置多线程,一条用于接收数据不断的循环,另外一条是处理线程,同时需要把调度与执行分离开。 一、 作业流程源码 : 首先只要定义了BatchD 阅读全文
posted @ 2016-05-24 16:56
xuanlin的专栏
阅读(721)
评论(0)
推荐(0)
摘要:
本期内容 : Spark Streaming Job生成深度思考 Spark Streaming Job生成源码解析 Spark Core中的Job就是一个运行的作业,就是具体做的某一件事,这里的JOB由于它是基于Spark Core所以Spark Streaming对其进行了封装。 大数据开发应用 阅读全文
posted @ 2016-05-24 16:55
xuanlin的专栏
阅读(340)
评论(0)
推荐(0)