摘要: 一、数据处理原理剖析每隔我们设置的batch interval 的time,就去找ReceiverTracker,将其中的,从上次划分batch的时间,到目前为止的这个batch interval time间隔内的block封装为一个batch;其次,会将这个batch中的数据,去创建为一个初始的RDD,一个batch内,在这段时间封装了几个block,就代表这个batch对应的RDD内会有几个p... 阅读全文
posted @ 2019-08-21 11:34 米兰的小铁將 阅读(496) 评论(0) 推荐(0)
摘要: 一、数据接收原理二、源码分析入口包org.apache.spark.streaming.receiver下ReceiverSupervisorImpl类的onStart()方法### override protected def onStart() { // 这里的blockGenerator很重要,和数据接收有关,其运行在worker的executor端负责数据接收后的一些存取工作,以及配... 阅读全文
posted @ 2019-08-21 11:25 米兰的小铁將 阅读(398) 评论(0) 推荐(0)