flink与spark执行的区别

(1)spark可以在map端进行预聚合，flink却不可以；
   flink数据直接发送到下游，并且每一条数据都会被处理
(2)spark先执行maptask，再执行reducetask；
   flink是maptask和reducetask同时执行，等待数据过来
(3)spark是mapreduce模型
   flink是持续流模型 
   
 flink与spark都是粗粒度资源调度（mapreduce是细粒度资源调度）

flink的keyBy将相同的key发送到同一个下游的task中；
从上游往下游发送数据，并不是一条数据发送一次

数据从上游task发送到下游task有缓冲
满足下面两个条件的一个，都会产生缓冲：
1、时间超过200ms
2、数据量达到32kb

posted @ 2022-03-20 13:08 阿伟宝座阅读(386) 评论(0) 收藏举报

刷新页面返回顶部

阿伟宝座

flink与spark执行的区别

flink与spark执行的区别

公告