摘要: 状态的管理 在Flink中,算子任务可以分为无状态和有状态两种 无状态算子包括map、filter、flatMap等,有状态算子包括聚合算子、窗口算子等 有状态算子的一般处理流程:算子任务接收到上游发来的数据;获取当前状态;根据业务逻辑进行计算,更新状态;得到计算结果,输出发送到下游任务 Flink 阅读全文
posted @ 2022-11-07 13:39 黄一洋 阅读(29) 评论(0) 推荐(0)
摘要: 并行度 Spark基于 MapReduce 架构的思想是“数据不动代码动”, 那么 Flink 就类似“代码不动数据流动”,原因就在于流式数据本身是连续到来的、我们不会同时传输所有数据,这其实是更符合数据流本身特点的处理方式 怎样实现数据并行呢? 其实也很简单,我们把一个算子操作,“复制”多份到多个 阅读全文
posted @ 2022-11-07 12:55 黄一洋 阅读(22) 评论(0) 推荐(0)