zourui4271

博客园 首页 新随笔 联系 订阅 管理

2020年8月22日 #

摘要: 1. 相关概念 在实际的业务中,我们经常会遇到数据迟到的情况,这个时候基于窗口进行计算的结果就不对了,Flink中watermark就是为了解决这个问题的,理解watermark之前,先来说一下flink中的三个与流数据相关的概念,ProcessTime、EventTime、IngestionTim 阅读全文
posted @ 2020-08-22 12:09 zourui4271 阅读(503) 评论(0) 推荐(0)

摘要: flink 通过实现了 Google Dataflow 流式计算模型实现了高吞吐、低延迟、高性能兼具实时流式计算框架。 同时 flink 支持高度容错的状态管理,防止状态在计算过程中因为系统异常而丢失,flink 周期性地通过分布式快照技术 Checkpoints 实现状态的持久化维护,使得即使在系 阅读全文
posted @ 2020-08-22 11:35 zourui4271 阅读(631) 评论(0) 推荐(0)

摘要: Flink的容错机制 当 Flink 开启了 checkpoint 的时候,Flink 会一边消费 topic 的数据,一边定时的将 offset 和 其他 operator 的状态记录到 checkpoint 中。 如果遇到了 job 失败的情况,那么 Flink 将会重启 job,从最后一个 c 阅读全文
posted @ 2020-08-22 11:31 zourui4271 阅读(214) 评论(0) 推荐(0)

摘要: https://cloud.tencent.com/developer/column/79736 阅读全文
posted @ 2020-08-22 09:27 zourui4271 阅读(333) 评论(0) 推荐(0)

摘要: 一、描述 Window 是处理无限流的核心。Flink 认为 Batch 是 Streaming 的一个特例,所以 Flink 底层的引擎是一个流式引擎,在上面实现了流处理和批处理。 而窗口(Window)就是从Streaming 到 batch 的一个桥梁。Flink 提供了非常完善的窗口机制,这 阅读全文
posted @ 2020-08-22 09:23 zourui4271 阅读(516) 评论(0) 推荐(0)

摘要: Apache Flink–DataStream–Window 什么是Window?有哪些用途? 下面我们结合一个现实的例子来说明。 我们先提出一个问题:统计经过某红绿灯的汽车数量之和? 假设在一个红绿灯处,我们每隔15秒统计一次通过此红绿灯的汽车数量,如下图: 可以把汽车的经过看成一个流,无穷的流, 阅读全文
posted @ 2020-08-22 09:19 zourui4271 阅读(192) 评论(0) 推荐(0)