摘要: 以阿里云的运维大屏为例。 一、重点关注的数量统计,统计实例的运行情况和节点的运行情况。(实例就是节点每次到时间了的具体执行的任务) 重要的实例数量包括: 失败实例的数量,这是每天要观察的数据,一般为早上。第一时间能观察到失败的数量,马上进行处理。 运行慢实例数量,有些任务没有失败,但是运行很慢,可能 阅读全文
posted @ 2021-04-15 17:25 肥仔佳文猪 阅读(565) 评论(0) 推荐(0)
摘要: 一、设置最小时间间隔 当flink应用开启Checkpoint功能,并配置Checkpoint时间间隔,应用中就会根据指定的时间间隔周期性地对应用进行Checkpoint操作。默认情况下Checkpoint操作都是同步进行,也就是说,当前面触发的Checkpoint动作没有完全结束时,之后的Chec 阅读全文
posted @ 2021-04-15 00:54 肥仔佳文猪 阅读(2057) 评论(0) 推荐(0)