(阿里训练营)flink——Stream Processing With Flink

一、并行处理和编程规范

　　1.并行计算

　　　　并行计算的核心思想:分而治之，将节点变成有向无环图，路径为Source Trans Sink

二、DataStream API

　　1.大致运行流程：

　　代码示例：

　　flink的source从哪里来？——flink连接器

　　更多的DataStream API，参考：https://blog.csdn.net/xyzkenan/article/details/103802762

三、核心特点：状态和时间

　　1.有状态的计算　

　　有状态计算是指在程序计算过程中，在Flink程序内部存储计算产生的中间结果，并提供给后续Function或算子计算结果使用。状态数据可以维系在本地存储中，这里的存储可以是Flink的堆内存或者堆外内存，也可以借助第三方的存储介质，例如Flink中已经实现的RocksDB，当然用户也可以自己实现相应的缓存系统去存储状态信息，以完成更加复杂的计算逻辑。

　　和状态计算不同的是，无状态计算不会存储计算过程中产生的结果，也不会将结果用于下一步计算过程中，程序只会在当前的计算流程中实行计算，计算完成就输出结果，然后下一条数据接入，然后再处理。

　　2.flink状态原语

　　　　参考：https://blog.csdn.net/xorxos/article/details/80877266

　　3.flink中时间的概念

　　　　两种时间区别：

posted @ 2020-10-13 13:52 ---江北阅读(283) 评论(0) 收藏举报

刷新页面返回顶部

---江北

冰冻三尺，非一日之寒

(阿里训练营)flink——Stream Processing With Flink

一、并行处理和编程规范

二、DataStream API

三、核心特点：状态和时间

公告