摘要: union,connect,Iterate,project union算子是把多个task的算子合并成一个算子,(注意这多个算子的类型是要一致的) DataStream* → DataStream ,下图是语法格式 dataStream.union(otherStream1, otherStream 阅读全文
posted @ 2022-01-08 23:26 习惯了蓝 阅读(89) 评论(0) 推荐(0)
摘要: flink在transformatin之后为了控制更小细粒度的分区,引入了物理分区功能的算子 分别是rebalance,shuffle,broadcast,rescaling,partitonCustom这五个 下面来一个个记录一下。 rebalance ,下游task分区会轮询的把每个上游task 阅读全文
posted @ 2022-01-08 22:16 习惯了蓝 阅读(252) 评论(0) 推荐(0)
摘要: reduce,sum,min,max,minby,maxby这几个算子都是对keyedStream算子进行滚动聚合使用,把keyedStream算子转换成DataStream类算子。换句话说,想要使用这几个算子,那么势必要先去用keyby算子进行分区,把数据塞进各自对应的管道里去。 reduce算子 阅读全文
posted @ 2022-01-08 17:31 习惯了蓝 阅读(199) 评论(0) 推荐(0)