GaussDB-Stream算子

分布式数据库执行引擎计算时,会有本节点执行和远程节点执行,当涉及到远程节点执行时,多个节点并发执行时,会存在数据流动的情况,这时候就需要Stream算子来处理数据之间流动。

Stream算子主要划分为三类:

Gather Stream (N:1):每个源节点的数据都汇总到目标节点
执行计划中: Streaming(type:GATHER) 

Broadcast Stream(1:N):将本节点的数据发送到其他远程节点
执行计划中:Streaming(type:BROADCAST)  

Redistribute Stream(N:N):每个节点根据关联字段列进行(hash等)计算,将数据重新分布到远程节点进行关联
执行计划中:Streaming(type:REDISTRIBUTE)

posted @ 2025-02-18 10:35  Rainng  阅读(101)  评论(0)    收藏  举报