如何通过ETL把StarRocks中的数据同步到数仓

在数据驱动决策的时代,企业对于数据处理和分析的需求日益增加。ETL作为数据处理的核心环节,扮演着将原始数据转化为有价值信息的关键角色。而StarRocks作为一款极速全场景MPP(Massively Parallel Processing)企业级数据库产品,凭借其创新的架构设计与卓越的性能表现,正成为企业实现高效数据处理与实时分析的优选方案。那如何通过ETL工具把StarRocks中的数据同步到数仓呢?接下来我们通过实操演示下过程。

一、StarRocks数据同步到Doris演示

新建数据源创建StarRocks源数据库:

进入数据源管理选择新建数据源,在数据源中找到StarRocks进行创建。

填写StarRocks相关配置

新建数据源创建Doris源数据库:

Doris数据源创建步骤和上述相同

新建流程

新建流程,在流程中配置库表输入组件和doris输出组件,没有组件的需要前往官网购买。库表输入用于读取StarRocks数据,Doris输出用于往Doris中同步数据。

 

 

 

配置库表输入组件,只需选择刚才创建的数据源和数据源中表。当前表中有30万条数据。

选中表后会默认生成查询语句,也可以更具需要更改语句。后续的输入字段也会自动识别。

配置Doris快速输出组件,同样的Doris选择数据源和目标表。

同时使用了自动建表功能在目标端Doris数据库中自动创建表。

在路由线中开启5个并发线程优化同步速度

执行流程并查看结果

 

posted @ 2025-06-26 17:53  谷云科技RestCloud  阅读(21)  评论(0)    收藏  举报