07 2023 档案

摘要:一、DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、Ma 阅读全文
posted @ 2023-07-10 18:13 小不点丶 阅读(6242) 评论(0) 推荐(4)
摘要:一、flink:apache开源的一款流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。 二、Flink是一个计算框架和分布 阅读全文
posted @ 2023-07-06 19:24 小不点丶 阅读(87) 评论(0) 推荐(0)