摘要: 1. 引入 Apache Hudi是一个开源的增量数据处理框架,提供了行级insert、update、upsert、delete的细粒度处理能力(Upsert表示如果数据集中存在记录就更新;否则插入)。 Hudi处理数据插入和更新,不会创建太多的小文件(小文件会导致查询端性能降低),Apache H 阅读全文
posted @ 2020-07-27 11:19 leesf 阅读(624) 评论(0) 推荐(1) 编辑