Hudi-数据写操作流程
摘要:
概述 在hudi数据湖框架中支持三种方式写入数据:UPSERT(插入更新)、INSERT(插入)和BULK INSERT(写排序) UPSERT:默认行为,数据先通过index打标(INSERT/UPDATE),有一些启发式算法决定消息的组织以优化文件的大小 INSERT:跳过index,写入效率更 阅读全文
posted @ 2022-02-26 22:13 嘣嘣嚓 阅读(1163) 评论(0) 推荐(0)
posted @ 2022-02-26 22:13 嘣嘣嚓 阅读(1163) 评论(0) 推荐(0)
posted @ 2022-02-26 21:43 嘣嘣嚓 阅读(2130) 评论(0) 推荐(0)