Hudi-核心概念(时间轴、文件管理、索引)
摘要:
总述 hudi提供了hudi表的概念,这些表支持CRUD操作,可以利用现有的大数据集群比如HDFS做数据文件存储,然后使用SparkSQL或Hive等分析引擎进行数据分析查询 hudi表的三个主要组件 a.有序的时间轴元数据,类似于数据库事务日志 b.分层布局的数据文件:实际写入表中的数据 c.索引 阅读全文
posted @ 2022-02-24 22:20 嘣嘣嚓 阅读(1071) 评论(0) 推荐(0)
浙公网安备 33010602011771号