摘要: 大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-中 本篇详细描述hoodie数据读写流程,进一步加深对数据湖技术的理解。理论后转战集成Spark的使用,通过spark-shell和spark-sql实现hoodie的插入数据、查询数据、更新数据、删除数据、覆盖数据、时间旅行查询等示例,了解创建表、修改表结构、查询分区、删除分区基本用法,为进一步使用奠定基础。 阅读全文
posted @ 2022-11-23 22:35 itxiaoshen 阅读(559) 评论(0) 推荐(0) 编辑