ZhangZhihui's Blog  

2025年9月8日

摘要: 1. 发布 含义:把你在数据湖里建好的表 物理表结构和数据 同步到数据目录/数据服务层。 特点: 会把表的元数据(表名、字段、分区信息)真正注册到元数据管理系统中。 下游系统(比如数据开发、可视化、API 服务等)都能直接使用这张表。 相当于“这张表正式生效,可以被别人查到/用到”。 2. 逻辑发布 阅读全文
posted @ 2025-09-08 08:41 ZhangZhihuiAAA 阅读(9) 评论(0) 推荐(0)
 
摘要: 在 金山云数据湖(基于 Hive 引擎) 里,创建表时的 “分区分表” 设置里的 “分表” 和 Hive 里的 分桶(bucket) 不是一回事: 区别说明 分区 (Partition) Hive 里常见的按字段(比如 dt=20250908)把数据目录切分成多个子目录。 查询时可以利用分区裁剪,加 阅读全文
posted @ 2025-09-08 08:12 ZhangZhihuiAAA 阅读(7) 评论(0) 推荐(0)