摘要:
创建内部表与外部表 设计分区表(按日期分区) -- 创建分区表(日志数据按日期分区) CREATE EXTERNAL TABLE logs ( user_id STRING, action STRING, duration INT ) PARTITIONED BY (dt STRING) LOCAT 阅读全文
posted @ 2025-03-17 07:59
KuanDong24
阅读(12)
评论(0)
推荐(0)
摘要:
从本地/HDFS加载数据到分区表 使用INSERT OVERWRITE导出查询结果 -- 从本地加载数据到分区 LOAD DATA LOCAL INPATH '/home/data/log_20230301.csv' OVERWRITE INTO TABLE logs PARTITION (dt=' 阅读全文
posted @ 2025-03-17 07:58
KuanDong24
阅读(7)
评论(0)
推荐(0)
摘要:
分区裁剪与分桶过滤 启用Tez执行引擎 -- 启用Tez引擎 SET hive.execution.engine=tez; -- 分区裁剪优化查询 SELECT * FROM logs WHERE dt BETWEEN '2023-03-01' AND '2023-03-05'; -- 仅扫描相关分 阅读全文
posted @ 2025-03-17 07:58
KuanDong24
阅读(6)
评论(0)
推荐(0)
摘要:
解析JSON格式日志 使用LATERAL VIEW EXPLODE展开数组 -- 创建包含嵌套结构的表 CREATE TABLE user_behavior ( user_id STRING, actions ARRAY<STRUCT<page:STRING, time:TIMESTAMP>> ); 阅读全文
posted @ 2025-03-17 07:57
KuanDong24
阅读(8)
评论(0)
推荐(0)
摘要:
创建Hive映射HBase的表 验证双向数据同步 CREATE EXTERNAL TABLE hive_hbase ( key STRING, name STRING, age INT ) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHan 阅读全文
posted @ 2025-03-17 07:56
KuanDong24
阅读(9)
评论(0)
推荐(0)
摘要:
编写了Python装饰器和生成器的示例代码使用Scala实现了高阶函数和模式匹配的示例 阅读全文
posted @ 2025-03-17 07:53
KuanDong24
阅读(7)
评论(0)
推荐(0)

浙公网安备 33010602011771号