3月14日

从本地/HDFS加载数据到分区表

使用INSERT OVERWRITE导出查询结果

-- 从本地加载数据到分区
LOAD DATA LOCAL INPATH '/home/data/log_20230301.csv'
OVERWRITE INTO TABLE logs
PARTITION (dt='2023-03-01');

-- 导出查询结果到HDFS
INSERT OVERWRITE DIRECTORY '/output/user_actions'
SELECT user_id, COUNT(*) FROM logs GROUP BY user_id;

 

posted @ 2025-03-17 07:58  KuanDong24  阅读(7)  评论(0)    收藏  举报