• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
waker_wang
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

2018年8月20日

hive调优
摘要: 阅读全文
posted @ 2018-08-20 14:53 waker_wang 阅读(136) 评论(0) 推荐(0)
 
hive...
摘要: ORDER BY和SORT BY ORDER BY用于全局排序,就是对指定的所有排序键进行全局排序,使用ORDER BY的查询语句,最后会用一个Reduce Task来完成全局排序。 SORT BY用于分区内排序,即每个Reduce任务内排序。 DISTRIBUTE BY和CLUSTER BY di 阅读全文
posted @ 2018-08-20 11:20 waker_wang 阅读(90) 评论(0) 推荐(0)
 
hive分区
摘要: Hive中的表分区 Hive中的表分区比较简单,就是将同一组数据放到同一个HDFS目录下,当查询中过滤条件指定了某一个分区值时候,只将该分区对应的目录作为Input,从而减少MapReduce的输入数据,提高查询效率。 创建分区表 CREATE EXTERNAL TABLE t_1 ( id INT 阅读全文
posted @ 2018-08-20 11:04 waker_wang 阅读(254) 评论(0) 推荐(0)
 
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3