随笔分类 -  Hadoop

摘要:为什么分桶 (1)获得更高的查询处理效率。桶为表加上了额外的结构,Hive 在处理有些查询时能利用这个结构。具体而言,连接两个在(包含连接列的)相同列上划分了桶的表,可以使用 Map 端连接 (Map-side join)高效的实现。比如JOIN操作。对于JOIN操作两个表有一个相同的列,如果对这两 阅读全文
posted @ 2019-08-06 22:14 xiaopengfei 阅读(5669) 评论(0) 推荐(0)
摘要:sqoop要使用别名模式隐藏密码 1.首先使用命令创建别名 hadoop credential create xiaopengfei -provider jceks://hdfs/user/password/xiaopengfei 说明: create 指定创建的别名 -provider jceks 阅读全文
posted @ 2018-04-24 16:03 xiaopengfei 阅读(712) 评论(0) 推荐(0)