摘要:
一、hive分桶 概述 hive 分桶 分桶表是对列值取哈希值的方式,将不同数据放到不同文件中存储。 对于hive中每一个表、分区都可以进一步进行分桶。 由列的哈希值除以桶的个数求余的方式来决定每条数据划分在哪个桶中。 适用场景: 数据抽样( sampling )、map-join 数据抽样: 数据 阅读全文
posted @ 2019-08-27 15:00
米兰的小铁將
阅读(646)
评论(0)
推荐(0)
摘要:
一、重定向正则表达式匹配:* ~ 为区分大小写匹配* ~* 为不区分大小写匹配* !~和!~*分别为区分大小写不匹配及不区分大小写不匹配文件及目录匹配:* -f和!-f用来判断是否存在文件* -d和!-d用来判断是否存在目录* -e和!-e用来判断是否存在文件或目录* -x和!-x用来判断文件是否可执行flag标记:* last 相当于Apache里的[L]标记,表示完成rewrite* brea... 阅读全文
posted @ 2019-08-27 11:29
米兰的小铁將
阅读(9152)
评论(0)
推荐(0)

浙公网安备 33010602011771号