摘要: inner join ,left join 时,如果表不是一对多。而是多对多时,就会导致数据发散。数据量会变大 阅读全文
posted @ 2019-10-23 10:23 TryMyBest! 阅读(2798) 评论(0) 推荐(0)
摘要: 在最前端作如下属性设置。可以动态分区插数 set hive.exec.dynamic.partition=true;set hive.exec.dynamic.partition.mode=nonstrict; 会根据动态分区日期进行插数 阅读全文
posted @ 2019-10-18 09:30 TryMyBest! 阅读(715) 评论(0) 推荐(0)
摘要: 需要把原来的表删除后,重新建表。把分区删除后重新跑数 MSCK REPAIR TABLE 表名 再加上上边的修复语句 阅读全文
posted @ 2019-10-17 16:27 TryMyBest! 阅读(1876) 评论(0) 推荐(0)
摘要: Shell本身的文件名 阅读全文
posted @ 2019-10-17 09:29 TryMyBest! 阅读(4317) 评论(0) 推荐(1)
摘要: 添加到Shell的参数个数 阅读全文
posted @ 2019-10-17 09:28 TryMyBest! 阅读(1231) 评论(0) 推荐(0)
摘要: ll -a ls -a 查询带有某字符串的脚本 grep -irl "字符串" 阅读全文
posted @ 2019-10-11 09:13 TryMyBest! 阅读(132) 评论(0) 推荐(0)
摘要: 因为关联主键可能不是唯一的,这样就会导致一对多的情况,数据就会发散 阅读全文
posted @ 2019-10-08 11:09 TryMyBest! 阅读(575) 评论(0) 推荐(0)
摘要: truncate不能删除外部表,只能删除内部表 把外部表转换为内部表:alter table 表名 set tblproperties ('EXTERNAL'='False'); 阅读全文
posted @ 2019-10-08 10:00 TryMyBest! 阅读(742) 评论(0) 推荐(0)
摘要: nohup sh xxx.sh & tail -f nohup.out 阅读全文
posted @ 2019-09-27 15:58 TryMyBest! 阅读(1379) 评论(0) 推荐(0)
摘要: MSCK REPAIR TABLE 阅读全文
posted @ 2019-09-25 10:04 TryMyBest! 阅读(334) 评论(0) 推荐(0)