摘要: 1. Hive中 null 太多会占用大量空间 , 用这个可以减少占用 alter table test_null set serdeproperties('serialization.null.format' = ''); 2. 使用 sqoop 从mysql 和HIVE的 互相导入 mysql 阅读全文
posted @ 2020-05-26 15:35 挪威森林猫Zzz 阅读(304) 评论(0) 推荐(0)
摘要: 1. 进入DB 比如我的是 use hadoop; 2.找到需要查看的表 , 执行 desc formatted t1; 碎片文件太多 , 会让map 过多 ,然而启动map 极其耗费资源 , 甚至比计算都要费时间 . 阅读全文
posted @ 2020-05-26 12:07 挪威森林猫Zzz 阅读(4725) 评论(0) 推荐(0)