摘要:
1.底层是testfile格式,上层为parquet存储,相比parquet查询性能较好。 2.对于脚本中使用的临时表,如果存在以下情况需要进行统计表信息 1)本身数据量较大 2)需要和大量数据表进行关联 3)本身被较多次使用 3.对于重复使用计算的SQL,需要事前计算好数据,放到临时表中使用,节省 阅读全文
posted @ 2019-11-18 18:04
醉城、
阅读(2042)
评论(0)
推荐(0)
摘要:
Apache Hive支持Apache Hadoop中使用的几种熟悉的文件格式,如TextFile,RCFile,SequenceFile,AVRO,ORC和Parquet格式。 Cloudera Impala也支持这些文件格式。 在建表时使用STORED AS (TextFile|RCFile|S 阅读全文
posted @ 2019-11-18 17:41
醉城、
阅读(1384)
评论(0)
推荐(0)
摘要:
因为我们日常使用的rm 命令没有恢复机制,删除了文件就找不到了,往往重要的文件,我们要特别小心才对,但是有时还是避免不了我们的误操作。可能会造成很大的影响。 本博文简单介绍一下,用trash命令仿照Windows下的回收站机制操作 1.首先我们需要下载安装包 wget https://github. 阅读全文
posted @ 2019-11-18 10:13
醉城、
阅读(2824)
评论(0)
推荐(0)

浙公网安备 33010602011771号