随笔分类 -  Hive

hive架构优化学习
摘要:hive优化 一.小文件简述 1.1. HDFS上什么是小文件? HDFS存储文件时的最小单元叫做Block,Hadoop1.x时期Block大小为64MB,Hadoop2.x时期Block大小为128MB。(在hadoop部署下可以通过dfs.block.size进行设置) 小文件就是指,在HDF 阅读全文
posted @ 2019-10-13 10:53 NirvanaInFire 阅读(605) 评论(0) 推荐(0)
摘要:Hive之explode 一. explode, 行转列。 1.1. 用于array类型的数据 table_name 表名 array_col 为数组类型的字段 new_col array_col被explode之后对应的列 1.2. 用于map类型数据时的语法如下 由于map是kay value结 阅读全文
posted @ 2019-09-26 13:37 NirvanaInFire 阅读(3848) 评论(0) 推荐(0)