随笔分类 - Hive
hive架构优化学习
摘要:hive优化 一.小文件简述 1.1. HDFS上什么是小文件? HDFS存储文件时的最小单元叫做Block,Hadoop1.x时期Block大小为64MB,Hadoop2.x时期Block大小为128MB。(在hadoop部署下可以通过dfs.block.size进行设置) 小文件就是指,在HDF
阅读全文
摘要:Hive之explode 一. explode, 行转列。 1.1. 用于array类型的数据 table_name 表名 array_col 为数组类型的字段 new_col array_col被explode之后对应的列 1.2. 用于map类型数据时的语法如下 由于map是kay value结
阅读全文

浙公网安备 33010602011771号