摇光在望

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

随笔分类 -  Hive知识

摘要:#!/bin/sh # for i in '020W0700' '010WE0440' '020R0100' '020WE0300' do batch_code=$i inc_day=$a before=$b sep_incday=$c echo "tt $sep_incday" hive -e " 阅读全文
posted @ 2021-11-16 10:56 摇光在望 阅读(85) 评论(0) 推荐(0)

摘要:一、hive小文件 Hive的数据存储在HDFS,它对大文件的处理是非常高效的,如果合理配置文件系统的块大小,NameNode可以支持很大的数据量。HDFS主要分为NameNode,DataNode,ZKFC。 简单来说,HDFS数据的文件元信息,包括位置、大小、分块信息等,都是保存在NameNod 阅读全文
posted @ 2021-10-27 14:02 摇光在望 阅读(636) 评论(0) 推荐(0)

摘要:一、建立分区表(parquet存储格式) --数据倾斜优化set tez.queue.name=队列;set hive.execution.engine=tez; set hive.exec.dynamic.partition.mode=nonstrict;set hive.optimize.sor 阅读全文
posted @ 2021-10-27 11:12 摇光在望 阅读(2396) 评论(0) 推荐(0)