随笔分类 - hive
摘要:1、需要注意的是,要在namenode(超级用户)上操作,貌似是 解决办法,参考:http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_permissions_guide.html
阅读全文
摘要:Hive优化:MR阶段优化– 调整task数目 Hive优化:MR阶段优化– Reduce阶段 mapreduce.job.reduces直接设置num_reduce_tasks⼤⼩影响参数• hive.exec.reducers.max 默认:1099• hive.exec.reducers.by
阅读全文
摘要:一、基础DDL练习 二、基础DML语句 三、复杂数据类型 四、数据模型-分区 为减少不必要的暴力数据扫描,可以对表进行分区,为避免产生过多小文件,建议只对离散字段进行分区 六、外部表 external关键字,删除表时,外部表只删除元数据,不删除数据,更加安全 七、列式存储 在Create/Alter
阅读全文
摘要:解压缩hive安装包tar zxvf apache-hive-2.1.1-bin.tar.gz安装mysqlsudo yum install mysql-server安装 mysql connectorsudo yum install mysql-connector-java该命令会在/usr/sh
阅读全文
摘要:概述 hive 是一个包裹着 hdfs 的壳子,hive 通过 hql,将 sql 翻译成 MR ,进行数据查询。 Hive是⼀个构建在Hadoop之上的数据仓库 hive的数据存在hdfs上,元信息放在metastore中,metastore也放在hdfs上 和传统的数据仓库⼀样,主要⽤来访问和管
阅读全文

浙公网安备 33010602011771号