随笔分类 -  hive

摘要:1、需要注意的是,要在namenode(超级用户)上操作,貌似是 解决办法,参考:http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_permissions_guide.html 阅读全文
posted @ 2017-06-16 15:53 Super_Orco 阅读(1782) 评论(0) 推荐(0)
摘要:Hive优化:MR阶段优化– 调整task数目 Hive优化:MR阶段优化– Reduce阶段 mapreduce.job.reduces直接设置num_reduce_tasks⼤⼩影响参数• hive.exec.reducers.max 默认:1099• hive.exec.reducers.by 阅读全文
posted @ 2017-06-15 16:28 Super_Orco 阅读(259) 评论(0) 推荐(0)
摘要:一、基础DDL练习 二、基础DML语句 三、复杂数据类型 四、数据模型-分区 为减少不必要的暴力数据扫描,可以对表进行分区,为避免产生过多小文件,建议只对离散字段进行分区 六、外部表 external关键字,删除表时,外部表只删除元数据,不删除数据,更加安全 七、列式存储 在Create/Alter 阅读全文
posted @ 2017-06-15 15:07 Super_Orco 阅读(1418) 评论(0) 推荐(0)
摘要:解压缩hive安装包tar zxvf apache-hive-2.1.1-bin.tar.gz安装mysqlsudo yum install mysql-server安装 mysql connectorsudo yum install mysql-connector-java该命令会在/usr/sh 阅读全文
posted @ 2017-06-14 22:22 Super_Orco 阅读(1680) 评论(0) 推荐(0)
摘要:概述 hive 是一个包裹着 hdfs 的壳子,hive 通过 hql,将 sql 翻译成 MR ,进行数据查询。 Hive是⼀个构建在Hadoop之上的数据仓库 hive的数据存在hdfs上,元信息放在metastore中,metastore也放在hdfs上 和传统的数据仓库⼀样,主要⽤来访问和管 阅读全文
posted @ 2017-05-23 13:45 Super_Orco 阅读(394) 评论(0) 推荐(0)