01 2017 档案
摘要:=========================================================================== 第2章 Hive数据的导入 使用Load语句执行数据的导入: LOAD 导入语句到数据仓库的表当中。 load data [local] inpath 'filepath' [overwrite] into table tablename [p...
阅读全文
摘要:Hive中的自定义函数简介 (1) 在类中创建自定义函数。自定义UDF需要继承'org.apache.hadoop.hive.ql.exec.UDF',实现evaluate函数,evaluate函数支持重载。 (2) 将该类所在的包导出成jar包,放入linux目录下。 (3) 进入hive客户端,
阅读全文
摘要:启动远程客户端 # hive --service hiveserver2获取连接-〉创建运行环境-〉执行HQL-〉处理结果-〉释放资源 工具类 1 package demo.utils; 2 3 import java.sql.Connection; 4 import java.sql.Driver
阅读全文
摘要:缺少slf4j-api.jar和slf4j-log4j12.jar这两个jar包导致的错误。
阅读全文
摘要:error: resolve: url->change hive to hive2 before: after:
阅读全文
摘要:- 集合中如果含null数据,不可使用not in, 可以使用in- hive只支持where和from子句中的子查询- 主查询和自查询可以不是同一张表
阅读全文
摘要:等值连接 不等值连接 外连接(取交集) (右外连接) 自连接
阅读全文
摘要:Hive数学函数 round : 四舍五入 ceil : 向下取整 floor : 向上取整 Hive字符函数 Hive收集函数和转换函数 Hive日期函数 Hive条件函数 Hive聚合函数和表生成函数
阅读全文
摘要:简单查询和fetch task 简单查询: 简单查询的 fetch task 功能,从HDFS拉取,不用map reduce. 前两种配置,当前session有效。修改hive-site.xml永久有效。 查询中使用过滤 在查询中使用排序 排序使用别名时要开启使用别名模式:set hive.grou
阅读全文
摘要:使用Load语句执行数据的导入 语法: explain: local是从本地导入,无local则默认从HDFS导入,overwrite是否覆盖表中存在的数据。 本地:导入本地一个文件 导入本地一个目录下的文件,覆盖原有数据 导入HDFS文件 使用Sqoop进行数据的导入 (1)下载: http://
阅读全文
摘要:体系结构: 元数据 /HQL的执行安装: 嵌入 /远程 /本地管理: CLI /web界面 /远程服务数据类型: 基本 /复杂 /时间数据模型: 数据存储 /内部表 /分区表 /外部表 /桶表 /视图
阅读全文
摘要:- 视图是一种虚表,是一个逻辑概念;可以跨越多张表- 视图建立在已有表的基础上,视图赖以建立的这些表称为基表。- 视图可以简化复杂的查询。 创建视图 查看视图结构 查询视图
阅读全文
摘要:对数据进行HASH运算,放在不同文件中,降低热块,提高查询速度。 例如:根据sname进行hash运算存入5个桶中。 create table bucket_table(sid int, sname string, age int)clustered by (sname) into 5 bucket
阅读全文
摘要:Hive的数据模型之外部表 外部表(External Table)- 指向已经在HDFS中存在的数据,可以创建Partition- 它和内部表在元数据的组织上是相同的,而实际数据的存储则有较大的差异。- 外部表侄有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数据建立一个
阅读全文
摘要:Hive的数据模型之分区表 准备数据表: 准备文本数据: 将文本数据插入到数据表: -partition对应于数据库中的Partition 列的密集索引 -在Hive中,表中的一个Partition对应于表下的一个目录,所有的Partition的数据都存储在对应的目录中。 创建分区表: 向分区表中插
阅读全文
摘要:Hive的数据模型_内部表 - 与数据库中的Table在概念上是类似。- 每一个Table在Hive中都有一个相应的目录存储数据。- 所有的Table数据(不包括External Table)都保存在这个目录中。 if open the recycle bin function of hdfs .
阅读全文
摘要:Hive的数据模型_数据存储 web管理工具察看HDFS文件系统:http://<IP>:50070/ 基于HDFS没有专门的数据存储格式,默认使用制表符存储结构主要包括:数据库,文件,表,视图可以直接加载文本文件创建表时,可以指定Hive数据的列分隔符和行分隔符。 Hive数据模型表:-Table
阅读全文
摘要:嵌入模式不推荐使用。 本地模式多用于开发和测试。 远程模式多用于生产环境。
阅读全文
摘要:元数据: HQL的执行过程 ORACEL 执行计划,Hive 类似。 无索引时,生成全表扫描执行计划,执行全表扫描。 创建索引后,重新生成SQL语句执行计划,基于索引扫描,提高查询效率。
阅读全文
摘要:文章摘自 : http://www.imooc.com/video/7573 Hive是建立在Hadoop HDFS上的数据仓库基础架构。Hive可以用来进行数据的ETL。Hive定义了简单的类似SQL的语言,称为HQL。 Hive 允许熟悉MapReduce的开发者去开发自定义的mapper和re
阅读全文
摘要:远程服务启动方式 - 端口号10000 - 启动方式: #hive --service hiveserver & 以JDBC或ODBC的程序登陆到hive中操作数据时,必须选用远程服务启动方式,否则连接不上。
阅读全文
摘要:端口:9999启动方式: hive --service hwi &通过浏览器访问:http://<IP地址>:9999/hwi/ 执行启动命令后,报错,找不到hive-hwi-*.war。 解决方案: (1)下载hive源码文件 可以下载hive-bin.tar对应版本的hive-src.tar,解
阅读全文
摘要:Hive的启动方式- CLI- Web UI- 远程服务启动方式 (1)hive命令行的交互模式,进入hive: (2)不进入hive的交互模式,在操作系统的提示符下进行操作: (3)退出hive: (4)清屏: (5)函数: (6)查看表结构: (7)查看HDFS上的文件: (8)递归查看目录结构
阅读全文
摘要:Hive Complex Data Type: Array: Map: Combine: Struct: Hive Date Data Type:
阅读全文
摘要:jasper crosstab header use filed value as part of crosstab via pass parameter in crosstab
阅读全文
摘要:(1) text field (2) crosstab (3) table
阅读全文
摘要:1、 Build Linux env my env is VM RedHat Linux 6.5 64bit set fixed IP vim /etc/sysconfig/network-scripts/ifcfg-eth0 set IP to : 192.168.38.128 modify ho
阅读全文
摘要:作者:潇湘隐者 出处:http://www.cnblogs.com/kerrycode/ 1:echo $JAVA_HOME 使用$JAVA_HOME的话能定位JDK的安装路径的前提是配置了环境变量$JAVA_HOME,否则如下所示,根本定位不到JDK的安装路径 [root@localhost ~]
阅读全文

浙公网安备 33010602011771号