随笔分类 -  Hive

摘要:第11章 常见错误及解决方案 1)SecureCRT 7.3出现乱码或者删除不掉数据,免安装版的SecureCRT 卸载或者用虚拟机直接操作或者换安装版的SecureCRT 2)连接不上mysql数据库 (1)导错驱动包,应该把mysql-connector-java-5.1.27-bin.jar导 阅读全文
posted @ 2019-06-06 01:13 LXL_1 阅读(1241) 评论(0) 推荐(0)
摘要:第10章 Hive实战之谷粒影音 10.1 需求描述 统计硅谷影音视频网站的常规指标,各种TopN指标: --统计视频观看数Top10 --统计视频类别热度Top10 --统计视频观看数Top20所属类别 --统计视频观看数Top50所关联视频的所属类别Rank --统计每个类别中的视频热度Top1 阅读全文
posted @ 2019-06-05 20:02 LXL_1 阅读(1690) 评论(0) 推荐(1)
摘要:第9章 企业级调优 9.1 Fetch抓取 Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。 在hive-de 阅读全文
posted @ 2019-06-05 03:56 LXL_1 阅读(216) 评论(0) 推荐(0)
摘要:第8章 压缩和存储 8.1 Hadoop源码编译支持Snappy压缩 8.1.1 资源准备 1.CentOS联网 配置CentOS能连接外网。Linux虚拟机ping www.baidu.com 是畅通的 注意:采用root角色编译,减少文件夹权限出现问题 2.jar包准备(hadoop源码、JDK 阅读全文
posted @ 2019-06-04 23:12 LXL_1 阅读(263) 评论(0) 推荐(0)
摘要:第7章 函数 7.1 系统内置函数 1.查看系统自带的函数 hive> show functions; 2.显示自带的函数的用法 hive> desc function upper; 3.详细显示自带的函数的用法 hive> desc function extended upper; 7.2 自定义 阅读全文
posted @ 2019-06-02 21:23 LXL_1 阅读(164) 评论(0) 推荐(0)
摘要:第6章 查询 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select 查询语句语法: [WITH CommonTableExpression (, CommonTableExpression)*] (Note: O 阅读全文
posted @ 2019-06-01 18:40 LXL_1 阅读(428) 评论(0) 推荐(0)
摘要:第5章 DML数据操作 5.1 数据导入 5.1.1 向表中装载数据(Load) 1.语法 hive> load data [local] inpath ' /opt/.......' overwrite | into table student [partition (partcol1=val1, 阅读全文
posted @ 2019-06-01 15:36 LXL_1 阅读(203) 评论(0) 推荐(0)
摘要:第4章 DDL数据定义 4.1 创建数据库 1)创建一个数据库,数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; hive (default)> create database d 阅读全文
posted @ 2019-05-30 23:22 LXL_1 阅读(252) 评论(0) 推荐(0)
摘要:第3章 Hive数据类型 3.1 基本数据类型 表6-1 Hive数据类型 Java数据类型 长度 例子 TINYINT byte 1byte有符号整数 20 SMALINT short 2byte有符号整数 20 INT int 4byte有符号整数 20 BIGINT long 8byte有符号 阅读全文
posted @ 2019-05-30 22:21 LXL_1 阅读(262) 评论(0) 推荐(0)
摘要:第2章 Hive安装 2.1 Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.下载地址 http://arch 阅读全文
posted @ 2019-05-30 03:04 LXL_1 阅读(464) 评论(0) 推荐(0)
摘要:尚硅谷大数据技术之Hive 第1章 Hive入门 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序 1) 阅读全文
posted @ 2019-05-30 02:22 LXL_1 阅读(234) 评论(0) 推荐(0)