Ailin1017

2020年12月24日

摘要：一：分区表 Hive中的表对应HDFS上的指定目录，在查询数据的时候，默认会对全表进行扫描，这样的话时间和性能消耗都非常大分区对应HDFS上表目录的子目录数据按照分区存在在子目录中，如果查询的 where 字句的中包含分区条件，则直接从该分区去查找，而不是扫描整个表目录，合理的分区设计可以极大提阅读全文

posted @ 2020-12-24 15:38 Ailin1017 阅读(309) 评论(0) 推荐(0)

HIVE（二）Hive基本SQL操作

摘要：一：Hive DDL 1. 数据库的基本操作 1.1 查看数据库列表 show databases; 1.2 使用数据库 use databse_name; 1.3 新建数据库 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name --DATA 阅读全文

posted @ 2020-12-24 15:08 Ailin1017 阅读(364) 评论(0) 推荐(0)

HIVE（一）Hive初识

摘要：一：Hive简介 Hive是构建在hadoop上的数据仓库，可以把结构化的数据文件映射成表，并提供SQL查询功能，用于查询的SQL语句会被转成MapReduce 任务提交到hadoop上运行。 Hive出现的原因？面对海量数据的分析hadoop是个好东西，但是学习成本比较高，难度大，需要使用人员得阅读全文

posted @ 2020-12-24 14:12 Ailin1017 阅读(134) 评论(0) 推荐(0)

公告