摘要: 1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会到同一... 阅读全文
posted @ 2018-01-22 20:37 柚子=_= 阅读(712) 评论(0) 推荐(0)
摘要: 在一些特定的业务场景下,使用hive默认的配置对数据进行分析,虽然默认的配置能够实现业务需求,但是分析效率可能会很低。Hive有针对性地对不同的查询进行了优化。在Hive里可以通过修改配置的方式进行优化。 以下... 阅读全文
posted @ 2018-01-22 20:32 柚子=_= 阅读(144) 评论(0) 推荐(0)
摘要: hive里的索引是什么? 索引是标准的数据库技术,hive 0.7版本之后支持索引。Hive提供有限的索引功能,这不像传统的关系型数据库那样有“键(key)”的概念,用户可以在某些列上创建索引来加速某些操作,给... 阅读全文
posted @ 2018-01-22 19:36 柚子=_= 阅读(374) 评论(0) 推荐(0)
摘要: 可以先,从MySQL里的视图概念理解入手 视图是由从数据库的基本表中选取出来的数据组成的逻辑窗口,与基本表不同,它是一个虚表。在数据库中,存放的只是视图的定义,而不存放视图包含的数据项,这些项目仍然... 阅读全文
posted @ 2018-01-22 17:26 柚子=_= 阅读(195) 评论(0) 推荐(0)
摘要: 为了对表进行合理的管理以及提高查询效率,Hive可以将表组织成“分区”。 分区是表的部分列的集合,可以为频繁使用的数据建立分区,这样查找分区中的数据时就不需要扫描全表,这对于提高查找效率很有帮助。 分区... 阅读全文
posted @ 2018-01-22 17:18 柚子=_= 阅读(532) 评论(0) 推荐(0)