Fork me on GitHub
摘要: Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hive分析数据底层的实现是Ma 阅读全文
posted @ 2019-02-13 23:44 kris12 阅读(897) 评论(0) 推荐(0)
摘要: 1. HDFS-HA 在分布式文件系统 HDFS 中,NameNode 是 master 角色,当 NameNode 出现故障后,整个 HDFS 将不可用,所以保证 NameNode 的稳定性至关重要。在 Hadoop1.x 版本中,HDFS 只支持一个 NameNode,为了保证稳定性,只能靠 S 阅读全文
posted @ 2019-02-13 22:46 kris12 阅读(1018) 评论(0) 推荐(2)
levels of contents