摘要: 第1章 Hive基本概念 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序 1)Hive处理的数据存储在 阅读全文
posted @ 2019-03-04 13:54 多弗朗明哥 阅读(1502) 评论(0) 推荐(0) 编辑
摘要: 第1章 Zookeeper入门 1.1 概述 Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。 1.2 特点 1.3 数据结构 1.4 应用场景 提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。 1.5 下载地址 1. 阅读全文
posted @ 2019-03-04 11:20 多弗朗明哥 阅读(433) 评论(0) 推荐(0) 编辑