摘要:
1.概述 上一章《那些年使用Hive踩过的坑》介绍了Hive的基本架构及原理,加下来介绍Hive的基本操作和一些注意事项。 2.基本操作 2.1Create Table 2.1.1介绍 CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 IF NOT 阅读全文
posted @ 2017-08-08 10:55
张松任
阅读(283)
评论(0)
推荐(0)
摘要:
1.概述 上篇《高可用Hadoop平台-启航》博客已经让我们初步了解了Hadoop平台;接下来,我们对Hadoop做进一步的探索,一步一步的揭开Hadoop的神秘面纱。下面,我们开始赘述今天的探索之路。 2.探索 在探索之前,我们来看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到 阅读全文
posted @ 2017-08-08 10:55
张松任
阅读(117)
评论(0)
推荐(0)
摘要:
1.概述 最近有朋友问我Secondary NameNode的作用,是不是NameNode的备份?是不是为了防止NameNode的单点问题?确实,刚接触Hadoop,从字面上看,很容易会把Secondary NameNode当作备份节点;其实,这是一个误区,我们不能从字面来理解,阅读官方文档,我们可 阅读全文
posted @ 2017-08-08 10:55
张松任
阅读(287)
评论(0)
推荐(1)
摘要:
1.概述 继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍。 2.介绍 首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题。 job 阅读全文
posted @ 2017-08-08 10:54
张松任
阅读(225)
评论(0)
推荐(0)
摘要:
1.概述 这篇博客是接着《高可用Hadoop平台》系列讲,本篇博客是为后面用 Hive 来做数据统计做准备的,介绍如何在 Hadoop HA 平台下集成高可用的 Hive 工具,下面我打算分以下流程来赘述: 下面开始进行环境准备。 2.环境准备 Hive版本:《Hive-0.14》 HAProxy版 阅读全文
posted @ 2017-08-08 10:53
张松任
阅读(273)
评论(0)
推荐(0)

浙公网安备 33010602011771号