摘要: hadoop分布式搭建 一、首先是搞好master 1、创建用户组 groupadd hadoop 添加一个组 useradd hadoop -g hadoop 添加用户 2、jdk的安装 这里安装的版本是jdk-7u9-linux-i586.tar.gz ,使用 tar -zsvf jdk-7u9 阅读全文
posted @ 2017-07-10 12:44 成长路上的。。。。 阅读(202) 评论(0) 推荐(0)
摘要: 类似于Oracle的分析表,Hive中也提供了分析表和分区的功能,通过自动和手动分析Hive表,将Hive表的一些统计信息存储到元数据中。 表和分区的统计信息主要包括:行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等; 新表的统计信息 对于一个新创建的表,默认情况下,如果通过INSERT 阅读全文
posted @ 2017-07-10 12:42 成长路上的。。。。 阅读(6002) 评论(1) 推荐(0)
摘要: 一、基本架构 YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。 其中ResourceManager负责整个系统的资源管 阅读全文
posted @ 2017-07-10 12:38 成长路上的。。。。 阅读(253) 评论(0) 推荐(0)
摘要: 这篇文章解释了Java 虚拟机(JVM)的内部架构。下图显示了遵守 Java SE 7 规范的典型的 JVM 核心内部组件。 上图显示的组件分两个章节解释。第一章讨论针对每个线程创建的组件,第二章节讨论了线程无关组件。 线程 JVM 系统线程 每个线程相关的 程序计数器 栈 本地栈 栈限制 栈帧 局 阅读全文
posted @ 2017-07-10 12:33 成长路上的。。。。 阅读(838) 评论(0) 推荐(0)