ChavinKing - 博客园

2017年4月

摘要：一、YARN基本服务组件 YARN是Hadoop 2.0中的资源管理系统，它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务：一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系阅读全文

posted @ 2017-04-20 11:53 ChavinKing 阅读(36600) 评论(1) 推荐(8)

HDFS文件上传

摘要：下图描述了Client向HDFS上传一个200M大小的日志文件的大致过程： 1）首先，Client发起文件上传请求，即通过RPC与NameNode建立通讯。 2）NameNode与各DataNode使用心跳机制来获取DataNode信息。NameNode收到Client请求后，获取DataNode信阅读全文

posted @ 2017-04-20 00:04 ChavinKing 阅读(2094) 评论(0) 推荐(0)

HDFS Namenode启动过程

摘要： Namenode保存文件系统元数据镜像，namenode在内存及磁盘（fsimage和editslog）上分别存在一份元数据镜像文件，内存中元数据镜像保证了hdfs文件系统文件访问效率，磁盘上的元数据镜像保证了hdfs文件系统的安全性。 namenode在磁盘上的两类文件组成： fsimage文件：阅读全文

posted @ 2017-04-19 23:57 ChavinKing 阅读(5130) 评论(0) 推荐(1)

Linux下搭建hadoop开发环境-超详细

摘要：先决条件：开发机器需要联网已安装java 已安装Desktop组 1、上传安装软件到linux上： 2、安装maven，用于管理项目依赖包：以hadoop用户安装apache-maven-3.0.5-bin.zip。 --解压安装文件到相应目录下： [root@db07 opt]# chown - 阅读全文

posted @ 2017-04-19 15:14 ChavinKing 阅读(15385) 评论(0) 推荐(0)

HDFS架构详解-非官档

摘要： Namenode 1、namenode是一个中心服务器，单一节点（简化系统的设计和实现），负责管理文件系统的命名空间（namespace）以及客户端对文件的访问。 2、文件操作：namenode负责对元数据的操作，datanode负责处理文件内容的读取请求，跟文件内容相关的数据流读取操作不会经过na 阅读全文

posted @ 2017-04-19 11:40 ChavinKing 阅读(323) 评论(0) 推荐(0)

SSH免密码登录配置方法详解

摘要： 1、测试主机配置信息： 192.168.100.236 db06.chavin.king db06 192.168.100.237 db07.chavin.king db07 2、创建测试用户： groupadd chavin useradd -g chavin chavin echo “chavi 阅读全文

posted @ 2017-04-19 10:32 ChavinKing 阅读(653) 评论(0) 推荐(0)

bin/hdfs dfs命令存在WARN util.NativeCodeLoader问题消除方法

摘要：例如：[hadoop@db01 hadoop-2.5.0]$ bin/hdfs dfs -ls17/03/01 21:50:33 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... 阅读全文

posted @ 2017-04-19 00:46 ChavinKing 阅读(431) 评论(0) 推荐(0)

hadoop（角色）各个组件配置信息

摘要： 1）namenode： core-site.xml文件中决定： <property> <name>fs.defaultFS</name> <value>hdfs://chavin.king:9000</value> </property> 2）secondarynamenode： hdfs-site 阅读全文

posted @ 2017-04-19 00:44 ChavinKing 阅读(448) 评论(1) 推荐(0)

hadoop的两类配置文件及3种启动/关闭方式

摘要： hadoop配置文件默认配置文件：四个模块相对应的jar包中：$HADOOP_HOME/share/hadoop *core-default.xml *hdfs-default.xml *yarn-default.xml *mapred-default.xml 用户自定义配置文件：$HADOOP_ 阅读全文

posted @ 2017-04-19 00:42 ChavinKing 阅读(696) 评论(0) 推荐(0)

hdfs启用垃圾站功能

摘要：在core-site.xml文件中添加如下内容： ##开启回收站功能，设置保存7天删除数据信息 <property> <name>fs.trash.interval</name> <value>70000</value> </property> 重启hdfs守护进程生效： sbin/hadoop-d 阅读全文

posted @ 2017-04-19 00:41 ChavinKing 阅读(459) 评论(0) 推荐(0)

启用yarn日志聚集功能

摘要：在yarn-site.xml配置文件中添加如下内容： ##开启日志聚集功能 <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property>##日志保存7天（单位秒） <property> <nam 阅读全文

posted @ 2017-04-19 00:40 ChavinKing 阅读(685) 评论(0) 推荐(0)

启用mapredure历史服务器方法

摘要：在mapred-site.xml配置文件中添加如下信息： <property> <name>mapreduce.jobhistory.address</name> <value>chavin.king:10020</value> </property> <property> <name>mapred 阅读全文

posted @ 2017-04-19 00:39 ChavinKing 阅读(356) 评论(0) 推荐(0)

Hadoop Single Node Setup（hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3）

摘要： Purpose（目标） This document describes how to set up and configure a single-node Hadoop installation so that you can quickly perform simple operations us 阅读全文

posted @ 2017-04-18 18:56 ChavinKing 阅读(719) 评论(0) 推荐(0)

ResourceManager High Availability

摘要： Introduction This guide provides an overview of High Availability of YARN’s ResourceManager, and details how to configure and use this feature. The Re 阅读全文

posted @ 2017-04-18 15:41 ChavinKing 阅读(596) 评论(0) 推荐(0)

YARN Architecture

摘要： The fundamental idea of YARN is to split up the functionalities of resource management and job scheduling/monitoring into separate daemons. The idea i 阅读全文

posted @ 2017-04-18 15:12 ChavinKing 阅读(229) 评论(0) 推荐(0)

公告