centos7安装hadoop2.2.0集群-环境准备

虽然接触hadoop已经有一段时间,但是一直没有做记录,趁熟悉做一下笔记,也好在以后的工作中能够参考一下。

首先简单介绍一下Hadoop,Hadoop是一个开源的分布式计算平台,以HDFS、MapReduce为核心。

一个Hadoop集群由一个NameNode和若干个DataNode组成,其中NameNode负责管理文件系统的命名空间及客户端对文件系统的访问,DataNode管理存储的数据。

MapReduce是由一个运行在主节点的JobTracker及运行在集群每个从节点的TaskTracker组成的。

一、安装hadoop之前,首先准备几个节点,我的环境是两台机器,每台机器装了一个vmware,在vmware里又装了centos7系统,一个主节点、一个从节点:

hadoop-master 192.168.1.105

hadoop-slave 192.168.1.104

二、配置机器名称:

查看当前主机名称:输入hostname命令

修改主机名称:vi /etc/sysconfig/network,修改HOSTNAME变量值,然后保存即可

三、设置静态IP:

vi /etc/sysconfig/network-scripts/ifcfg-eth0,修改内容如下:

BOOTPROTO=static

ONBOOT=yes(系统启动的时候网络接口是否有效)

IPADDR=192.168.1.105
NETMASK=255.255.255.0(子网掩码)
GATEWAY=192.168.1.1(网关)
DNS1=192.168.1.1(DNS服务器,连接网络)

四、设置hosts:

vi /etc/hosts,添加如下内容:

192.168.1.105 hadoop-master
192.168.1.104 hadoop-slave

五、重启网络:

service network restart

六、配置SSH无密码登录:

由于hadoop启动后,namenode是通过SSH来启动和停止datanode上的守护进程的,所以namenode需要SSH无密码登录并启动datanode进程,同理,datanode也需要无密码登录到namenode节点。

首先可先查看ssh是否已经安装:

rpm –qa | grep openssh

rpm –qa | grep rsync

使用rpm安装:

yum install ssh 安装SSH协议

yum install rsync (rsync是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件)

service sshd restart 启动服务

(1)首先设置master到slave的无密码登录:

ssh-keygen –t rsa –P ''(一路回车)

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

service sshd restart重启服务

scp ~/.ssh/id_rsa.pub root@192.168.1.104:~/将id_rsa.pub文件拷贝到slave节点

在slave节点上执行以下操作:

cat ~/id_rsa.pub >> ~/.ssh/authorized_keys

删除id_rsa.pub文件

以上完成master到slave的无密码登录,可使用ssh hadoop-slave测试

slave节点到主节点的无密码链接操作与上述方法一样,再反过来操作一遍。

 

以上6部操作完成了安装hadoop集群钱的环境准备,下面会继续介绍软件的安装。

 

posted @ 2015-08-18 14:47  风儿飞  阅读(499)  评论(2编辑  收藏  举报