Hadoop本地安装

安装JDK

卸载已经安装的JDK

  1. rpm -qa|grep jdk
  2. rpm -qa|grep gcj
  3. yum -y remove java java-1.4.2.......115

安装sun公司的JDK

  1. 解压jdk-6u24-linux-i586.bin文件到/opt/modules/下。解压完成后会出现一个jdk1.6.0_24的文件夹
  1. ./jdk-6u24-linux-i586.bin
  1. 配置环境变量:vi /etc/profile
    在最后一行增加如下内容
  1. # JAVA_HOME
  2. export JAVA_HOME=/opt/modules/jdk1.6.0_24
  3. export PATH=$JAVA_HOME/bin:$PATH
  4. export CLASS_PATH=.:$JAVA_HOME/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

安装Hadoop(本地方式)

解压并安装

  1. 解压hadoop-1.1.2.tar.gz到/opt/modules/下。解压完成后会出现一个hadoop-1.1.2的文件夹
  1. tar -zxvf hadoop-1.1.2.tar.gz
  1. 配置环境变量:vi /etc/profile
    在最后一行增加如下内容
  1. # HADOOP_HOME
  2. export HADOOP_HOME=/opt/modules/hadoop-1.1.2
  3. export PATH=$PATH:$HADOOP_HOME/bin

启动测试程序

拷贝hadoop_home/conf/*.xml文件到/opt/data/input目录下

  1. cp /opt/modules/hadoop-1.1.2/conf/*.xml /opt/data/input/

运行如下代码
必须存在:/opt/data/input
必须不存在:/opt/data/output/

  1. hadoop jar hadoop-examples-1.1.2.jar grep /opt/data/input /opt/data/output/ 'dfs[a-z.]+'

查看/opt/data/output/目录下内容
会出现两个文件part-00000和_SUCCESS
其中_SUCCESS是空的,而part-00000文件中只有如下一行内容

  1. 1 dfsadmin




posted @ 2016-04-29 14:19  Python魔法师  阅读(871)  评论(0编辑  收藏  举报