Hadoop的三种安装模式之伪分布模式

一、Google的基本思想
1、GFS
2、MapReduce：计算模型，进行大数据计算
问题的来源：PageRank（网页排名）
核心：先拆分，再合并

3、BigTable：大表，NoSQL数据库：HBase 基于HDFS之上的NoSQL数据库、列式数据库
表 ----> 目录
数据 ----> 文件
思想：通过牺牲存储的空间，来换取性能
把所有的数据存入一张表中，完全违背了关系型数据库范式的要求

二、Hadoop 2.X的安装与配置
习惯：SecureCRT
准备：1、安装Linux和JDK
2、关闭防火墙
3、配置主机名
解压：tar -zxvf hadoop-2.7.3.tar.gz -C ~/training/
设置环境变量：vi ~/.bash_profile
HADOOP_HOME=/root/training/hadoop-2.7.3
export HADOOP_HOME

PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export PATH
source ~/.bash_profile

三、Hadoop有三种安装模式
1、本地模式一台Linux
（）特点：没有HDFS，只能测试MapReduce程序（本地数据：Linux的文件）
（）配置：hadoop-env.sh
26行 export JAVA_HOME=/root/training/jdk1.8.0_144
（*）Demo：测试MapReduce程序
example: /root/training/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar
hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount ~/temp/data.txt ~/temp/mr/wc1

2、伪分布模式一台Linux
（）特点：在单机上，模拟一个分布式的环境，具备Hadoop的所有功能
（）hdfs-site.xml

dfs.replication
1

core-site.xml

fs.defaultFS
hdfs://bigdata11:9000

hadoop.tmp.dir
/root/training/hadoop-2.7.3/tmp

mapred-site.xml

mapreduce.framework.name
yarn

yarn-site.xml

yarn.resourcemanager.hostname
bigdata11

yarn.nodemanager.aux-services
mapreduce_shuffle

对NameNode进行格式化: hdfs namenode -format
日志：Storage directory /root/training/hadoop-2.7.3/tmp/dfs/name has been successfully formatted.

启动：start-all.sh = start-dfs.sh + start-yarn.sh

（*）Demo：测试MapReduce程序
example: /root/training/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar
hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input/data.txt /output/wc1204

3、全分布模式三台Linux
（*）特点：真正的分布式环境，用于生产

posted @ 2018-02-09 15:06 好奇的小码农阅读(1225) 评论(0) 收藏举报

刷新页面返回顶部

好奇的小码农

Hadoop的三种安装模式之伪分布模式

公告