随笔分类 - Big Data
学习大数据技术的记录和感悟
摘要:WordCount是hadoop里hello word级的第一个程序,作为一个萌新,我也来跑一跑这个,附带针对新人的说明。 所谓WordCount,就是统计一个或几个文档中相同的单词各有多少个。 首先要有关于MapReduce的基础,用我自己通俗的话来说一下,MapReduce是一个用来计算大型数据
阅读全文
摘要:一.NameNode,SeconderyNamenode,DataNode NameNode,DataNode,SeconderyNamenode都是进程,运行在节点上。 1.NameNode:hadoop的主节点, 保存HDFS的元数据信息 1.fsimage - 它是在NameNode启动时对整
阅读全文
摘要:本次基于Hadoop2.6版本进行分布式配置,Linux系统是基于CentOS6.5 64位的版本。在此设置一个主节点和两个从节点。 准备3台虚拟机,分别为: 主机名 IP地址 master 192.168.80.10 slave1 192.168.80.11 slave2 192.168.80.1
阅读全文
摘要:首先先不看理论,搭建起环境之后再看; 搭建伪分布式是为了模拟环境,调试方便。 电脑是win10,用的虚拟机VMware Workstation 12 Pro,跑的Linux系统是centos6.5 ,装的hadoop2.6.0,jdk1.8; 1.准备工作 准备工作:把JDK和Hadoop安装包上传
阅读全文

浙公网安备 33010602011771号