随笔分类 - 大数据
摘要:1.图文件 2.执行流程 源代码:https://github.com/masterzjp/dijkstraMapreduce 3.mapper package com.hadoop.dijkstra; import java.io.IOException; import java.util.Arr
阅读全文
摘要:1.1 再次回顾Map阶段五大步骤 在第四篇博文《初识MapReduce》中,我们认识了MapReduce的八大步凑,其中在Map阶段总共五个步骤,如下图所示: 其中,step1.3就是一个分区操作。通过前面的学习我们知道Mapper最终处理的键值对<key, value>,是需要送到Reducer
阅读全文
摘要:一、 Mapper Mapper接口负责数据处理阶段,它采用的形式为Mapper<K1,V1,K2,V2>Java泛型,这里键类和值类分别实现WritableComparable和Writable接口。 Mapper只有一个方法—map,用于处理一个单独的键、值对。 Void map(K1key,V
阅读全文
摘要:1.源码解释 package org.apache.hadoop.examples;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;impo
阅读全文
摘要:刚接触mapreduce的编程时很是疑惑,map的<key,value>源源不断的到底是从哪里产生的,学习后才知道一切都源自main函数中的Inputformat函数,这个函数的目的就是将源数据切片,并将切片转变为<key,value>对,源源不断的供给给map,具体是Inputformat是一个抽
阅读全文
摘要:准备工作 1.下载hadoop2.5.2.tar.gz 2.下载hadoop-eclipse-plugin-2.5.2.jar插件。如果你的hadoop不是这个版本的,请自己动手编译插件,教程戳这 3.下载winutils.exe以及hadoop.dll (64位) 一、解压安装hadoop2.5.
阅读全文
摘要:一.使用VMvare创建两个虚拟机,我使用的是ubuntu17版本的,并关闭全部虚拟机的防火墙 1.我们把用于主节点的虚拟机名称设为master(按自己的喜好创建),把用于从节点的虚拟机名称设为slave1 修改主机名的命令:sudo vim /etc/hostname 把原主机名ubuntu改为m
阅读全文
摘要:sbin/start-dfs.sh jps bin/hdfs dfs -ls / bin/hadoop dfsadmin -safemode leave 关闭安全模式//在HDFS上创建输入文件夹bin/hadoop fs -mkdir /data/wordcount //上传本地/home/zjp
阅读全文
摘要:一. Ubuntu Java8 的安装 添加ppa sudo add-apt-repository ppa:webupd8team/java sudo apt-get update 安装oracle-java-installer sudo apt-get install oracle-java8-i
阅读全文

浙公网安备 33010602011771号