(转载) Hadoop科普文——常见的45个问题解答
摘要:1.Hadoop集群可以运行的3个模式?单机(本地)模式伪分布式模式全分布式模式2.单机(本地)模式中的注意点?在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序,这也是最少使用的一个模式。3.伪分布模式中的注意点?伪分布式(Pseudo)适用于开发和测试环境,在这个模式中,所有守护进程都在同一台机器上运行。4.VM是否可以称为Pseudo?不是,两个事物,同时Pseudo只针对Hadoop。5.全分布模式又有什么注意点?全分布模式通常被用于生产环境,这里我们使用N台主
阅读全文
MapReduce程序--成绩统计
摘要:1 package cn.edu.ruc.cloudcomputing.book.chapter04; 2 3 import java.io.IOException; 4 import java.util.*; 5 6 import org.apache.hadoop.fs.Path; 7 import org.apache.hadoop.conf.*; 8 import org.apache.hadoop.io.*; 9 import org.apache.hadoop.mapreduce.*;10 import org.apache.hadoop.mapreduce.lib.inpu...
阅读全文
eclipse hadoop开发环境配置
摘要:http://blog.csdn.net/cybercode/article/details/7084603
阅读全文