2013 年 1月 30 日随笔档案 - imkun

命令行运行hadoop实例wordcount程序

摘要： http://blog.csdn.net/xw13106209/article/details/6862480需要说明的有以下几点。1.如果wordcount程序不含层次，即没有package那么使用如下命令：[cpp]view plaincopyhadoopjarwordcount.jarWordCount2/home/hadoop/input/20418.txt/home/hadoop/output/wordcount2-6该命令行的意思大致是：执行hadoop 程序，该程序在wordcount.jar中。该wordcount.jar包含以下几个class文件，分别是WordCount.j 阅读全文

posted @ 2013-01-30 12:41 imkun 阅读(1452) 评论(0) 推荐(0) 编辑

hadoop实例WordCount程序一步一步运行

摘要： http://www.cnblogs.com/flying5/archive/2011/05/04/2078408.html虽说现在用Eclipse下开发hadoop程序很方便了，但是命令行方式对于小程序开发验证很方便。这是初学hadoop时的笔记，记录下来以备查。 1. 经典的WordCound程序（WordCount.java），可参见hadoop0.18文档import java.io.IOException;import java.util.ArrayList;import java.util.Iterator;import java.util.List;import java.ut. 阅读全文

posted @ 2013-01-30 12:39 imkun 阅读(477) 评论(0) 推荐(0) 编辑

用 Hadoop 进行分布式并行编程

摘要： https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/前言在上一篇文章：“用 Hadoop 进行分布式并行编程第一部分基本概念与安装部署”中，介绍了 MapReduce 计算模型，分布式文件系统 HDFS，分布式并行计算等的基本原理, 并且详细介绍了如何安装 Hadoop，如何运行基于 Hadoop 的并行程序。在本文中，将针对一个具体的计算任务，介绍如何基于 Hadoop 编写并行程序，如何使用 IBM 开发的 Hadoop Eclipse plugin 在 Eclipse 环境中编译并运行程序。回页首分析 Word 阅读全文

posted @ 2013-01-30 12:36 imkun 阅读(1441) 评论(0) 推荐(0) 编辑

Hadoop建立Cluster实例

摘要：原文地址：http://book.51cto.com/art/201211/363795.htmqueue的有效性很依赖在JobTracker中通过mapreduce.jobtracker.taskscheduler设置的调度规则（scheduler）。一些调度算法可能只需要一个queue，不过有些调度算法可能很复杂，需要设置很多queue。对queue大部分设置的更改都不需要重新启动MapReduce系统就可以生效，不过也有一些更改需要重启系统才能有效，具体如表2-5所示。conf/mapred-queues.xml的文件配置与其他文件略有不同，配置格式如下：<queues aclsE 阅读全文

posted @ 2013-01-30 10:18 imkun 阅读(675) 评论(0) 推荐(0) 编辑

孜孜求知

命令行运行hadoop实例wordcount程序

hadoop实例WordCount程序一步一步运行

用 Hadoop 进行分布式并行编程

Hadoop建立Cluster实例

导航

公告