会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
孟尧
前途宽广,贵在坚持
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
10
11
12
13
14
15
下一页
2013年2月5日
MapReduce的DBInputFormat使用
摘要: 1 package com.mengyao.hadoop.mapreduce; 2 3 import java.io.DataInput; 4 import java.io.DataOutput; 5 import java.io.IOException; 6 import java...
阅读全文
posted @ 2013-02-05 11:21 孟尧
阅读(899)
评论(1)
推荐(0)
2013年2月4日
MapReduce的WordCount
摘要: 1 package com.mengyao.hadoop.mapreduce; 2 3 import java.io.IOException; 4 5 import org.apache.hadoop.conf.Configuration; 6 import org.apache....
阅读全文
posted @ 2013-02-04 19:38 孟尧
阅读(440)
评论(1)
推荐(0)
hadoop使用yarn运行mapreduce的过程
摘要: 如图: 1、客户端提交MapReduce Job到YARN ResourceManager获取新的作业ID。 2、YARN ResourceManager返回给客户端一个应用程序ID,即JobID和存储作业资源的路径。 3、客户端检查作业的输出说明计算输入分片,并将作业的资源即作业Jar包、配置、输...
阅读全文
posted @ 2013-02-04 18:19 孟尧
阅读(621)
评论(0)
推荐(0)
2013年2月3日
MapReduce工作流程详解
摘要: MapReduce执行步骤如下 1、Mapper任务处理 1.1:读取输入文件内容,将每一行解析成key、value对提供给Mapper类的map函数使用,每个键值对调用一次map函数。 1.2:在Mapper类的map函数中使用自定义的业务逻辑,对输入key、value处理并转换成新的...
阅读全文
posted @ 2013-02-03 21:53 孟尧
阅读(1537)
评论(0)
推荐(0)
Hadoop的SequenceFile读写实例
摘要: 1 SequenceFile可以处理hdfs上大量小文件,它可以作为大量小文件的容器。HDFS和MapReduce是针对大文件优化的,所以通过SequenceFile类型将小文件包装起来可以获得更高效的存储和处理。存储 2 在SequenceFile中的键和值并不一定是Writable类型...
阅读全文
posted @ 2013-02-03 10:41 孟尧
阅读(696)
评论(0)
推荐(0)
Hadoop的SequenceFile读实例
摘要: 1 package com.mengyao.hadoop.hdfs; 2 3 import java.io.IOException; 4 5 import org.apache.hadoop.conf.Configuration; 6 import org.apache.hadoop.fs.P...
阅读全文
posted @ 2013-02-03 10:17 孟尧
阅读(411)
评论(1)
推荐(0)
Hadoop的SequenceFile写实例
摘要: 1 package com.mengyao.hadoop.hdfs; 2 3 import java.io.File; 4 import java.io.IOException; 5 6 import org.apache.commons.io.FileUtils; 7 import org....
阅读全文
posted @ 2013-02-03 10:06 孟尧
阅读(702)
评论(1)
推荐(0)
2013年2月2日
HDFS NameNode与DataNode介绍
摘要: NameNode启动后,会在dfs.namenode.name.dir的值file://${hadoop.tmp.dir/}/dfs/name/本地文件系统下生成in_use.lock文件。该文件存在则为本机已启动NameNode进程。该文件内容是:进程号@主机名。表示已经在本机上启动了某个进程号...
阅读全文
posted @ 2013-02-02 09:57 孟尧
阅读(281)
评论(0)
推荐(0)
2013年2月1日
Hadoop简介
摘要: Hadoop包含四个主要模块 Hadoop Common:Hadoop提供了常见的实用程序库,用于支持其他Hadoop模块。 Hadoop Distributed File System,即HDFS:Hadoop的分布式文件系统,它提供了高吞吐量访问应用程序使用的数据。 Hadoop MapRedu...
阅读全文
posted @ 2013-02-01 11:51 孟尧
阅读(282)
评论(0)
推荐(0)
2012年7月17日
Spring的拦截器和监听器
摘要: 拦截器代码如下:package com.mengyao.shops.interceptor;import javax.servlet.http.HttpServletRequest;import javax.servlet.http.HttpServletResponse;import org.sl...
阅读全文
posted @ 2012-07-17 13:36 孟尧
阅读(165)
评论(0)
推荐(0)
上一页
1
···
10
11
12
13
14
15
下一页
公告