会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
yuerspring
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
25
26
27
28
29
30
31
32
33
34
下一页
2016年6月2日
PageRank 理解
摘要: 在用Mapreduce 重写PageRank 的时候,每个页面的初始值 为 pr =1 ,每循环一次(map & reduce) 后 ,每个页面会得到一个新的page rank 值 ,在进行一次新的迭代,直到 收敛于一个值 ,不再变化 。第一列代表链出 ,其他...
阅读全文
posted @ 2016-06-02 09:12 yuerspring
阅读(220)
评论(0)
推荐(0)
2016年5月29日
eror---at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.init
摘要: 2016-05-29 23:00:09,532 WARN [Thread-12] mapred.LocalJobRunner (LocalJobRunner.java:run(560)) - job_local1841304029_0001java.lang.Exc...
阅读全文
posted @ 2016-05-29 23:06 yuerspring
阅读(671)
评论(0)
推荐(0)
2016年5月28日
hadoop jar wc.jar com.map.red.job.WordCountJob
摘要: [root@bigdataspark ~]# hadoop jar wc.jar com.map.red.job.WordCountJob16/05/22 19:20:24 WARN mapreduce.JobSubmitter: Hadoop command-lin...
阅读全文
posted @ 2016-05-28 13:16 yuerspring
阅读(417)
评论(0)
推荐(0)
2016年5月27日
mapreduce运行机制
摘要: mapreduce运行机制,这些按照时间顺序包括:输入分片(input split)、map阶段、combiner阶段、shuffle阶段和reduce阶段。partition 是一定有的,只是个数从1 到 ncombiner 是可以定义的1. 输入分片(input ...
阅读全文
posted @ 2016-05-27 18:01 yuerspring
阅读(262)
评论(0)
推荐(0)
通过http 协议 可以访问 Hadoop 50070 端口,hadoop 里面配置的servlet 是什么容器呢 ?
摘要: Jetty 是一个开源的servlet容器,它为基于Java的web容器,例如JSP和servlet提供运行环境。Jetty是使用Java语言编写的,它的API以一组JAR包的形式发布。开发人员可以将Jetty容器实例化成一个对象,可以迅速为一些独立运行(stand-...
阅读全文
posted @ 2016-05-27 15:50 yuerspring
阅读(235)
评论(0)
推荐(0)
2016年5月23日
HDFS 高可用,hdfs-site.xml 配置及说明,更详细参考官网
摘要: dfs.replication 3 dfs.nameservices mycluster dfs.ha.namenodes.mycluster nn1,nn2 dfs.namenode.rpc-addres...
阅读全文
posted @ 2016-05-23 17:03 yuerspring
阅读(822)
评论(0)
推荐(0)
yarn-site.xml and mapred-site.xml 配置以及属性说明
摘要: //启用yarn 作为资源管理框架 mapreduce.framework.name yarn //启用高可用 yarn.resourcemanager.ha.enabled true // 定义集群的名称 ya...
阅读全文
posted @ 2016-05-23 15:45 yuerspring
阅读(596)
评论(0)
推荐(0)
2016年5月20日
Spark 源码剖析
摘要: Spark 源码剖析
阅读全文
posted @ 2016-05-20 16:15 yuerspring
阅读(75)
评论(0)
推荐(0)
window eclipse 访问远程虚拟机 Hdfs
摘要: package com.ibm.w3;import java.net.URI;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;impor...
阅读全文
posted @ 2016-05-20 09:08 yuerspring
阅读(363)
评论(0)
推荐(0)
hadoop的伪分布环境配置(2.5.2)
摘要: /hadoop/etc/hadoop/Eclipse :: http://my.oschina.net/lanzp/blog/309078?fromerr=blt5oYkFcore-site.xmlhadoop.tmp.dir/usr/local/hadoop/...
阅读全文
posted @ 2016-05-20 07:18 yuerspring
阅读(240)
评论(0)
推荐(0)
上一页
1
···
25
26
27
28
29
30
31
32
33
34
下一页
公告