摘要:
一、环境1、hadoop 0.20.22、操作系统Linux二、背景1、最近写MR的代码,总在想统计一些错误的数据出现的次数,发现如果都写在reduce的输出里太难看了,所以想找办法专门输出一些统计数字。2、翻看《hadoop权威指南》第8章第1节的时候发现能够自定义计数器,但都是基于0.19版本写的,好多函数都不对,改动相对较大。3、基于上面2个理由,写个文档,记录一下。三、实现1、前提:写入一个文件,规范的是3个字段,“/t”划分,有2条异常,一条是2个字段,一条是4个字段,内容如下:jim 1 28 kate 0 26 tom 1 kaka ... 阅读全文
阅读排行榜
[置顶] 有多大的概率会迟到?
2012-12-28 16:03 by java20130722, 243 阅读, 收藏,
摘要:
小A在早上去教研室的路上,看到了胡博,大叫了一声“混蛋!(胡博的绰号)”。胡博回过头,还看到了小B和小C。胡博还在慢悠悠的走,小A就说:“胡博,你看到我们三个走在一起,你还不走快点儿,不怕迟到么?”好吧,我就是小A。谢天谢地,今天没有迟到。我坐在位置上的时候,就在想刚才发生的事,我告诉胡博,他同时看见了我,小B和小C就应该走快点儿,是对的吗?那他又有多大的可能会迟到呢?假设小A、小B、小C每天早上迟到的概率都是80%(他们不会商量着一起走),,,如果今天早上小Y在路上同时碰到了小A、小B和小C,,,那小Y可能有多大的概率会迟到,,,我把这个发成了一条微博,不出意外,答案五花八门,有的说跟80% 阅读全文
PageRank算法概述
2013-06-09 23:25 by java20130722, 242 阅读, 收藏,
摘要:
读书报告,转载请标明出处http://blog.csdn.net/wzhg0508/article/details/9068849 阅读全文
[置顶] 不写周报才是一件很嘻哈的事
2012-09-17 09:31 by java20130722, 242 阅读, 收藏,
摘要:
每到周末,想跟人玩晚点儿吃夜宵什么,再回去的时候。就会有同学要说还没写周报,搞不成,很扫兴。我就开始想写周报这件事。为什么要写周报呢?顾名思义,周报周报,就是一周的报告。就是跟上级说,你这个星期做了些什么,做了怎么样,下周又要做什么,有没有偷懒啊?偷懒就要打你屁股了。于是周报有了很堂皇的理由,写周报是一个习惯,写不写周报有时也可笑的成为了管理是否正规的标尺。你看吧!那个nb的xx公司还写的日报呢!一切看似合理的要求,后面都隐藏着一个没有把事情想明白的管理者。我有过两次到三次的经历都是因为沟通出现了问题,导致了大家对项目的认识产生了歧义,但是,我们拥有每周写周报的”好习惯“。如果周报成为一个重要 阅读全文
VS和VC++6.0 编程时相对路径问题
2012-04-19 10:15 by java20130722, 242 阅读, 收藏,
摘要:
刚才在测试的时候发现这个问题,特记于此。 在cpp中用函数访问文件时,其相对路径不是相对于cpp所在的目录,而是相对于的工程性文件(如:, dsp, .dsw)所在的目录. 不过一般cpp和工程文件都放在一个目录下,所有一般都没有察觉,但是如果是向工程添加其他目录下的cpp文件时,可能就会出现问题了。 阅读全文
浙公网安备 33010602011771号