2017年9月12日

摘要: 简单介绍 官方给出的介绍是hadoop MR是一个用于轻松编写以一种可靠的、容错的方式在商业化硬件上的大型集群上并行处理大量数据的应用程序的软件框架。 MR任务通常会先把输入的数据集切分成独立的块(可以看成是一个较小数据集),然后这些块由map任务以完全并行的方式的去处理。map任务输出的结果排完序 阅读全文
posted @ 2017-09-12 14:45 Luzenrocy 阅读(189) 评论(0) 推荐(0) 编辑

2017年8月30日

摘要: 看到这一块的视频,结合光方博客的一些文档及自己的一点理解,记个笔记,以备不时之需。 by layer cubing 1.on MR 这个算法的对cube的计算就像它的名字一样是按player进行的。 以一个n维cube(即事实表有n个维度)为例: player-1:以source data(源数据) 阅读全文
posted @ 2017-08-30 14:44 Luzenrocy 阅读(319) 评论(0) 推荐(0) 编辑

2017年8月26日

摘要: 昨天晚上朋友给发过来看的题,感觉有点意思就尝试了一下,题目如下: 菜鸟仓库是一个很大很神奇的地方,各种琳琅满目的商品整整齐齐地摆放在一排排货架上,通常一种品类(sku)的商品会放置在货架的某一个格子中,格子设有统一的编号,方便工人们拣选。有一天沐哲去菜鸟仓库参观,无意中发现第1个货架格子编码为1,第 阅读全文
posted @ 2017-08-26 10:22 Luzenrocy 阅读(273) 评论(0) 推荐(0) 编辑