06 2014 档案

Storm
摘要:1、一些概念 1)流式计算(参考http://laokaddk.blog.51cto.com/368606/826889) (1)背景:虽然非实时计算几乎都基于MR,但MR很难应付实时性要求较高的应用,因为它是通过调度批量任务来操作静态数据的。 (2)流式计算的典型范式之一是不确定数据速率... 阅读全文

posted @ 2014-06-30 23:21 han'er 阅读(179) 评论(0) 推荐(0)

Spark
摘要:0、参考自http://tech.uc.cn/?p=2116 http://www.csdn.net/article/2013-07-08/2816149 1、Spark是一个高效的分布式计算系统。它基于MapReduce(MR)算法实现分布式计算,但Job的中间输出和结果可以保存在内存,从... 阅读全文

posted @ 2014-06-24 01:28 han'er 阅读(337) 评论(0) 推荐(0)

导航