Druid和Spark对比

Druid和Spark对比

不是Spark专家, 如果描绘有错误, 请通过邮件列表或者其他方式告知我们

Spark实现弹性的分布式数据集概念的计算集群系统, 可以看做商业分析平台。 RDDs能复用持久化到内存中的数据, 从而为迭代算法提供更快的计算速度。 这对一些工作流例如机器学习格外有用, 有些操作需要重复执行很多次才能达到结果的最终收敛。  Spark 提供了大量的算法用来查询和分析大量数据.

Druid 被设计成增强的分析应用, 重点关注注入数据和查询数据的延时问题。  如果你开发了WEB界面用于任意维度的探索查询数据, 会发现交互式查询Spark可能很慢。

posted on 2015-05-22 16:14  lpthread  阅读(4706)  评论(0编辑  收藏  举报