博客园  :: 首页  :: 联系 :: 管理

2017年7月5日

摘要: 分布式流处理是对无边界数据集进行连续不断的处理、聚合和分析的过程,与MapReduce一样是一种通用计算框架,期望延迟在毫秒或者秒级别。这类系统一般采用有向无环图(DAG)。DAG是任务链的图形化表示,用它来描述流处理作业的拓扑。在选择不同的流处理系统时,通常会关注以下几点: 运行时和编程模型:平台 阅读全文

posted @ 2017-07-05 23:36 天戈朱 阅读(11895) 评论(0) 推荐(1) 编辑