摘要: 《Streaming Systems》第一章: Streaming 101 数据的价值在其产生之后,将随着时间的流逝逐渐降低。因此,为了获得最大化的数据价值,尽可能实时、快速地处理新产生的数据就显得尤为重要。实时数据处理将在越来越多的场景中体现出更大的价值所在 —— 实时即未来。 在本章中,我们完成了以下工作: 1. 澄清了一些术语的定义,专注于‘流’的定义,而不是已有流计算系统的实现。 2. 研究了目前 批/流 系统的能力,强调,在功能上,流是批的超集。 3. 提出了如果流系统在功能上要超越批系统,需要具备的两个能力,分别是:正确性和在各时间域处理数据的能力。 4. 强调了事件时间和处理时间的巨大区别。提出了基于这两个时间处理数据的难点。 5. 回顾了主流数据处理系统处理有界和无界数据的方式。 阅读全文
posted @ 2022-04-21 22:44 watermark's 阅读(257) 评论(0) 推荐(0)