流水清清

导航

2018年11月26日 #

flink基础教程读书笔记

摘要: 数据架构设计领域发生了重大的变化,基于流的处理是变化的核心。 分布式文件系统用来存储不经常更新的数据,他们也是大规模批量计算所以来的数据存储方式。 批处理架构(lambda架构)实现计数的方式:持续摄取数据的管道(flume)每小时创建一个文件,由调度程序安排批处理作业分析最近生成的文件,然后输出计 阅读全文

posted @ 2018-11-26 16:19 流水清清 阅读(2715) 评论(0) 推荐(0) 编辑