Flink简介

Apache Flink是Apache基金会开发的开源流处理框架，其核心是由Java和Scala编写的分布式数据流引擎。对无界和有界数据进行有状态计算。

Flink 是有状态的和容错的，可以在维护一次应用程序状态的同时无缝地从故障中恢复；它支持大规模计算能力，能够在数千个节点上并发运行；它具有很好的吞吐量和延迟特性。同时，Flink 提供了多种灵活的窗口函数

DataSet API，对静态数据进行批处理操作，将静态数据抽象成分布式的数据集，用户可以方便地使用Flink提供的各种操作符对分布式数据集进行处理，支持Java、Scala和Python。
DataStream API，对数据流进行流处理操作，将流式的数据抽象成分布式的数据流，用户可以方便地对分布式数据流进行各种操作，支持Java和Scala。
Table API，对结构化数据进行查询操作，将结构化数据抽象成关系表，并通过类SQL的DSL对关系表进行各种查询操作，支持Java和Scala。

场景	定义	举例
事件驱动型应用	事件驱动型应用是一类具有状态的应用，它从一个或多个事件流提取数据，并根据到来的事件触发计算、状态更新或其他外部动作。	反欺诈基于规则的报警业务流程监控
数据分析型应用	数据分析任务需要从原始数据中提取有价值的信息和指标	消费者技术中的实时数据即席分析
数据管道应用

https://zhuanlan.zhihu.com/p/90024398

posted @ 2020-09-23 10:45 jihite 阅读(434) 评论(0) 收藏举报

刷新页面返回顶部

jihite