一、Flink简介 - dongdongag

一、Flink是什么

apache flink是一个面向分布式数据流处理和批量数据处理的开源计算平台，提供支持流处理和批处理两种类型应用的功能

二、Flink特点

三、Flink组件栈

Deployment层

主要涉及了Flink的部署模式，Flink支持多种部署模式：本地、集群（Standalone/YARN）、云（GCE/EC2）。

Runtime层

Runtime层提供了支持Flink计算的全部核心实现，比如：支持分布式Stream处理、JobGraph到ExecutionGraph的映射、调度等等，为上层API层提供基础服务

API层

API层主要实现了面向无界Stream的流处理和面向Batch的批处理API，其中面向流处理对应DataStream API，面向批处理对应DataSet API

Libaries层

在API层之上构建的满足特定应用的实现计算框架，也分别对应与面向流处理和面向批处理两类

Flink自身优势

Flink与其它框架比较

Flink基本概念

时间窗口

流上的聚合需要由窗口来划定范围，比如“计算过去的5分钟”或者“最后100个元素的和”

窗口通常被区分为不同的类型，比如滚动窗口（没有重叠），滑动窗口（有重叠），以及会话窗口（由不活动的间隙所打断）

FLINK分布式运行环境

基本架构

Flink是基于Master-Slave风格的架构

Flink集群启动时，会启动一个JobManager进程、至少一个TaskManager进程

JobManager

TaskManager

Client

发表于 2020-01-12 22:13 dongdongag 阅读(11) 评论(0) 收藏举报