摘要:
为了计算方便在dws层生产一张每日销售数据 -- 创建一张日期维度表,存放日期相关维度 -- 在订单宽表上增加日期对应维度信息如。订单日,订单周,订单周开始时间,订单月,订单季度,订单年 DROP TABLE IF EXISTS dws.dws_trade_orders_w; create tabl 阅读全文
posted @ 2021-09-08 17:30
碧水斜茶
阅读(84)
评论(0)
推荐(0)
摘要:
16. Flink中有哪些窗口? Flink 支持两种划分窗口的方式,按照time和count。如果根据时间划分窗口,那么它就是一个time-window 如果根据数据划分窗口,那么它就是一个count-window。flink支持窗口的两个重要属性(size和interval)如果size=int 阅读全文
posted @ 2021-09-08 17:29
碧水斜茶
阅读(643)
评论(0)
推荐(0)
摘要:
11 Flink的并行度了解吗?Flink的并行度设置是怎样的? Flink中的任务被分为多个并行任务来执行,其中每个并行的实例处理一部分数据。这些并行实例的数量被称为并行度。我们在实际生产环境中可以从四个不同层面设置并行度: 操作算子层面(Operator Level) 执行环境层面(Execut 阅读全文
posted @ 2021-09-06 16:14
碧水斜茶
阅读(77)
评论(0)
推荐(0)
摘要:
1 简单介绍一下 Flink Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务: DataSet API, 对静态数据进行批处理操作,将静态数据抽 阅读全文
posted @ 2021-09-03 17:56
碧水斜茶
阅读(1181)
评论(0)
推荐(1)
摘要:
假设用户编写了一个MapReduce程序,并将其打包成xxx.jar文件,并提交作业,该作业的运行过程如图所示: 这个过程分为以下5个步骤: 作业提交与初始化。 用户提交作业后,首先由JobClient实例将作业相关信息,(比如讲程序jar包、作业配置文件、分片元信息文件等)上传到分不是文件系统(一 阅读全文
posted @ 2021-09-02 19:06
碧水斜茶
阅读(90)
评论(0)
推荐(0)
摘要:
1.Flink基础 1. 简单介绍一下 Flink Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务: DataSet API, 对静态数据进行批 阅读全文
posted @ 2021-09-01 17:04
碧水斜茶
阅读(387)
评论(0)
推荐(0)
浙公网安备 33010602011771号