flink
1
1)实时计算出当天零点截止到当前时间的销售总额
2)计算出各个分类的销售额最大的top3
3)每秒钟更新一次统计结果
2
要求每5分钟统计一次用户数和流量(上行流量 + 下行流量),维度为scene_name,要求结果如下表:
| date_time 窗口结束时间 | scene_name 场景名称 | user_cnt 用户数 | flow_data 流量 |
|---|---|---|---|
| 202401311230 | 4A级景区 | 230213 | 121312233213 |
| 202401311235 | 5A级景区 | 330454 | 221323241334 |
这个需求的意图是:用 kafka 数据作为主流,关联小区维表,根据场景维度分组,计算 uv 和 flow_data。
3
数据管道和 ETL 作业的用途相似,都可以转换、丰富数据,并将其从某个存储系统移动到另一个。但数据管道是以持续流模式运行,而非周期性触发。
和周期性 ETL 作业相比,持续数据管道可以明显降低将数据移动到目的端的延迟。此外,由于它能够持续消费和发送数据,因此用途更广,支持用例更多。
浙公网安备 33010602011771号