flink

1

1)实时计算出当天零点截止到当前时间的销售总额

2)计算出各个分类的销售额最大的top3

3)每秒钟更新一次统计结果

 

2

要求每5分钟统计一次用户数和流量(上行流量 + 下行流量),维度为scene_name,要求结果如下表:

date_time
窗口结束时间
scene_name
场景名称
user_cnt
用户数
flow_data
流量
202401311230 4A级景区 230213 121312233213
202401311235 5A级景区 330454 221323241334

这个需求的意图是:用 kafka 数据作为主流,关联小区维表,根据场景维度分组,计算 uv 和 flow_data。

 

3

数据管道和 ETL 作业的用途相似,都可以转换、丰富数据,并将其从某个存储系统移动到另一个。但数据管道是以持续流模式运行,而非周期性触发。

和周期性 ETL 作业相比,持续数据管道可以明显降低将数据移动到目的端的延迟。此外,由于它能够持续消费和发送数据,因此用途更广,支持用例更多。

posted on 2025-07-21 00:09  silyvin  阅读(4)  评论(0)    收藏  举报