摘要:
一. AQE是什么? 1、 产生背景 Spark 2.x 在遇到有数据倾斜的任务时,需要人为地去优化任务,比较费时费力;如果任务在Reduce阶段,Reduce Task 数据分布参差不齐,会造成各个excutor节点资源利用率不均衡,影响任务的执行效率;Spark 3新特性AQE极大地优化了以上任 阅读全文
posted @ 2025-03-25 11:18
业余砖家
阅读(651)
评论(0)
推荐(0)
摘要:
一、资源调优 增加Executor内存通过调整Executor内存参数,确保任务有足够资源处理数据: spark-submit --executor-memory 8G --driver-memory 2G ... # 示例命令 场景示例:处理10TB级日志时,将executor-me 阅读全文
posted @ 2025-03-25 10:38
业余砖家
阅读(117)
评论(0)
推荐(0)
摘要:
一、数据仓库基础与建模 数仓分层设计 请描述滴滴数仓分层架构及各层核心作用(如ODS、DWD、DWS、ADS)。 1. ODS(Operational Data Store)层:原始数据层数据内容:直接从业务系统抽取的原始数据,包括订单流水、用户行为日志、司机接单记录、GPS轨迹等 阅读全文
posted @ 2025-03-25 00:57
业余砖家
阅读(542)
评论(0)
推荐(0)

浙公网安备 33010602011771号