摘要: 背景 数据处理平台从oracle迁移到hadoop平台后,原有的数据处理过程需要改写为sparkSql。由于sparkSql执行环境和数据的不确定,经常有资源竞争导致处理过程意外停止,数据倾斜导致任务执行失败。 为减少出错概率,需要对sparkSql进行规范与优化。 转换 exist 转换 为 le 阅读全文
posted @ 2020-05-25 18:44 foola 阅读(1087) 评论(0) 推荐(0)