会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
坐而论道,起而行之
博客园
首页
新随笔
联系
订阅
管理
2021年6月8日
读取parquet文件后和其它表join后回写问题
摘要: 背景 需要对埋点数据进行增量清洗,增量更新parquet数据文件,步骤如下: 首次清洗历史所有数据 后续每次取增量数据和上次清洗结果做合并 问题 1、如何判断为首次任务,实现方案: 方案1:判断指定目录下是否存在数据文件 方案2:默认按照增量处理,首次不存在数据文件,通过异常捕获机制全量清洗 2、增
阅读全文
posted @ 2021-06-08 18:44 肆玖爺
阅读(305)
评论(0)
推荐(0)
公告