2020年6月29日

摘要: 前言 本文以离线数据仓库为背景,重点介绍因传输链路数据延时的不确定性,可能导致部分延迟文件无法参与正常的调度计算或同步,导致数据缺失的问题成因、业务影响及相应的解决方案。 关于这类问题的处理,有这么一种论调:我们认为正常情况下,脏 或 缺失 数据的比例是很小的,可以大致认为数据是可用的的;或者我们可 阅读全文
posted @ 2020-06-29 17:03 萌猫他爸 阅读(1380) 评论(1) 推荐(1) 编辑