10.23
假如直接统计一张表在一段时间分区访问的范围,则统计结果会严重受到考察周期的影响。举一个例子,假设一个表有 10 个访问,每天都是访问昨天分区;当选择 15 天作为考察周期时,得到的结果是用户需要访问近 15 天的数据;而当选择 31 天作为考察周期时,则会得到用户需要访问近 31 天数据这一结果。为了消除这类干扰,选择统计表分区访问时间与分区的生成时间的差值,即偏移天数来统计访问次数。
经验证,使用这种统计方案,选择不同偏移天数得出的结果差异很小。考虑到治理的及时性,最终选择通过近 90 天的访问信息来计算均衡天数。

浙公网安备 33010602011771号