10.22

这里所说的生命周期是狭义的生命周期,是指一个表分区数据从写入到被删除经过了多长时间;例如某个表的生命周期是 100,意味着这份数据写入到某个分区后,100 天之后会被清除。

生命周期评估体系的建设,首先要构建代价模型,其核心是将数据的计算成本看作生产数据的“代价”,将数据的存储成本看作拥有”成本”,将两者的比值作为代价均衡系数,计算每个模型在每个分区的访问次数,两者的交点即为代价的均衡点,即为最理想的生命周期值。

此外,在实际模型构建中,还考虑模型所属分层、是否精选、认证、任务等级、加工时长等因素,在均衡的基础上,通过容忍系数使推荐的生命周期值更稳定、更符合业务场景,最终得到推荐的生命周期值。

posted @ 2024-11-25 08:28  SDGVSBGDRH  阅读(37)  评论(0)    收藏  举报