系统学习业务数据提取逻辑的几点经验
1. 利用数据字典建立框架,无系统,就不是自己的
2. 抓住每一个业务模块中,最重要最系统全面的大报表进行学习
数据源模块
-- 看数据源是哪些,数据源的数据范围,数据结构,存储粒度
-- 是如何抓取的,加了哪些限制条件,限制条件代表的意思
-- 总会有一些数据没有那么干净,怎么处理的
数据处理过程
-- 看不同表之间的合并,mapping key ,是否重复
-- 看表的summary过程,产品/用户/时间等粒度汇总
-- 其他特殊处理
数据汇总过程
--
快速学习提取逻辑的方式之一,是系统的过一遍全部的MI/Report的逻辑,比较其中的差异
2. 不要相信陌生数据,用之前要探索陌生数据
3.以数据存储逻辑进行个案研究
4. 建立一个最佳提取代码集合,常用的数据提取单元模块化
5. 在建立新的提取逻辑代码之前,要先回顾已有代码
-- 一是避免重复建轮子
-- 二是避免出现数据定义差异,造成2份报告中同义KPI出现需要对数的情况
-- 三是作为回顾历史代码的一个trigger
7. 常用易错的逻辑,需要建立一个敏感易错库

浙公网安备 33010602011771号