代码改变世界

数据处理之常见指标处理

2017-11-02 21:40  legenecy  阅读(799)  评论(0)    收藏  举报

             通过实例的场景,按层级指标来计算,通过维度为专业,再通过对比学校之间的数值。以下是最顶层的加工规则公式。

      首先 ,我们从宏观的角度考虑,学校 专业 有个对应的表,指标树也一张表(T_EVA_INDICATORS),还有基础表,也就是数据来源的表,简称源表,前端展现的就是统计出来的数值,剩下都是我们处理的指标处理。

按同一个专业来说,我们可以设计一个指标树(CFG_IND_TREE),因为我们可能后续需要一些额外的数据,(举个例子,我们有实际分数,和占比。还有权重的计算。)但是肯定时从学校专业表,或者原始的指标树来的。

中间处理数据的表,我们按从上而下etl 加工规则来说,比如观测点到二级指标,到一级指标,再到学校级别。观测点我们分为定量、定性、附加分 。定量可以分为直接算分,先数值,各学校最高为100,其他占比算分。

比如以上公式就需要对比其他学校,比如L1为80,L2=60,L3=50 ,那么最大为80 ,Q1=100 Q2=75,Q3=62.5。

ZBFX_GCD 配置简单的sql 语句,可以直接算分,还有需要中间表来算出占比之类的,然后把数据插入中间处理数据的表ZBFX_IND_DATA  .