企业数据质量检查标准

企业数据质量指的是一条数据的质量表现,需要考虑数据自身的质量问题和不同系统间交互等原因会产生的质量问题。

分析企业的数据质量,归纳来讲有6个方面:

1.数据一致性:同一业务实体对象在不同业务系统、不同组织机构内,它的名称等相关静态基准信息以及被引用的关联属性数据信息应是否完全一致,不存在任何差异。

2.数据完整性:是否完整地描述某一业务员实体对象的基准数据以及其被引用的关联属性数据信息,没有缺失。

3.数据合规性:针对某一业务实体对象的描述是否完全符合业务规则、业务代码制定原则,数据描述规范

4.数据冗余:针对同一业务实体,在企业内所有系统、组织机构中是否存在多个编码对应;针对同一编码,在企业不同业务管理过程中是否存在多个业务实体对应。

5.数据及时性:数据由产生到被使用的时间过程应是否在企业规定范围内

6.数据有效性:数据生产者是否完全按照数据使用者的要求进行数据的新增和审核,生成的数据是否完全满足使用者对数据的要求

-----------------------------------

也有其他一种说法

1.完整性(Completeness)

字段是否为空或NULL可使用空值检查,可以判断一个或多个字段是否非空。数据是否丢失可使用记录缺失检查,根据比照表字段检查目标字段是否缺少数据。

2.唯一性(Uniqueness)

检查数据是否唯一可使用重复数据检查。检查一张表内的重复数据,重复依据的定义不限于单一字段。若仅添加一个字段,将检查该字段内是否有重复数据;若添加了多个字段,将联合检查多个字段内是否有重复数据。

3.及时性(Timeliness)

检查数据填报是否在允许时间范围内可使用及时性检查。用来检查数据抽取、上报是否及时。

4.有效性(Validity)

检查数据是否符合其定义的语法(格式、类型、范围),场景包括不限于字段长度有效、字段内容有效、字段数据范围有效、枚举值个数有效、枚举值集合有效。这些场景下可使用值域检查、规范检查、波动检查、平衡性检查、离群值检查。

5.准确性(Accuracy)

数值同比波动监测、数值环比波动监测、表逻辑检查。可使用逻辑检查、值域检查、波动检查、平衡性检查。

6.一致性(Consistency)

检查数据项的多个数据是否一致,可使用引用完整性检查、数据集检查。

posted @ 2021-03-10 16:39  肥仔佳文猪  阅读(648)  评论(0)    收藏  举报