静书智 - 第三篇:数据标准管理

一问:什么是数据标准?

白皮书:是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。“数据标准”并非是一个专有名词,而是一系列“规范性约束”的抽 
象。数据标准的具体形态通常是一个或多个数据元的集合,即数据元是数据标准的基本单元。是进行数据标准化、消除数据业务歧义的主要参考和依据。 来自《数据标准管理实践白皮书》

华为:数据标准是用于描述公司层面需共同遵守的数据含义和业务规则,它描述了公司层面对某个数据的共同理解,这些理解一旦确定下来,就应作为企业层面的标准在企业内被共同遵守。
数据元是构成数据标准的最基本单位,由一组属性规定其定义、标识、表示和允许值的数据单元,是不可再分的最小数据单元。您可以将数据标准关联到各个业务上的数据库中。其中,标识符、数据类型、表示格式、值域是数据交换的基础,它们用于描述表的字段元信息,规范字段所存储的数据信息。

数据元(data element):按照ISO11179标准,是在特定语境中不可分割的最小数据单位,其定义、识别、表示和允许的值是通过一组属性规定的(unit of data that is considered in context to be indivisible.the definition, identification, representation and permissible values are specified by means of a set of attributes.)。

来源 数据标准管理实践白皮书.pdf | 数据资产管理实践白皮书.pdf

数据元示例:
image

二问:什么时候需要建设数据标准?

本质问题都可以回答定义上面来,就如数仓的定义一样,着重看数据标准是为了解决什么问题而产生。数字化时代,任何公司都应该制定数据标准。作为数字化运营的公司,一开始就应该建立数据标准,并落地相应业务系统。但是从现实出发,很多公司都是先发展再治理。个人理解,如果有如下几个方面的特点,就可以考虑数据标准建设:
A。有多个业务部门,开展不同的主营业务。
B。管理部门或业务部门存在跨业务线进行数据分析的需求。
C。经常存在统计口径不一致导致反复沟通和澄清的现象。

三问:数据标准体系如何构建?

业务视角要求:用于统一业务侧语言和理解,明确定义每个属性所遵从的业务定义和用途、业务规则、同义词,并对名称进行统一定义,避免重复。
技术视角要求:对IT实施形成必要的指引和约束,包括数据类型、长度,如果存在多个允许值,则应对每个允许值进行明确的限定。
管理视角要求:明确各业务部门在贯彻数据标准管理方面应承担的责任,包括业务规则责任主体、数据维护责任主体、数据监控责任主体,因为很多情况下这些责任并不是由同一个业务部门来负责,所以必须在标准制订时就约定清楚。例如,“客户合同”中某些条款的规则制订者可能是财经部门,负责与客户达成约定并在系统中录入的可能是销售业务部门,而对整个客户合同数据质量进行跟踪、监控的可能是数据专业部门。

四问:数据标准体系长啥样?

完整的数据标准体系,应该遵循如下框架结构:
image

具体框架内容示例如下:
image
image

五问:数据标准怎么用?

通过元数据映射,数据建模引用落标实现。

六问:用什么工具管理数据标准?

在开源方面,元数据管理工具DataHub或OpenMetadata提供了部分功能,大部分在闭源商业软件中较详细。

未完待续,持续更新中,欢迎关注!

posted @ 2025-04-03 09:27  静书智  阅读(60)  评论(0)    收藏  举报