企业级统一数据平台建设思路
由于企业的业务系统信息化的分阶段建设、以各自业务为导向等原因,每个业务都积累自身的数据,形成一定的数据孤岛。而数字化转型的一个核心就是以数据为抓手来打通各个不同的业务,以数据驱动辅助经验主导的流程来辅助业务,因此需要企业建成一个统一的、可共享的数据平台,推进建设内部业务的统一数据化,为企业管理和决策提供数据基础与分析能力保障 ,帮助企业落地数字化战略。建设企业统一的数据平台需要考虑哪些问题?本文进行介绍。
— 企业级统一数据平台整体建设思路—
企业级数据平台指的是支撑企业的数字化业务创新和运营的技术基础平台,提供数据驱动、精准决策的全方位技术支撑。- 整体要求
- 统一整合企业内、外部各类业务系统数据,尽量做到“应存尽存、能收则收、层级化管理”;
- 统一管理企业内外部数据资产,形成企业统一数据治理标准及规范,落实数据安全管控,将数据资产化和业务化,实现“数据既能管得住,也能立即用”;
统一支撑企业以及各个组织部门、子公司等创新型应用和业务,提供包括实时计算、离线计算、机器学习等在内的多样化的计算能力,辅助按需提供的算力和数据资产,从而发现数据的业务价值,通过数据驱动来推动经营优化、创新业务探索、风险控制等新业务,推动企业数字化转型。

- 数据架构的设计
- 云原生和支持云,让数据架构能够从云技术的弹性扩展和高可用性中受益。
- 强大、可扩展且可移植的数据管道,将智能工作流、认知分析和实时集成结合在一个框架中。
- 无缝数据集成,使用标准 API 接口连接到原有应用程序。
- 实时数据支持,包括验证、分类、管理和治理。
- 解耦且可扩展,因此服务之间没有依赖关系,而且开放标准支持互操作性。
- 多租户支持能力
- 经过优化,在成本和简单性之间取得平衡。
— 企业级统一数据平台的五大能力要求—
起初,数据平台技术(国内约是2010年后)的定位是储存原始格式数据的大数据平台,可容纳结构化、半结构化、非结构化及二进制的数据。随着大数据技术的融合发展,数据平台的边界不断扩展,内涵也发生了变化,逐步形成了5大能力要求,如下图所示:
企业数据平台的5大核心能力要求主要包括:
- 数据多源异构:数据平台能够整合和集成多源异构的海量数据,支持结构化、半结构化、非结构化等各种数据模型,这样就能够保证即使后期业务有了新的需求,数据平台也能够即时的完成数据接入、整合和最终的服务,在技术上也能够支撑企业落地“应存尽存、能收则收”的数据战略。
- 数据统一的存储与管理:随着分布式存储技术的快速发展,提供统一的数据存储服务已经成为业内的共识,在实现方式上可以是物理上的统一(所有数据通过物理复制到企业数据平台上)或逻辑上的统一(部分数据仍然在其他数据存储中,但可以通过元数据管理、数据联邦等方式实现逻辑的存储管理)。基于统一的数据存储和管理能力,企业才能根本上解决了“数据孤岛”的打通,并且往上对接各种计算引擎和数据管理工具,从而为后续的数据资产化和服务化打好基础。
- 多范式计算:数据资源自身能够提供的价值有限,而海量数据通过多维度的碰撞、关联分析或智能化学习后,隐藏在数据里面的离散价值就可以被发现和挖掘出来,从而将数据变成有价值的资产。由于支撑业务的多样性,企业级数据平台需要支持多种计算引擎,满足不同数据计算分析需求,支持离线计算、实施计算、图计算、机器学习等多种计算范式,让不同的开发者和分析师可以按照他们的技能领域和业务范畴来选择合适的计算工具或引擎,让数据被真正的开发和利用起来。
- 数据服务多样化:前面提到的数据整合、存储和计算都属于基础的数据平台技术能力,而数据服务就是衔接数据平台和业务之间的关键要素,或者说是数据平台为业务和组织生产的关键产品。企业的产品是企业实现经营性目标的核心交付方式,也是与用户建立黏性的关键介质;同样的类比也适合于数据平台,因此作为数据平台产品的各种数据服务也是保证数据平台成功的关键要素,要做到质量高、品类丰富、安全合规和服务方式多样化,可支撑各种业务领域。目前企业内主要的数据服务形式包括SQL、API、数据指标、数据标签和数据模型等。
- 应用广泛:目前各个行业的企业数据应用发展如火如荼,如面向企业经营分析的各类数据分析产品,面向政府管理的数据大屏、“健康码”等应用,以及面向消费者业务的数据决策类产品等,应用的创新速度超过数据平台本身。衡量一个数据平台的成功与否,其最主要的KPI指标应该也是“该数据平台支撑的成功的数据应用的数量和业务效果”。数据平台和数据应用平台可以分开建设,也可以统一建设。在统一建设的模式下,企业数据平台除了给业务应用提供数据资源或数据资产外,还可以为数据应用提供资源调度和生命周期管理能力,这样不仅可以提升应用的性能,还可以提供弹性伸缩、资源隔离等应用所需的基础支撑,从而可以让数据应用更加健壮和高效。
— 企业级统一数据平台的设计考量—
为了能够帮助企业快速的支撑业务的需求,更好的满足数字应用的开发和运营,企业数据平台应该是以PaaS平台来对内对外提供服务能力,而不再应该是面向运维和管理的IaaS方式。而在PaaS构建的过程中,为了能够适应未来企业的灵活、快速变化的业务需求,企业数据平台需要遵从如下的几个主要设计考量:-
以数据为中心,业务导向
-
云原生
-
融合互通
-
层次化设计

— 小结—
本文介绍了企业数字化转型的三层业务模式,给出了平台建设的整体思路,以及一些基础能力要求和建设上的考量。相信大家通过阅读本文,对企业数字化建设已经有了基础概念。那么面对纷繁复杂的数据来源,多元化的数据结构,企业数据平台建设该从何处入手呢?哪个数据管理架构适合自己的企业呢?下一篇将介绍数据仓库、数据集市、数据湖。
浙公网安备 33010602011771号