Bookcold

导航

元数据的定义和管理

来自:《数据仓库结构设计与实施——建造信息系统的金字塔》

源(系统)数据定于与说明 源系统地址、网络连接、访问方式; 计算机系统、操作系统; 数据库服务器名、访问方式、数据结构、有关的表、列

以上信息都是有可能要变化的,应作为元数据存入数据表,ETL程序和处理过程可以读入这些信息,以进行远程数据链接和数据访问,这大大优化将以上信息写入程序中的那种硬性编程方式;

源数据库链接说明; 逆向工程与源系统设计获取定义说明 元数据交换说明你。 暂存定义与说明 源至暂存区映像 暂存区只目标区映像 中间文件的传输说明 中间文件的说明及使用 中间文件的前后处理(清理与压缩)说明 暂存区数据库的前后处理和中间处理的说明及使用 目标模型定义与说明 星型结构; 事实表定义说明,包括: 度量 数字键 交替键 索引 定义数据(如数据类型、数值大小和默认值) 有效性制约 数据域值定义 分区定义说明 存储说明 维表定义与说明,包括: 主键 缓慢变化的维 维的等级/层次 维的共享 维的版本号 数据库的完整性限定 映像定义与说明 源至目标映像 基本数据到综合数据的映象 标准字典 转换字典 参照表 映象表 ETL定义与说明 转换规则和方法 数据清洗说明 批作业说明 加载频率 累加时间片控制说明 退回说明与准则 剥离与修改数据准则 转换函数库 传输定义与说明 加载定义与说明 会期/对话管理定义与说明,包括以下几个方面 [...]

posted on 2010-04-07 22:35  bookcold  阅读(430)  评论(0)    收藏  举报