(转摘)_《数据库设计入门经典》:术语表

第一范式(1st Normal Form,1NF)——
消除重复组,以便所有表中的所有记录可通过每个表中的主健唯一标识。换言之,除了主键外的所有字段必须依赖于主键。所有范式是累积的。(见“范式”。)
容易方法的第一范式(1st Normal Form made easy)——
通过创建新表删除重复字段,原始表和新表用主表-明细表的一对多关系链接起来。同时在两个表上创建主键,明细表将有一个复合主键,其中主表主键字段作为其主键的前缀字段。该前缀字段也是回到主表的外键。
第二范式(2nd normal Form,2NF)——
所有非键值必须完全依赖于主键。不允许部分依赖。当字段完全依赖于复合主键的一部分时才存在部分依赖。所有范式是累积的。(见“范式”。)
容易方法的第二范式(2nd Normal Form made easy)——
执行一个表面上与第一范式类似的函数,只是要创建一个表,表中的重复值(而不是重复字段)会转移到一个新表。结果是在原始表(主表)和新表之间创建多对一关系,而不是一对多关系(见第一范式)。新表的主键盘只包含1个字段。主表包含一个外键,指向新表的主键。该外键不是原始表中主键的一部分。
第三范式(3nd Normal Form,3NF)——
消除传递依赖。意思是一个字段由主键间接确定,因为这个字段函数依赖于另一个字段,而另一个字段又依赖于主键。所有范式是累积的。(见“范式”。)
容易方法的第三范式(3rd Normal Form made easy)—— 消除传递依赖,为一些间接依赖于现有表中的主键的内容创建一个新表。
第四范式(4th Normal Form,4NF)—— 消除多组多值依赖。所有范式是累积的。(见“范式”。)
第五范式(5th Normal Form,5NF)—— 消除循环依赖。也称为投影范式(Projection Normal
Form,PJNF)。所有范式是累积的。(见“范式”。)
抽象化(abstraction)——
在计算机术语中,抽象化是指创建某件事物来生成大量其他事物。抽象化通常用在对象模型中,对象模型中抽象类涉及共享属性和继承类的方法。
活动数据(active data)—— 应用程序连续访问的数据库中的信息,比如OLTP数据库中今天的事务。
ad-hoc查询(ad-hoc query)——
由终端用户或高级用户发送到数据库的查询,试图很快获得一些信息。ad-hoc查询服从于包括上述查询的内容、结构和性能的数据库,不必由数据库模型提供。结果可能是性能问题,在极端情况下甚至可能是明显的数据库停止。
聚集查询(aggregated query)—— 使用GROUP BY子句创建一组汇总记录(较小数目的记录)的查询。
算法(algorithm)—— 有按步骤设计过程的计算机程序(或过程),用有限数量的步骤解决问题。
辅助索引(alternate index)——
表的主要关系结构的替换,由主键和外键索引确定。辅助索引是“替换的”,因为它们是除主键和外键索引之外的索引,作为对主键盘和键外键提供的排序方法的替换。
分析(analysis)—— 由计算机系统执行的最初事实查找过程。
异常(anomaly)­—— 关于关系数据库设计,本质上是对数据的错误修改,尤其是对单个记录。
ANSI—— American National Standards Institute,美国国家标准化组织。
应用程序(application)—— 开发人员、内部职员和终端用户访问数据库使用的前端工具,
升序索引(ascending index)—— 以正常升序排序的索引构建,如A、B、C等。
属性(attribute)­—— 关系数据库字段的等价物,常用于描述对象结构中类似的低级别结构。
自动计数器(auto counter)—— 允许自动生成数字序列,通常是连号的,比如101、102及103等等。有些数据库引擎称之为次序(sequence)。
巴科斯范式(Backus-Naur form)—— 一种语法符号约定。
BETWEEN—— 在两个值的范围内的验证。
二进制对象(binary object)—— 用二进制格式存储数据,通常用于多媒体(图像、声音等)。
二进制索引(binary index)——
包括二进制表示的索引,每个记录用“0”和“1”表示。例如,位图索引为两个值创建两个位图,M表示Male,F表示Female。当输入M时,M位图设置为1,F位图设置为0。
黑盒(black box)—— 可以独立起作用的对象或代码块,其中对一块软件的一部分作的修改不会影响到其他内容。
Boyce-Codd范式(Boyce-Codd Normal Form,BCNF)——
表中的每个行列式是一个候选键。如果只有一个候选键,那么使用第三范式和Boyce-Codd范式是一样的。所有范式是累积的。(见“范式”。)
B树索引——
是一种二叉树。如果在一张纸上画出来,B树索引就像一颗倒着的树。该树称为“二叉”,是因为二叉是指一个分支节点下有两个选项:左分支和右分支。数字的二叉计数系统包含两个数字,也就是0和1。结果是,一个二叉树每个分支永远只有两个选项作为叶节点。B树由一个根节点、若干分支节点及若干叶节点组成。在树的末端节点(或叶节点)中包含索引字段值。
预算(budget)—— 决定某件事要花多少钱,无论它是否划算,无论是否值得花费,无论是否花费得起,在不使公司破产的情况下无论它是否给公司竞争优势。
业务过程(business process)—— 业务的主要区域。用这种方法分割业务。在数据仓库中,主要区域是事实表。
业务规则­(business rule)—— 涉及公司日常工作的任何事务的过程或流程。该业务和决策的操作用来执行公司的运作过程。
缓存(cache)—— 通常用来将数据缓冲到快速访问内存的术语,以便随后进行高速检索。
候选键(candidate key)—— 也称为潜在键(potential key),或许可键(permission
key)。是字段或字段的组合,可充当表的主键字段。候选键惟一地标识表中的每个记录。
笛卡尔乘积(Cartesian product)——
这是一个数学术语,描述一组由指定集合组成的所有值对。在统计上它称为组合(combination)而不是排列(permutation)。在SQL行话中,笛卡尔乘积也称为交叉连接。
级联(cascade)—— 对父表中数据的修改传播到所有子表,包括来自父表中的主键的外键字段副本。
级联删除(cascade delete)—— 在删除主表的记录前,当主表记录自动删除相关子表中的所有子记录时发生的删除。
中央处理单元(Central Processing Unit,CPU)—— 计算机中的处理器(芯片)。
检验约束(check constrain)—— 加于数据库表中字段上的约束,作为元数据字段设定,用于验证指定输入值的有效性。
类(class)—— 关系数据库中与表等价的对象方法论术语。
客户机-服务器(client-server)——
在Internet出现之前的时代常用的计算机环境,在该环境中,事务数据服务一个公司内的用户。用户数可以有1个到数千个不等,取决于公司的规模。临界因素实际上是单个记录修改活动和适当大小的报告的混合物。客户机-服务器数据库模型通常用于同时进行低并发和低吞吐量的情况,因为用户总是可管理的。
群集(cluster)—— 允许来自底层表的单个表或记录的多个表局部副本。物化视图取代了群集。
群集索引(clustered index)—— 见“索引组织表”。
编码(coding)­—— 编写程序代码,无论用哪种合适的语言。比如,C语言就是一种编程语言。
列(column)—— 见“字段”。
COMMIT—— 通过将所有修改保存到数据库中来完成事务。
复杂数据类型(complex datatype)—— 通常用在对象结构中,包括若干字段。
复合索引(composite index)—— 可以构建在多个字段上的索引。也称为复合字段索引(composite field
index)或多字段索引(multiple field index)。
复合键(composite key)—— 由多个字段组成的主键、外键或唯一键。
并发(cocurrent)—— 同时执行多个进程,表示现从个进程同时执行,或者多个进程同时访问同一块数据。
配置(configuration)——
一个计算机术语,用于描述计算机系统(或部分计算机系统,比如数据库)的安装和设置方式。例如,当您安装Windows计算机时,所有桌面图标都是配置的一部分(启动计算机时的配置)。桌面有哪些图标、这些图标分别在什么位置,都存储在您地计算机上某个地方的配置文件中。当您启动计算机时,Windows软件会检索配置文件,解释其内容,并在显示器上显示所有图标。
约束(constraint)—— 意思是在本表内或表间约束、限制或应用规则。
构造(construction)—— 构建和测试代码的阶段。对于数据库模型,构建脚本来创建表、参照完整性键、索引和存储过程等其他内容。
交叉连接(cross join)—— 见“笛卡尔乘积”。
鸟足结构(crow’s foot)—— 用于描述一对多或多对多关系的多的一端。在某些多用户领域中鸟足结构看起来很像乌鸦的脚,有3个分开的脚趾。
循环依赖(cyclic dependency)——
在关系数据库模型环境中,X依赖于Y,而Y又直接或间接地反过来依赖于X。因此,循环依赖是指互相依赖的逻辑循环模式。循环依赖通常发生包含3个以上字段的复合主键的表中。其中,例如,3个字段互相成对相关。换言之,X与Y相关,Y与Z相关,以及X与Z相关。
数据(data)—— 有组织的信息。
数据定义语言(Data Definition Language,DDL)——
用于修改元数据的命令。在有些数据库中,这些命令需要一个COMMIT命令;在另外一些数据库中则不需要。当不需要COMMIT命令时,这些命令会自动将任何未决的修改提交到数据库。而提交后不能回滚回来。
数据操作语言(Data Manipulation Language,DML)——
修改数据库中的数据的命令。这些命令是INSERT、UPDATE和DELETE。这些修改可以用COMMIT命令永久提交,也可以用ROLLBACK命令撤销。这些命令不会自动提交。
数据集市(data mart)—— 数据仓库的子集部分。通常,数据集市由一个起始模式组成(一个事实表)。
数据仓库(data warehouse)—— 用于预测和规划报表的大型事务历史记录数据库。
数据库(database)—— 信息的集合,更适宜相关信息和有组织的信息。
数据库块(database block)—— 数据库内的物理子结构,和存储数据的磁盘上的最小物理单元。
数据库事件(database event)—— 见“触发器”。
数据库模型(database model)—— 用来组织和向其他无组织的信息应用结构的模型。
数据库过程(database procedure)—— 见“存储过程”。
数据类型(datatype)—— 限定字段中的值。如,只允许是日期或数字。
数据标记(datastamp)—— 见“时间标记”。
DDL—— 见“数据定义语言”。
小数(decimal)—— 包含小数或非浮点型实数的数据类型。
决策支持系统(Decision Support System,DSS)—— 常称为DSS数据库(DSS
database),这些数据库支持决策,通常更多的是对象的决策级、甚至是管理级的决策类型。
DEFAULT—— 当记录中的字段没有指定值时的可选值设定。
DELETE—— 一个命令,可用来从一个表中删除一行、若干行或所有行。
删除异常(Delete anomaly)—— 记录不能从主表中删除,非先把所有子记录删除。
非规范化(denormalization)—— 最常用作规范化的反向,通常用在数据仓库或报告环境中。非规范化通过逆向规范化等方法降低粒度。
依赖(dependency)—— 某事依赖于另外的某事。
降序索引(descending index)—— 以正常降序排序的索引(如C、B、A)。
设计(design)—— 进行分析以发现要做什么。设计将指出分析出来的内容可以如何做及应如何做。
决定因子(determinant)—— 决定另一个值的值。如果X决定值Y(至少部分决定),那么X决定Y的值,因此,X是Y的决定因子。
维度表(Dimension table)—— 数据仓库中的描述性或静态数据表。
DISTINCT子句—— 用SELET命令修饰符的查询,从一组记录中检索独有的行。
DML—— 见“数据操作语言”。
域键范式(Domain Key Normal Form,DKNF)——
规范化的最终应用。它更多的是概念状态的度量,与其自身内的传输过程相对。所有范式是累积的。(见“范式”。)
DSS—— 见“决策支持系统”。
动态数据(dynamic data)—— 在短期内有重大修改的数据。
动态字符串(dynamic sting)—— 见“变长字符串”。
终端用户(end-user)—— 计算机系统的最终用户。实际使用软件执行业务功能的公司客户和员工(如销售人员、会计和忙碌的主管)。
实体(entity)—— 表的关系数据库建模术语。
实体关系图(Entity Relationship Diagram,ERD)——
表示数据库中整个模式的表中结构化内容(字段)。此外还包括实体之间的模式化表示,由不同类型的关系以及主键和外键来表示。
事件触发器(Event Trigger)—— 见“触发器”。
表达式(expression)—— 在数学术语中,一个或多个功能(或valued)值最后等于一个值,或者等于另一个表达式。
外部过程(external Procedure)——
与存储过程类似,只是外部过程用非数据库特有的编程语言编写。外部过程是用非数据库引擎原生语言编写的代码块,如Java或C++等;然而,外部过程仍然在数据库引擎自身内执行,也许在数据库内的数据上执行。

事实表(fact table)—— 数据仓库中最大的表,星型模式的中心,存储公司的事务历史记录。
事实-维度结构(fact-dimensional structure)—— 见“星型模式”。
字段(field)—— 表中分割的一部分,给记录中的每个字段指定结构和数据类型。
字段列表(field list)—— 这是一个查询要检索的SELECT命令清单字段的一部分。当检索多个字段时,字段就变为一列字段或字段列表。
第五范式(Fifth Normal Form)­—— 见第五范式(5th Normal Form)。
文件系统(file system)—— 用于描述数据库中在操作系统级别的文件。
筛选查询(filtered query)—— 见“筛选”。
筛选(filtering)——
检索记录的子集,或从源文件中删除记录的子集。SQL中的筛选用WHERE子句检索基本查询记录,用HAVING子句人聚集查询中删除组。
第一范式(First Normal Form)—— 见“第一范式(1st Normal Form)”。
定长记录(fixed-length records)—— 表中的每个记录必须有相同的字节长度。这通常禁止使用变长数据类型,比如变长字符串。
定长字符串(fixed length string)——
CHAR数据类型是定长字符串。例如,将CHAR(5)数据类型设置为“ABC”将强制用空格填补在字符串末尾,以达到5个字符(“ABC”)。
平面文件(Flat file)—— 通常是指文本文件等非结构化文件的术语。
浮点(floating point)—— 一个实数,其中小数点可以在实数的任何位置。
外健(foreign key)—— 一种约束类型,列中包含主键值的副本,在父实体中被唯一标识,最常在一对多关系中表示儿子端或兄弟端。
正规方法(formal method)——
一个理论的应用、一套规则或一个方法论。限定或向其他完全无组织的系统应用结构。规范化是用于创建关系数据库模型的正规方法。
格式显示设定(format display setting)—— 用于确定字段内容显示格式的设定。例如当INTEGER
$9,999,990.99的数据类型定义设置为值500时,将显示为$500.00(格式模型可以为数据库所特有)。
FROM子句(FROM clause)—— 查询SELECT命令中决定要从中检索的表以及表的连接方式(当使用JOIN、ON和USING子句时)的部分。
前端(front-end)—— 顾客面对的软件。通常,可以是顾客购买的软件、Internet联机软件或顾客编写的内部软件。
完全函数依赖(full functional dependence)——
X决定Y,但是X与Z结合在一起并不决定Y。换言之,Y依赖于X,且只依赖于X。如果Y依赖于X以及其他事物,那么就不是全函数依赖。(见“函数依赖”。)
完全外部连接(full outer join)——
一个用来查找交集组合的查询,加上左边表中的记录,而不是右边表中的记录,以及右边表中的记录,而不是左边表中的记录(左外连接和右外连接的组合)。
函数(function)——
一个程序设计单元,或返回一个值的表达式,也允许将决定因子值作为参数传递。因此,参数值可以修改结果,或返回函数的结果。函数的妙处是它是自包含的,因此可以嵌套进表达式中。
函数依赖(functional dependence)——
如果Y的值由X决定,那么Y函数依赖于X。换言之,如果Y=X+1,那么X的值将决定Y的结果值。因此,Y作为X的函数值依赖于X。函数依赖是决定关系的对立面。(见“完全函数依赖”。)

通用数据库模型(generic database model)­——
数据库模型通常由一组关于元数据的局部元数据;换言之,表中包含带数据的表。在如今的非常繁忙的大型数据库中,它可能效率非常低。
粒度(granularity)——
细节存储的深度,通常用于数据仓库。数据仓库包含的粒度越细,事实表会越大。因为事实表中包含的记录会越多。最安全的选择是包括一直到最低粒度级的所有历史记录。这样就可以确保详细分析未来可能需要的任何需求都能符合,而不会在将来出现数据丢失(假定硬件存储容量允许)。
网格计算(grid computing)—— 廉价计算机的群集,可能在全局范围内分布,甚至用一些像Internet一样的松散工具连接。
GROUP BY子句(GROUP BY clause)—— 在查询的SELECT命令中用来聚集记录,并将几个记录汇总到一个聚集组中。
散列索引(hash index)—— 散列算法用来将索引组织为一个序列。其中每个索引值可根据散列键值进行检索。散列索引对整型值有效,但是通常要遭受溢出的困扰。
异类系统(heterogeneous system)——
由不同的元素或部件组成的计算机系统。在数据库行话中,这是指一组应用程序和数据库,其中数据库引擎各不相同。换言之,一个公司可以有一个包含多个数据库引擎的数据库体系结构,比如Microsoft
Acess、Sybase、Oracle以及Ingres等。不管什么类型,所有数据库都合并在一个(显然是同一个)透明数据库-应用程序体系结构中。
层次结构数据库模型(hierarchical database model)——
倒置的树结构。这种模型的结构呈现出子-父的关系。每个子表只有一个父表,而每个父表可以有多个子表。子表通常完全依赖于父表;因此,只有父表存在,子表才能存在。因此,子表中的任何条目只能与父表中存在的条目相对应。该结构的结果是,层次结构数据库模型可以支持一对多关系,但不支持多对多关系。
同类系统(homogeneous system)—— 每个元素或组件是相同的,如数据库引擎、应用程序SDK等等。
热块(hot block)—— 热块是磁盘的一小部分,访问得太频繁时,会导致对特定区域的过度竞争。热块可导致一般数据库和应用程序性能的严重下降。
混合数据库(hybrid database)——
数据库安装混合了多个类型的数据库体系结构。通常,混合数据库将OLTP(高并发性)和数据仓库(重报表)包括在同一个数据库中(见“联机事务处理”。)
标识关系(identifying relationship)——
子表部分地由父表标识,部分地依赖于父表。父表主键包括在子表主键中。换言之,如果存在子记录,那么子表中的外键值必须设置为非NULL值。因此,除非存在相关父记录表,否则不能创建子表。换言之,子记录不能脱离相关的父记录而存在。
实现(implementation)—— 从软件的设计中创建软件的过程。物理数据库是数据库模型的实现。
非活动数据(inactive data)——
非活动数据是从OLTP数据库传递到数据仓库的信息,其中非活动数据并不定期用于顾客面对的OLTP数据库:非活动数据用在数据仓库中,用来基于历史的公司活动进行投影和预测。(见“联机事务处理”。)

索引(index)—— 通常(更适宜)非常小的一块表的副本,比如一个字段,更可能是一个短长度的字段。
索引组织表(Index Organized Table,IOT)——
在排序好的索引中构建一个表,通常使用B树索引。在有些数据库引擎中也称为群集索引,因为数据被群集到B树索引的形式和结构中。
索引顺序访问方法(Indexed Sequential Access Method,ISAM)索引——
使用带一列记录号的简单结构的方法。当从表中读取记录时,根据索引的顺序读取索引记录号,用索引和表之间的指针访问表中的记录。
内部(in-house)——
这个术语表示一个公司内部发生或存在的事。内部应用程序是只为公司员工服务的应用程序。内部网应用程序通常用在公司内部,或在其运作能力范围内。
内联约束(inline constraint)—— 当创建一个字段并应用到单个字段时创建的约束。
内部连接(inner join)—— 交叉的SQL术语,其中选中两个表中的记录,但是只检索相关的行,并互相连接。
输入掩蔽设定(input mask setting)—— 用来控制字段内容的输入格式的字段设定。例如,对于INTERGER
$990.99,会接受输入5000,但是不会接受输入500。
INSERT—— 用来向表添加新记录的命令。
插入异常(insert anomaly)­—— 除非一个记录在主表中存在,否则不能添加到明细表中。
整数(integer)—— 整数。例如,555是整数,而55.43不是整数。
Internet Explorer—— 用来上Internet的Microsoft Windows工具。
交集(intersection)—— 来自数学集合理论的术语,描述两个集合的公共条目(在两个集合中都存在)。
IOT—— 见“索引组织表(Index Organized Table)”。
迭代(iterative)—— 在计算机行话中,进程可反复地重复执行。其中不止有一个步骤,所有步骤都可以。有时是按任何顺序执行。
Java—— 一种有用的多用途编程语言,常用于构建前端应用程序。但是其用途不止于此。
连接(join)—— 连接查询是指从多个记录源(表)中查询到的记录合并在一起。可以用各种方式构建连接,比如设置交集、外部连接类型等等。
键(key)—— 决定唯一性的专门字段,或者通过主键和外键对参照完整性的应用。
KISS 规则(KISS rule)—— “Keep it simple stupid。”
Kluge—— 程序员常用这个术语来表示一个问题的粗陋或不优雅的解决方案。结果往往是计算机系统中含有大量几乎缺乏匹配的元素。
左外连接(left outer join)—— 一个查找交集组合的查询,加上表的左边的记录,而不是右边的记录。
遗留系统(legacy system)—— 使用过时的数据库引擎或应用工具的数据库或应用程序。有些遗留系统甚至可能是30、40年前的。
Linux—— 一种与Unix和Microsoft Windows相似的Open Source操作系统。
位置维度(location dimension)——
在数据仓库中使用的标准表,由事实表地址信息构成。创建位置维度有利于根据区域值分割事实(如国家、城市、州等等)的查询。
宏(macro)—— 一系列伪类型的命令,通常并不是实际编程语言,有时是根据基于GUI的命令建立的命令序列(比如在Microsoft
Access中看到的File菜单)。宏并不是真正的编程语言,而是高级用户构建的GUI驱动步骤序列。
多对多(many-to-many)——
这种关系表示两个表之间的未决关系。例如,大学里的学生一次可以选修多个课程。因此,一个学生可以在多个课程中注册,而一个课程中可以有多个注册的学生。这种解决方案将多对多关系分解为3个表,而不是2个表。每个原始表与新表都是一对多的关系,允许访问唯一记录(在本例中,是唯一的学生与课程的组合)。
物化视图(materialized view)——
物理上预先构造的数据的视图,其中含有复制到物化视图中的数据。物化视图在只读环境中效率很高。常用于复制、分发及用在数据仓库中。
元数据(metadata)—— 定义数据结构的表和字段;关于数据的数据。
方法(method)—— 等价于关系数据库存储过程,只是方法在对象的边界范围内执行对象的数据内容。
Microsoft Windows—— Microsoft Windows操作系统。
多值依赖(multi-valued dependency)——
包含逗号分隔的列表或某种集合的字段。集合可以是同样类型值的数组。这些多个值作为一个整体依赖于主键,整体是指在逗号分隔列表中的整个集合。每一个个别值都不依赖于主键。
嵌套查询(nested query)—— 在另一个查询内执行的查询。在理论上,查询可以嵌套任意层。唯一的限制是复杂性和程序员的能力。
网络(network)—— 连接的计算机的系统。局域网(LAN)在一个公司、一个办公室内部。广域网(WAN)通常跨地理区域分布——
甚至在全球分布。Internet是连接非常松散的网络,即任何人和每个人都可以使用。
网络数据库模型(network database model)——
本质上是层次结构数据库模型的细化。网络模型允许子表有多个父表,因此创建了一个类似网状的表结构。每个子表有多个父表的情况除了适用于一对多关系外,还适用于多对多关系。
非平凡多值依赖(non trivial multi-valued dependency)—— 表中有两个字段以上的多值依赖。(见“多值依赖”。)
非标识关系(non-identifying relationship)——
子表不依赖于父表,因此子表中将父表的主键作为外键包括进去,但不是作为子表主键的一部分。换言之,父记录不要求相关的记录在子表中存在。外键字段可以包含NULL值,而且不能成为主键的一部分,因为主键要求唯一性。
范式(Normal Form)——
包含在规范化过程内的步骤。范式是累积的,因此第三范式中的数据库模型同时也在第一和第二范式中。但是不会在Boyce-Codd(相当于第三范式)、第四范式、第五范式或域键范式中。
规范化(normalization)——
简化数据结构的过程。规范化会增加粒度,而粒度(Granularity)是任何特定事物的定义作用域。数据模型的粒度越多,越容易管理,当然,至于要点,取决于数据库模型的应用。
NOT NULL约束(NOT NULL constraint)—— 该约束是指一个字段中必须有值放在其中;否则将返回一个错误。
NULL—— 从来没有用任何值初始化的字段。当在表中创建或修改记录时,NULL字段设定允许字段中包含空值。
Number—— 数值数据类型,只允许各种格式的数字。
数字捣弄(number crunching)—— 计算机行话,指大量极其复杂的计算。
对象(object)——
在对象方法论中,在运行时类的创建(实例化),因此从一个类中可以创建多个对象实例。对象也是指任何实际事物的通用术语,比如关系数据库中的表。
对象数据库模型(object database model)——
向数据提供三维结构的模型,其中数据库中的任何条目可以快速地从任何点开始检索。尽管关系数据库模型常用于二维记录组的检索,对象数据库模型非常适用于唯一条目的查找。因此,当检索超过一个条目时,对象数据库模型执行非常缓慢,而这时使用关系数据库却相当不错。
对象-关系数据库模型(object-relationship database model)——
对象-关系数据库模型中包括从对象数据库模型转为关系数据库模型的最小方面。在某些方面,对象-关系数据库的创建是为了解决对象和关系数据库的冲突——
同时也是对象数据库模型的商业竞争对手。对象数据库模型在本质上是球形的。允许以极高的性能访问数据库结构内任何地方的惟一元素。当检索多个数据项时,对象数据库模型执行得非常慢。另一方面,关系数据库模型中包含跨两个维度的表中的数据记录。关系数据库模型最适用于数据组的检索,不过也可用来相当高效地访问唯一数据项。
OLAP—— 见“联机分析处理”。
OLTP—— 见“联机事务处理”。
ON子句(ON clause)——
ON子句是ANSI标准连接格式,当您想在一个连接中包括一个或多个字段(在不同的表中有不同的名称)时,允许存在精确的字段连接说明。
一对多关系(One-to-many relationship)—— 两个表之间的关系,其中一个表中有一个记录,另一个表中有多个相关记录。
联机分析处理(Online Analytical Processing,OLAP)——
一种向多个维度提供快速数据分析的功能,通常用于很大的数据库。分析的目标是强调趋势、模式和异常。
联机事务处理(Online Transaction Processing,OLTP)——
设计这些数据库用来适应Internet(联机)应用程序巨大的并发需求。OLTP数据库的并发执行会产生问题。Internet的用户数量比公司内部的客户机-服务器数据库用户数量大得无法想像。因此,OLTP数据库模型产生了并发需求——
完全超出了以前使用客户机-服务器数据库经验。
操作系统(operation system)—— 计算机上最低级别的软件,通常管理界面和硬件。Windows、UNIX和Linux都是操作系统。
运作(operations)—— 描述公司为产生利润从事的活动的术语。
优化器(optimizer)—— 在数据库引擎中应用到一个过程的术语,优化器试图找到在执行数据库中的SQL命令的最佳方法。
ORDER BY子句(ORDER BY clause)—— 查询SELECT命令调整,允许当记录从查询返回到数据库时重新排序。
外部连接(outer join)—— 在交集外添加行的交集,在一个表中而不在连接的其他表中。
溢出(overflow)—— 溢出是这种情况:新的数据添加到表或索引中,然而超出了最有效的结构外,后面的阅读效率可能会非常低。某些索引类型会遭遇溢出。
书面文档(paper trail)——
公司产生的文字,通过这些文字处理日常事务。公司在执行日常业务过程中很可能会产生这些书面文档,如,订单、发票、账单、支票等等。分析可以从公司的书面文档中获得很多信息。追踪书面文档是一种非常有用的收集公司业务操作过程的分析性细节的方法。
并行处理(parallel Processing)—— 
同时执行多件事,通常使用多个CPU(但并不总是如此)。此外,在分区时进行并行处理可以非常有效地改进性能。
分区(partitioning)——
将表物理地划分为独立的部分(分区),包括在多个分区上的并行处理和在单个分区上的单个操作。分区的一个特别有效方面是,它有能力在查询表时读取比组成表的所有分区少得多的分区,甚至只读取一个分区。这也称为分区截断(partition
pruning)。
性能(performance)—— 性能用来衡量数据库服务于应用程序、最终服务于终端用户的速度有多快。
规划(planning)——
对较大的项目采用项目计划和时间表的过程。项目计划通常包括:谁、在什么时候、做什么事。较复杂的计划将多个任务整合在一起,在多个人中共享,确保满足依赖性。例如,如果任务B要求先完成任务A,那么同一人可以既做任务A也做任务B。如果没有依赖性,那么,两个人可以同时做任务A和任务B。
高级用户(power-user)——
在对计算机的理解方面介于终端用户和专业计算机程序员之间的用户。终端用户将计算机作为解决业务问题的工具。计算机程序员写软件给终端用户使用。高级用户介于两者之间,通常是写自己的软件的终端用户。
优先级(precedence)—— 解表达式的顺序,通常是从左到右解表达式。
主键(primary key)—— 标识表中每行的唯一键。在关系的“多”端的实体有一个外键。外键列包含关系的“一”端上实体的主键值。
投影范式(Projection Normal Form,PJNF)—— 见“第五范式(5th Normal Form)”。
查询(query)—— 询问数据库并返回信息的语句。多数常用表都会被询问,并从这些表中返回记录。查询可以是简单的也可以是复杂的。查询用SQL
SELECT命令执行。
随机存取存储器(Random access memory,RAM)——
计算机内的存储芯片。RAM在CPU(处理器)和您的I/O外设之间提供一个超快的缓冲存储区域。
RDBMS—— 见“关系数据库管理系统”。
记录(record)——
表中字段结构的重复。记录重复表中的字段结构,每个重复字段可以(有时应该)有不同的值。表划分为字段和记录。字段在每个记录中的每个字段值上强制实行结构和数据类型细节。
廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks,RAID)——
一堆小的廉价磁盘。RAID阵列是一组磁盘,它们结合在一起作为一个逻辑磁盘。使用镜像和条带化RAID阵列可以有利于存储器容量、可恢复性和性能。镜像创建所有物理数据的复制副本。条带化将数据打碎为许多小块,这些小块可以并行访问。
参照完整性(referential integrity)——
验证相关的主键和外键值之间的有效性的过程(通常包含在关系数据库模型中)。例如,除非父表中有相关主键值,否则外键值不能添加到表中。类似地,删除主键值必然会删除子表中的所有记录,包括外键字段中的主键值。由此得出结论,如果外键在某处存在,那么不允许阻止主键记录的删除。
关系数据库管理系统(Relational Database Management System,RDBMS)——
使用包含带数据的表的数据库的系统。该管理系统部分是允许您访问数据库,并具有操作数据库及其中数据的能力的部分。
关系数据库模型(relational database model)——
向数据提供二维结构的模型。关系数据库模型或多或少地超出了层次结构的概念和限制,但是没有完全抛弃层次结构。可直接访问任何表,但是必须访问所有父对象。在指定表中要求用准确的数据值(如主键)填充层次结构(为了查找个别记录)的各级内容。
复制(replication)——
用来从主数据库复制和分发数据的方法,产生主数据库的若干副本。这些副本可以完全依赖于从属数据库或其他主数据库,能够将它们自身的修改传递回来。
右外连接(right outer join)—— 查找交集组合的查询,在右边表中加上记录,而不是在左边表中。
ROLLBACK—— 该命令撤销任何还没有用COMMIT命令提交的数据库修改。
SDK—— 软件开发工具箱,是一个包含编程语言(如Java)的工具。SDK常用来构建应用软件。
SELECT命令(SELECT command)——
用于执行数据库查询的命令。SELECT命令包含要从表中检索的所有字段。此外,SELECT命令可以有可选的其他用途,用来执行特殊查询,如用WHERE子句筛选,用ORDER
BY子句排序等。
自连接(self join)—— 将表中的记录连接到同一个表中。通常用于包含层次结构记录的表,如家谱。
半连接(Semi-join)—— 用子查询连接两个表,但是不必向调用查询返回任何字段值。当使用IN和EXISTS操作符时发生半连接。
次序(sequence)—— 允许自动生成数字序列,通常是连号的,如101、102和103等等。有些数据库引擎称之为自动计数器。
简单数据类型(simple datatype)—— 用于描述最基本的数据类型的术语,包含一个简单值,如整型值或字符串型值。
雪花模式(snowflake schema)—— 只有一个事实表结构,但是有多个层次结构维度表的数据仓库。
排序查询(sorted query)—— 见“ORDER BY子句”。
SQL—— 见“结构化查询语言”。
备用数据库(standby database)——
故障转移数据库。备用数据库的活动性最小,通常只是添加记录、修改现有记录及删除现有记录。然而,有些数据库引擎允许备用数据库作为辅助的活动数据库平台。
星型模式(star schema)—— 在数据仓库数据库中,一个事实表由单层层次结构的维度表包围。
静态数据(static data)—— 不作重大修改的数据。
存储函数(stored function)—— 与存储过程相同,只是它会返回一个值。
存储过程(stored procedure)—— 也称为数据库过程(database
procedure),存储在数据库中并从数据库中执行的一块代码,通常是存储在数据库中的数据(但不总是)。
字符串(string)—— 包含字母数字字符序列的简单数据类型。
结构化查询语言(Structured Query Language,SQL)——
不允许连续命令之间存在依赖性的非过程语言。SQL是用于访问关系数据库中的数据的语言。一般而言,对于任何除Microsoft
SQL-Server外的关系数据库来说,SQL念为“ess-queue-ell”而不是“sequel”。
代理键(surrogate key)­——
用作描述性主键的置换或替代品,可以有更好的控制、更好的结构、占用更少的存储空间、更高效的索引,且绝对保证唯一性。代理键通常是整数,通常用自动计数器或次序自动生成。
表(table)—— 一个实体,分为字段和记录。字段强行将结构和数据类型应用到记录中的每个字段上。
三级索引(tertiary index)—— 见“辅助索引”。
时间维度(time dimension)—— 用于数据仓库中的时间分析。
时间表(timeline)——
对于一个项目计划,谁、做什么、何时做的策划。项目计划和时间表对于较大的项目有用。项目计划通常包括谁、做什么、何时做。较复杂的计划会将多个任务整合在一起,在许多人中共享,确保满足依赖性。例如,如果任务B要求先完成任务A,那么同一个人可以既完成任务A又完成任务B。如果这两个任务之间没有依赖性,那么可以由两个人在同时完成任务A和任务B。
时间标记(timestamp)­—— 用来存储日期值的数据类型,后面跟着一天中的时刻。
事务(transaction)—— 在SQL中,是指一个或多个命令序列,其中的修改还没有永久地提交到数据库中。一旦提交或撤销(回滚)了修改,事务就完成。
事务控制(transactional control)——
由一个或多个对数据库进行修改的数据库修改命令组成的事务。事务在手工或自动执行COMMIT或ROLLBACK命令后完成。事务控制的概念是,SQL允许一组命令立即永久存储,或者立即撤销。
事务数据(transactional data)—— 关于一个公司的日常工作动态活动的数据,比如发票。
传递依赖(transitive dependence)—— 当X决定Y,而Y决定Z时,Z传递地依赖于X。因此,传递依赖这样描述,Z通过与Y的关系间接地依赖于X。
触发器(trigger)—— 当特定事件发生时执行的一块代码,通常发生在INSERT、UPDATE或DELETE命令前后。
平凡多值依赖(trivial multi-valued dependency)—— 表中只有两个字段的多值依赖。见“多值依赖”。
截短(truncate)—— 这个术语表示,从一个值中删除一些字符,通常用于不作舍入的数字截短。
元组(tuple)—— 见“记录”。
唯一键(unique key)—— 创建一个整个表中只包含一个值的字段上的键。
UNIX—— 比Microsoft Windows复杂得多也难管理得多的操作系统。然而,UNIX系统非常万能、非常有用,同时也非常昂贵。
UPDATE—— 该命令用来在表中修改记录中的数据。
更新异常(update anomaly)——
当不正确地更新主键和外键的关系时,如果数据库允许生成错误,这时就会生成一个错误。除非先更新所有相关子表中的兄弟记录,否则不能更新主表中的记录。注意可以用级联将修改传播到子表的兄弟记录中。
用户(user)—— 见“终端用户”。
用户友好(user-friendly)—— 表示对于非计算机专业人员,或者普通终端用户来说,比较容易使用的软件应用(或其他内容)。
有效性检验(valication check)—— 见“检验约束”。
变长记录(variable-lenth reccord)—— 表中的每个记录的字节长度都不一样。这就允许变长字符串(CHAR
VARYING(nn))之类的数据类型。最现代的关系数据库引擎使用变长记录。
变长字符串(variable-lengh string)—— 有0个或多个字符,直到最大字符长度的字符串。
视图(view)—— 逻辑覆盖图。每当访问视图时将执行其中包含的一个查询。在繁忙环境中,反复执行查询会大大降低视图效率。
WHERE子句(WHERE clause)——
是SELECT语句、UPDATE命令和DELETE命令中的可选子句,WHERE子句中允许包括想要的记录,筛选掉不想要的记录。
Windows Explorer—— 一种用来浏览和访问磁盘上的文件的Microsoft Windows工具。

posted on 2007-04-27 13:29    阅读(811)  评论(0编辑  收藏  举报

导航