不确定理论与多传感器数据融合 - 引用形式体系

1. 引言

在上一篇文章中,我们谈论到,多传感器系统中被操控信息的必然缺陷,意味着必须在不确定性理论的背景下展开研究,并发展必要的运算。因此,我们本文重点讨论几个核心的形式体系:

  • 概率
  • 模糊集
  • 可能性
  • 可信度函数

本文的目的是提供这些不同形式的体系原理,以确定每一个理论体系的潜在贡献以及互相之间的关联。

 

2. 概率

经典的、长期有效的概率论,一直是学术界的研究热点。今天,它是工业控制系统传感器数据融合最广泛使用的工具之一。这一成功归功于其实施的简单性及其对经典问题的有效性。

然而,在输入数据存在重大和复杂的缺陷面签,经典概率论很快被证明是有限的。

0x1:基础概念、公式定义

考虑 I 个互斥的可能事件的一个离散详尽的集合:

定义为应用 E 在 [0,1] 上的概率度量,用来表示每个事件发生的似然性

概率度量由下面几个属性定义:

  • 如果
  • 如果,那么

考虑一个有趣的概念是条件概率,当 E 中只有给定子集 B 中的元素可实现时,条件概率是 E 的任何子集 A 的概率

也可以使用基于由笛卡尔积定义的联合概率同时处理不同的集合

这产生了边缘概率的概念:对笛卡尔乘积其中一个元素 E1 的联合概率的投影

由此产生了定义在 E1 上的变量的条件概率的概念,受定义在 E2 上的变量的条件限制:

 

此外,独立变量 A 和 B 的概念定义为:

因此,概率专门用于处理【不确定性】,它们的形式提供了一个适当的框架以应对来自传感器数据融合的不同问题。此外,与统计数据的联系意味着它们是用于解释本质随机观察数据的一种广泛使用的工具

另外,也可以将其用于处理某种形式的不精确性。例如,一个不精确的测量可以解释为观察值上叠加了一个随机过程(噪声)。这就导致了系统处理的问题可能不同于实际的知之甚少的问题,从而导致错误的结论。这就是所谓的“概率建模失真问题”,由于现实世界中的问题无法精确地通过概率论方法进行建模,概率模型和目标问题之间存在着一些“概括失真”,这是大多数时候,基于概率论模型很难直接解决现实世界问题的原因。 

 

3. 模糊集

模糊集理论于1965年由 L.Zadeh 引入,用于处理定义不清的数值。它的主观信息建模能力及其简单可实现性,很快促使其在模糊逻辑和模糊控制领域得到广泛应用。

虽然在传统方法能够找到问题的精确解的情况下,它不如传统的优化控制表现好,但是当控制系统高度非线性,或者不能得到能充分代表其操作的模型时,模糊控制显示出极高的鲁棒性。在这样的情况下,它能够用简单的判断力强的规则代替不适当的模型。

模糊逻辑的成功归因于在复杂的情况下,它能立即整合专家的专门知识,并将其用于极其简单的操作服务中,同时提供一个与传统的运算相比不那么“粗”的处理方案的能力。

0x1:基础概念、公式定义

考虑一个“经典”的定义在连续空间中的集合 X={x}。模糊集 A 可以通过下式定义在 X 上:

其中,表示 x 对于 A 的隶属函数:

上式表达了一个元素 x 不是必然在 A 内或 A 外,而是可以同时部分在内部,部分在外部。

隶属函数表示它对 A 的隶属比例,因此,这种形式可以用来表达 X 上 A 的不精确的定义。

下图显示了一个隶属函数典型的示例,

 

表示的概念有:

  • 支持:所有 x 值的集合可能属于 A
  • 内核:x 值的集合绝对属于 A
  • α-切:x 值的集合以程度 α 属于 A
  • 基数 |A|:隶属函数的面积

因此,基本的集合论的运算可以通过隶属函数的关系来定义。这些运算几乎保留了经典集合论的所有结构,并有助于建立数据融合必要的运算。

  • 等于:
  • 包含:
  • 交集:
  • 联合:
  • 互补性:

另外,也可以在“常规”集合 X 和 Y 之间通过这两个集合的笛卡尔乘积 X x Y 上的隶属函数 μR 定义一个模糊关系 R:

模糊关系的这一概念对应于【不精确性】的处理。即两个空间之间不清晰连接关系的描述

由此引出下面两个概念:

  • R-1:这是 R 的逆运算关系,
  • 组合 

同样,在 X x X 上也可以定义经典的关系属性:

  • 反射性:
  • 传递性:
  • 对称性:
  • 反对称性:

这意味着:

  • 第一,可以用反射性、传递性、对称性的属性,引入模糊相似关系
  • 第二,可以用反射性、传递性、反对称性的属性,引入模糊顺序关系

0x2:模糊集理论和概率论之间的关系

基于模糊集理论的基础概念和公式定义,可以确定定义集合 X 的模糊子集的事件 A 的概率,其基本事件 x 的概率密度 p(x) 已知:

这就能够建立一个事件的不精确性及其发生的概率之间的联系。

因此,模糊集适合于表达不精确性,但可以与概率协同运算,以共同处理不确定性。

同时,接下来还会讨论到,模糊集理论还提供与可能性理论,且间接与可信度函数的内在联系。模糊集是许多涉及多准则决策相关解决方案的基础。

0x3:模糊集理论的优缺点

模糊集基于一种非常简单的形式,直观的容易实现,代表了一种描述主观信息的流行方法。

但是,模糊集也缺少解释本形式内清楚定义的值的可用的严格方法。

 

4. 可能性理论

Zadeh基于他自己的模糊集理论,发展了意图应对事件不确定性的可能性理论,可能性理论直接受到处理不精确性的模糊集形式的启发,同时在处理不确定性方面,它和概率论的概念非常相似,但在定义的细节上有所不同。

0x1:基础概念、公式定义

考虑 I 个互斥的可能事件的一个离散详尽的集合:

这里,定义 E 在 [0,1] 上的应用的两个度量:

  • 可能性的度量,满足:

  • 必要性的度量,满足:

通过比较上述定义与概率论中对概率的定义,可以看到,这里将 E 的任意子集的相对严格的加性属性替换为似然性的强函数和弱函数的概念。

基于以上定义,E 中包含的 A 和 B 具有以下属性:

 

上式意味着区间 [必要性,可能性] 总是必定具有或者等于0的下限,或者等于1的上限,并且在任何情况下是包含在 [0,1] 内的任意区间

因此,可能性理论的形式表示,一个事件在开始成为必然之前必须是完全可能的。 

根据概率,可以用一个连续的空间 X = {x} 取代离散空间 E,并在 [0,1] 上定义一个 X 的可能性分布函数 π(x)。因此,对于 X 的任何子集 A,有:

归一化:

为了处理伴随概率产生的两个不同集合之间的关系,可以在两个空间 X={x} 和 Y={y} 之间定义联合可能性分布,

这个分布是 [0,1] 上 X x Y 的函数。

这能够引入边际可能性,作为联合可能性在其分向量 X 上的投影:

当定义在 X 上的变量 x 受定义在 Y 上的变量 y 约束时,条件可能性可以表示为:

集合 X 和 Y 非交互的概念最终可以上面方程中推导出,反映出概率独立性的定义

0x2:模糊集理论和可能性理论之间的关系

可以在模糊集理论和可能性理论之间建立一个特别有趣而深刻的联系。

如果知道一个属性是通过 X 上定义的模糊集合 A 的隶属函数 μA(x) 精确描述的,可以推断出该属性将呈现一个确切值 x 的可能性 πA(x),即:

但是,应该指出的是,这种关系只有当 A 的内核非空、满足可能性分布的归一条件时才有效。

显然,这种等价的优点是,它将确定但不精确的信息(证实实现了模糊集的数值)转换为精确但不确定的信息(特定值发生的可能性),反之亦然。

这需要与通过测量噪声的随机过程,描述测量误差(评价的不精确性)时所发生的情形进行比较。 

这一简要概述,揭示了概率和可能性方法之间非常显著的相似性。

简单地说,这两种方法之间的区别在于以下几点

  • 分布归一化为 1 的不同
    • 概率通过积分的方式归一化 1
    • 可能性通过极值的方式归一化为 1
  • 表达可用知识的自由度的不同
    • 概率考虑加性约束
    • 似然性需要由 [必要性,可能性] 区间确定事件发生的可能性,因而表达可用知识时更自由

这些差异意味着,概率和可能性是相容的概念:即概率不能在形式上转变成可能性,反之亦然

0x3:可能性理论的优缺点

可能性具有容易实现、开放和直观的优点,特别是在表达主观性方法。可能性理论和模糊集之间的联系也有助于处理不精确性和不确定性的双重性。

然而,模糊集没有严格的方法解释在必然性和可能性方面明确定义的属性。 

  

5. 可信度函数理论

可信度函数理论和Zadeh的模糊集理论大约出现在同一时间,最早的工作由Dempster完成,随后Shafer完成理论完整的形式化。

0x1:基础概念、公式定义

考虑 I 个互斥的可能事件的一个离散详尽的集合:

这里,将 E 标记为识别框架。

此外,可信度函数需要 E 的 2I 个子集中的 2E 个集合,包括空集∅。

在此基础上,定义该理论的基本函数,用于解释可获信息并讨论其属性。

1、基本函数

一般而言,可以使用区间 [0,1] 上定义的三个函数描述 E 的 2E 个子集中的每一个子集的似然性。

1)质量分布函数 m(.)

它描述所讨论的某个单元素 Hi 属于 E 的子集的可能性,但是没有这一子集,仍有可能对这些单元素进行区分。

值得一提的是,质量不会在组成所讨论的子集的单元素之间平均分布,而是完全针对那些单元素中的某一个,但并不知道是哪一个。

质量分布函数定义为:

此外,质量分布函数 m(.) 的主要元素是 2E 个元素中的元素A,这使得 m(A) 非空。

这个定义明确地定位了质量分布函数与概率函数的关系

除了通过概率关联 E 的每个单元素,质量分布函数也对 E 的所有子集有贡献。相比而言,两者具有相同的归一化的总体约束。因此,两种方法的本质区别是基于可信度函数允许的自由度。 

2)可信度函数 Cr(.)

从这个公式可以联想到概率的有启发性的相似性。如果在方程中用符号=取代符号≥,这一定义就产生了概率的定义。

换句话说,可信度函数只是以可能性理论的方法缓解了概率的加性约束

此外,这个定义能够建立质量分布函数和似然函数之间一对一的关系,即一个给定的质量分布函数对应一个独特的、完全定义的似然函数,反之亦然。 

根据上述方程,可以将可信度解释为所讨论的 E 的子集的最小似然性,因为可信度代表了涉及该子集的质量分布的总和

3)似然函数 Pl(.)

它通过下列关系分别与质量分布函数和可信度函数产生一对一的关联:

 

根据上述方程,可以将似然性解释为所讨论的 E 的子集的最大可能性,因为似然性代表了可能涉及该子集的质量分布的总和

0x2:可信度函数和概率论之间的关系

在下面的讨论中,将引入两个特殊函数,它们是可信度函数和概率论之间存在等价性的2个特例。

1、贝叶斯函数 mb(.)

该函数的特点是它的主要元素构成 E 的分区:

因为不存在多元素之间共享的质量分配,因此,它可以严格地转变成一个简单的概率函数:

2、一致性质量分布函数 mc(.)

这个定义表明的特性是所有的主要元素必然与其他的互锁:

以上这些定义导致以下的基本注记:

  • 概率描述了可信度函数的一种特殊情况,即主要元素构成了 E 的分区
  • 必要性和可能性也分别是可信度和似然性的特殊情况,这里它们与彼此互锁的主要元素相当

从上面两点注记可以看到,除了某些支持函数的特殊情况下,概率函数永远不可能与可能性(或必然性)的度量相同,反之亦然

因此,一方面的概率与另一方面的可能性是可信度函数的两种特殊形式,但它们彼此完全不兼容。因此,概率和可能性的集成只有在可信度函数的理论框架中得以实现。 

0x3:调节/失调

1、调节

所谓调节,是将 E 的任意给定的质量分布函数 m(.),转换成所有主要元素都包含在 A 中的函数 m(./A),途径是将 m(.) 的每个主要元素的质量分布,传递到包括在 A 上的部分,并将方程已经分配的质量分布归一化:

上述公式表明,当仅知道 m(./A) 时问题的不确定性,因为未知量的数目大于方程式的数目。因此,需要得到最小特异性的函数 m(.),即其尽可能多得分配最大数量的未定义质量到主要元素,从而使解决方案只受到可获知识的约束

对于识别框架 E 的任意子集 B,也可以使用似然函数表述为:

更务实的是,上述方程的转置直接给出了 A 的所有子集的似然性:

因此,除了 Pl(./A),m(.) 的完整重建还需要估计 Pl(A) 和 A 中包含的 E 的所有子集的似然性。通常情况下,这些值完全未知,上述特异性的最低程度认为它们等于1。

2、失调

失调是检验的反向操作。已知 E 的子集 A 的质量分布函数 m(./A),目的是重建 E 上的一个完整的质量分布函数 m(.)。

总的来说,调节和失调通过减轻转移知识到一个比当前空间更小或更大的空间的困难,有助于管理集合的大小。

0x4:细化/粗化

1、细化

一个识别框架 E1 = {H11,.....,HI11} 的每个假想 Hil 的细化 R,联合另一个识别框架 E2 = {H12,.....,Hi21} 的子集 R(HiI),使得 {R(H11),....,R(HI11)} 构成了 E2 的分区。

因此,细化的操作考虑到 E1 的每个单元素 HiI 本身代表 E2 中列举的一组更详细的假想 R(HiI)。

因此,通过所谓的“最小扩展”操作,定义在 E1 上的质量分布函数 m1(.) 提供了 E2 上的质量分布函数 m2(.):

这种操作相当容易完成,因为只需要投射质量分布函数 m1(.) 到其主要元素的精确的等值线上。

2、粗化

粗化是细化 R 的逆运算 R-1,因此,它是由来自识别框架 E2 的单元素与专用子集 R(HiI) 进行群运算得到的,随后将其与识别框架 E1 的单元素 HiI 相关联。

在这些条件下,定义在 E2 上的质量分布函数 m2(.) 通过变换得到 E1 上的质量分布函数 m1(.):

 

总的来说,细化和粗化意在操控集合的粒度,促使知识转移成更细的元素,或者元素的聚集体。

可以看到,通过结合调节/失调、细化/粗化运算,能够确保任意识别框架之间的征兆传输,因为可以同时处理其大小和粒度。 

 

posted @ 2020-06-04 11:37  郑瀚Andrew  阅读(752)  评论(0编辑  收藏  举报