马尔可夫随机场
马尔可夫随机场(Markov Random Field,简称MRF)是典型的马尔可夫网,这是一种著名的无向图模型。图中每个结点表示一个或一组变量,结点之间的边表示两个变量之间的依赖关系。马尔可夫随机场有一组势函数(potential functions),亦称“因子”(factor),这是定义在变量子集上的非负实函数,主要用于定义概率分布函数。
图 14.2 一个简单的马尔可夫随机场
图14.2显示出一个简单的马尔可夫随机场。对于图中结点的一个子集,若其中任意两结点间都有边连接,则称该结点子集为一个“团”(clique)。若在一个团中加入另外任何一个结点都不再形成团,则称该团为“极大团”(maximal clique);换言之,极大团就是不能被其它团所包含的团。例如,在图14.2中,和
都是团,并且除了
和
之外都是极大团;但是,因为
和
之间缺乏连接,
并不构成团.显然,每个结点至少出现在一个极大团中.
在马尔可夫随机场中,多个变量之间的联合概率分布能基于团分解为多个因子的乘积,每个因子仅与一个团相关.具体来说,对于个变量
,所有团构成的集合为
,与团
对应的变量集合记为
,则联合概率分布
定义为
其中为与团
对应的势函数,用于对团
中的变量关系进行建模,
为规范化因子,以确保
是被正确定义的概率.在实际应用中,精确计算
通常很困难,但许多任务往往并不需获得
的精确值.
显然,若变量个数较多,则团的数目将会很多(例如,所有相互连接的两个变量都会构成团), 这就意味着会有很多乘积项,显然会给计算带来负担.注意到若团
不是极大团,则它必被一个极大团
所包含,即
;这意味着变量
之间的关系不仅体现在势函数
中,还体现在
中。于是,联合概率
可基于极大团来定义.假定所有极大团构成的集合为
,则有
其中为规范化因子。例如图14.2中
,联合概率分布
定义为
,
其中,势函数定义在极大团
上,由于它的存在,使我们不再需为团
和
构建势函数.
在马尔可夫随机场中如何得到”条件独立性”呢?同样借助“分离”的概念,如图 14.3所示,若从结点集A中的结点到B中的结点都必须经过结点集C中的结点,则称结点集A和B被结点集C分离,C称为“分离集”(separating set).对马尔可夫随机场,有
- “全局马尔可夫性”(global Markov property): 给定两个变量子集的分离集,则这两个变量子集条件独立。
也就是说,图 14.3中若令A,B和C对应的变量集分别为和
,则
和
在给定
的条件下独立,记为
.
图 14.3 结点集A和B被结点集C分离
为便于讨论,我们令图 14.3中的A, B和C分别对应变量和
,于是图 14.3简化为图 14.4.
图 14.4 图 14.3的简化版
对于图 14.4,可得联合概率
.
基于条件概率的定义可得……
即和
在给定
时条件独立。
由全局马尔可夫性可得到两个很有用推论:
- 局部马尔可夫性(local Markov property): 给定某变量的邻接变量,则该变量条件独立于其他变量。形式化地说,令
为图的结点集,
为结点
在图上的邻接结点,
,有
.
- 成对马尔可夫性(pairwise Markov property): 给定所有其他变量,两个非临接变量条件独立。形式化地说,令图的结点集和边集分别为
和
,对图中的两个结点
和
,若
,则
.
现在我们来考察马尔可夫随机场中的势函数。显然,势函数的作用是定量刻画变量集
中变量之间的相关关系,它应该是非负函数,且在所偏好的变量取值上有较大函数值。例如,假定图 14.4中的变量均为二值变量,若势函数为
则说明该模型偏好变量与
拥有相同的取值,
与
拥有不同的取值;换言之,在该模型中
与
正相关,
与
负相关。易知,令
与
相同且
与
不同的变量值指派将取得较高的联合概率。
为了满足非负性,指数函数常被用于定义势函数,即
是一个定义在变量
上的实值函数,常见形式为:
其中和
是参数.上式中的第二项仅考虑单结点,第一项则考虑每一对结点的关系.