EM
1. 基本问题
EM算法是解决带有隐变量模型的方法,基本的模型假设为
由于引入了隐变量
![]()
,使得我们无法通过对
![]()
求偏导得到最优解。
2. 推导
根据jesen不等式,对于凹函数
,有
其中,
![]()
,当且仅当
![]()
时,“=”成立。而
![]()
是凹函数,因此
且
时,等号成立,取得最紧的下界。
也即
因此,当取得最紧的下界时,任何使得下界提升的
都能使
提升
3. 算法流程
输入:观测变量数据
,隐变量数据
,联合分布
,条件分布![]()
输出:模型参数![]()
(1)选择参数的初值![]()
(2)E step: 计算在
下最紧的下界
(3)M step: