隐马尔可夫模型（七）——隐马尔可夫模型的学习问题(前向后向算法）

隐马尔可夫模型的学习问题：给定一个输出序列O=O₁O₂...O_T,如何调节模型μ=(A,B,π）的参数，使得P(O|M)最大。

最大似然估计是一种解决方法，如果产生的状态序列为Q=q₁q₂...q_T,根据最大似然估计，可以通过以下公式推算：

π_i‘ = δ（q₁,s_i)

a_ij' = Q中从状态q_i转移到q_j的次数/Q中从状态q_i转移到另一状态（包括q_j)的次数

b_j(k)' = Q中从状态q_j发出符号V_k的次数/ Q中到达状态q_j的次数

δ（x,y)为克罗奈克函数，当x=y时，δ（x,y)=1；否则，δ（x,y)=0

但是注意，在实际中，状态Q=q₁q₂...q_T是观察不到的（隐变量），因此上述的这种求法是有问题的。幸好希望最大化，可以用于含有隐变量的统计模型的参数最大似然估计。基本思想是初始时，随机的给模型参数赋值，但是要遵循模型对参数的限制，例如，从一个状态发出的所有状态转移概率之和为1，得到模型μ₀。然后根据μ₀中的具体值，带入下式，可以得到u₁.依次往下迭代，直到收敛于最大似然估计值。这种迭代爬山算法可以局部使P(O|μ）最大。称为Baum-Welch算法或前向后向算法。

给定HMM的参数μ和观察序列O=O₁O₂...O_T,在时间t位于状态s_i,在时间t+1位于状态s_j的概率为ξ_t(i,j)=P(q_t=s_i,q_t+1=s_j|O,μ），公式推导如下：

................(1)

给定HMM μ 和序列O=O₁O₂...O_T，在时间t位于状态si的概率为：.........(2)

这样求μ的参数估计重新改写：

π_i‘ = r₁(i) ...........(3)

a_ij' = Q中从状态q_i转移到q_j的次数/Q中从状态q_i转移到另一状态（包括q_j)的次数

= ..........(4)

b_j(k)' = Q中从状态q_j发出符号V_k的次数/ Q中到达状态q_j的次数

= ..............(5)

前向后项算法：

step1 初始化：随机地给定参数 π_i, a_ij, b_j(k),使其满足条件：

由此得到μ₀，令i=0

step2 EM计算：

E步骤：根据（1）（2）式计算期望ξ_t(i,j) 和 r_t(i)

M步骤：根据期望ξ_t(i,j) 和 r_t(i),带入（3）（4）（5）重新得到π_i, a_ij, b_j(k)，得到μ_i+1

step3 循环计算： i = i+1, 直到π_i, a_ij, b_j(k)收敛

posted @ 2012-12-06 22:18 jihite 阅读(9620) 评论(4) 收藏举报

刷新页面返回顶部

jihite

不害怕不着急不要脸

隐马尔可夫模型（七）——隐马尔可夫模型的学习问题(前向后向算法）

公告

jihite

不害怕 不着急 不要脸

隐马尔可夫模型（七）——隐马尔可夫模型的学习问题(前向后向算法）

公告

不害怕不着急不要脸