句法结构分析:基于PCFG的基本分析方法——给定一个句子W = w1w2wn和文法G,如何快速计算P(W|G)

内向算法:将s—>w1w2···wn的概率分解为求P(S—>BC,B—>w1w2···wk,C—>wk+1···wn)k=1···n。

定义,内向变量:非终结符号A—>wiwi+1···wj的概率记为αij(A)。

  αij(A)计算:

    αii(A)= P(A—>wi);

    αij(A)= ΣB,C Σk=iP(A—>BC)αik(B)α(k+1)j(C)

故,P(S—>BC,B—>w1w2···wk,C—>wk+1···wn)= α1n(S)。

内向算法步骤:

1.输入PCFG 、G(S)、和句子w1w2···wn

2.求得αii(A)= P(A—>wi),i∈(1,n),(可能有多个非终结符号输出wi);

3.α1n(s)= ΣB,C Σk=1P(S—>BC)α1k(B)α(k+1)n(C)  (递归的求解α1n(s),可能有些αij(A)会被重复用到,故这里需要记录他们的值)

posted @ 2018-06-26 21:34  微冷不觉寒  阅读(1231)  评论(0编辑  收藏  举报