as火柴人

导航

共指消解

1. 共指消解的一些基本概念。

实体(entity):知识库中完整定义的,唯一存在的条目,在coreference resolution这个任务中,每一个实体都可以看作是指代它的名词短语或代词构成的集合(巴拉克-奥巴马={美国总统奥巴马第44任美国总统})

指称(mention):实体在自然语言文本中的别名或另一种指代形式,美国总统, 奥巴马, 第44任美国总统, 他 等都是mention。mention的类型一般有3类:专有名词(proper noun,巴拉克-奥巴马),名词性词(nominal, 第44任美国总统),代词(pronominal, 他)

共指(corefer):如果文本或句子中的两个mention指代的是同一个entity,那么它们之间存在着一种共指(corefer)关系。美国总统第44任美国总统 即是共指的两个mention

 spans: “我”,“爱北京”,“北京”

回指语:简略的表达,需要依赖先行语来进行解读。

先行语:

 2. 指代消解

https://blog.csdn.net/muumian123/article/details/85616175

 指代消解就是寻找篇章中先行语与照应语之间的关系,并明确给出照应语所指向的先行语的过程。

分类:预指消解;回指消解(按着先行词与照应语的顺序)

  名词,代词,零代词。普通名词消解(按着照应语的抽象程度)

       共指消解(共指关系在脱离上下文的语义仍旧独立存在,与上下文关系较弱。)

  非等价消解(存在着非对称的关系并且和上下文的语义有着紧密联系,在不同的语义和语境下照应语指代的先行语不同)

3.指代消除的方法

基于启发式语言学规则的消解方法:早期 Hobbs算法、基于中心理论等算法;近期基于层次过滤消解模型的方法。

 

4.  共指消解的模型:

指代:不只是代词能够指代其他事物,所有格和其他名词性短语也可以。但是并不是所有的NP都在指代。

传统的指代消解方法:Hobb 规则集消解;知识库的代词消解;

指代消解模型:

 Mention Pair models;Mention ranking models;Entity-Mention models;监督Mention-Pair Model

神经网络指代消解模型:虽然直觉上,联合学习所有mention之间的指代关系肯定比单个二分类要好,global比local肯定要好。但实际上没有试验数据能够支撑这一点,所以虽然有global RNN等更强大的模型,效果最好的依然是mention-pair或mention-ranking模型。

 

用得比较多的是:监督Mention-Pair Model。每个mention(指代)与之前的mention做二分类决策,当然如何识别mention是另外一个问题。

 参考:

https://blog.csdn.net/github_36088377/article/details/52496142

 

posted on 2019-07-12 20:03  as火柴人  阅读(856)  评论(0)    收藏  举报