共指消解
1. 共指消解的一些基本概念。
实体(entity):知识库中完整定义的,唯一存在的条目,在coreference resolution这个任务中,每一个实体都可以看作是指代它的名词短语或代词构成的集合(巴拉克-奥巴马={美国总统, 奥巴马, 第44任美国总统, 他})
指称(mention):实体在自然语言文本中的别名或另一种指代形式,美国总统, 奥巴马, 第44任美国总统, 他 等都是mention。mention的类型一般有3类:专有名词(proper noun,巴拉克-奥巴马),名词性词(nominal, 第44任美国总统),代词(pronominal, 他)
共指(corefer):如果文本或句子中的两个mention指代的是同一个entity,那么它们之间存在着一种共指(corefer)关系。美国总统与第44任美国总统 即是共指的两个mention

spans: “我”,“爱北京”,“北京”
回指语:简略的表达,需要依赖先行语来进行解读。
先行语:

2. 指代消解
https://blog.csdn.net/muumian123/article/details/85616175
指代消解就是寻找篇章中先行语与照应语之间的关系,并明确给出照应语所指向的先行语的过程。
分类:预指消解;回指消解(按着先行词与照应语的顺序)
名词,代词,零代词。普通名词消解(按着照应语的抽象程度)
共指消解(共指关系在脱离上下文的语义仍旧独立存在,与上下文关系较弱。)
非等价消解(存在着非对称的关系并且和上下文的语义有着紧密联系,在不同的语义和语境下照应语指代的先行语不同)
3.指代消除的方法
基于启发式语言学规则的消解方法:早期 Hobbs算法、基于中心理论等算法;近期基于层次过滤消解模型的方法。
4. 共指消解的模型:
指代:不只是代词能够指代其他事物,所有格和其他名词性短语也可以。但是并不是所有的NP都在指代。
传统的指代消解方法:Hobb 规则集消解;知识库的代词消解;
指代消解模型:
Mention Pair models;Mention ranking models;Entity-Mention models;监督Mention-Pair Model
神经网络指代消解模型:虽然直觉上,联合学习所有mention之间的指代关系肯定比单个二分类要好,global比local肯定要好。但实际上没有试验数据能够支撑这一点,所以虽然有global RNN等更强大的模型,效果最好的依然是mention-pair或mention-ranking模型。
用得比较多的是:监督Mention-Pair Model。每个mention(指代)与之前的mention做二分类决策,当然如何识别mention是另外一个问题。
参考:
https://blog.csdn.net/github_36088377/article/details/52496142
浙公网安备 33010602011771号