《Multilingual Knowledge Graph Completion with Self-Supervised Adaptive Graph Alignment》(ACL22,多语言,知识图谱补全)
论文信息
- 论文题目:《Multilingual Knowledge Graph Completion with Self-Supervised Adaptive Graph Alignment》
- 论文链接:https://arxiv.org/pdf/2203.14987.pdf
- 代码链接:https://github.com/amzn/ss-aga-kgc
研究背景
多语言知识图谱补全。多语言KG不是相互独立的,它们通常会有一些共享的实体和关系(seed alignment),借助这些知识可以有利于知识向低完整性的KG传播。知识在多语言KG之间传播面临两大挑战:
- 不同KG存在着异质性,不同完整性、不同质量的KG不能等同看待
- seed alignment非常稀疏,并且人工标注成本很高。
模型介绍
模型整体架构图

关系感知的多知识图谱表征学习
SS-AGA将实体对齐看作是一种新的边类型,这样就可以将所有KG连接成一个整体。设计一个关系感知注意机制的GNN编码器来同时学习所有KG的向量表示,通过学习到的注意力权重来区分来自不同KG的对齐实体所传播的影响。具体的关系感知注意力机制如下:

然后利用知识图谱解码器基于学习到的KG向量表示来计算三元组的分数,从而进行预测。损失函数如下:

基于自监督的新对齐实体生成器
新对齐实体生成器依赖于两组实体向量表征:结构性向量表征和文本向量表征。将实体间的相似性建模为它们的结构性向量表征和文本向量表征的余弦相似度最大值。如果一对实体根据CSLS度量法则互为最近邻,则把它们生成为新的实体对。

额外使用自监督的方式来生成新实体对,从而提高生成质量。具体来说就是随机屏蔽掉一些对齐实体,让生成器恢复它们。损失函数如下:

实验结果

总结
本文充分结合了多个KG的知识进行多语言知识图谱补全,同时解决了seed alignment问题。但是还有两点可以继续深入研究:(1)充分利用实体和关系的文本信息 (2)zero seed alignment的情况。

浙公网安备 33010602011771号