论文阅读：Sequence to sequence learning for joint extraction of entities and relations

用以解决重叠关系问题

GGNNs模型

GGNNs（门控图神经网络，Gated Graph Neural Networks）是一种处理图结构数据的神经网络模型。它是图神经网络（GNN）的一个变体，使用了类似于长短时记忆网络（LSTM）中的门控机制来更有效地处理图中的信息流。

GGNNs的核心思想是通过在图结构中使用带门控的循环神经网络（如GRU或LSTM）来更新节点的状态。这种结构使得网络能够在多个时间步内维持和传递节点状态，进而捕捉节点间长距离的依赖关系。

节点状态更新：每个节点的状态是通过考虑其邻居的状态来更新的。这一过程通常使用GRU（门控循环单元）来实现，其中节点的当前状态和从邻居聚合的信息共同决定了节点状态的更新。
信息聚合：信息从节点的邻居那里聚合，通常使用加权和的形式。权重可以是固定的，也可以是通过学习得到的，依赖于节点间的关系类型。
门控机制：门控机制帮助模型决定在每个时间步应该保留多少旧状态，以及接受多少新的输入信息。这是通过一个sigmoid激活函数来实现的，它输出一个在0到1之间的值，作为更新的权重。

由编码器和解码器两部分组成。

首先建立了一个字典词汇表V，其中包含原始句子token、预定义的关系集R、两个特殊的分隔标记（";"和"and"）、起始目标标记（SOS）和未知词标记（UNK）。

嵌入层包括单词嵌入层和字符嵌入层。
给定一个句子x，它包含n个token和目标实体-关系三元组。

由于Bi-LSTM具有很强的句子语义特征提取能力，我们通过一层Bi-LSTM对词嵌入进行获取，以获取每个词的词隐藏状态。

为了更好地将区域特征与序列结构化特征相结合，我们通过依赖边缘、自边缘、前向边缘和后向边缘的关系建立了每个节点的边缘\(M\)。并利用GGNNs层来保持整个句子的图和序列结构。

\[g_i = GGNNs(M, h_i) \]

为了预测关系元组，采用一层单向LSTM作为解码器模块。

\[s_t = LSTM(h_{t-1}, y_{t-1}, s_{t-1}) \]

\[r_t = We_t + b \]

Liang Z, Du J. Sequence to sequence learning for joint extraction of entities and relations[J]. Neurocomputing, 2022, 501: 480-488.

posted @ 2024-07-29 12:12 Barn 阅读(96) 评论(0) 收藏举报

刷新页面返回顶部