Content to Node: Self-Translation Network Embedding

 
STNE:自翻译网络嵌入
该工作认为在节点属性与结构信息再本质上是有一定联系的,提出 STNE 模型,利用 seq2seq 模型进行特征提取,将利用节点信息及网络结构识别节点的过程比喻为翻译的过程

1. 简介

目的:学习网络中节点的低维表示
将利用节点信息及网络结构识别节点的过程比喻为翻译的过程
 
论文引用网络中,每个节点代表一篇论文,每条边代表引用关系。每个节点自身属性包括文章的摘要,关键词,研究领域等等。该论文的假设依据是,论文所形成的引用网络与论文自身的属性之间有较强关系
 
现有方案
1. 将结构信息和属性信息分别进行embedding之后,组合
2. 考虑短距离/固定邻域范围保留结构信息(第一/二邻近)
(复杂问题中很难确定邻域范围)
 

2. 创新点(贡献):

提出基于seq2seq 的模型框架(STNE)
利用网络上随机遍历生成的序列,将节点内容信息翻译成结构信息,从而结合两种信息
 
  • 将网络嵌入转化为 seq2seq 任务,从局部建模到序列的全局结构建模,捕获更多语义信息
  • 设计了一个异构的seq2seq 模型,嵌入原始输入文本,以端到端的方式学习从节点属性序列到节点指示序列的映射
对比
  • 与传统方法相比, STNE 直接节点序列对建模,从文本序列中自动学习生成函数,将 seq2seq 网络模型与其他文本嵌入模型相结合,通过学习内容序列到节点序列的映射,将内容信息和结构信息无缝融合到隐藏层的潜在向量中,高效表示节点
  • 根据与节点的不同交互提出上下文感知嵌入
  • 相对于 CANE: 从相邻文本节点感知嵌入
  • STNE:针对不同序列学习动态的节点嵌入(需要更长范围,更灵活的上下文)

3. 模型框架

STNE 总体框架

 

 
图一总体框架:
1. 给定内容丰富的网络,通过随机游走提取节点序列,并将节点序列分为两个部分
  • 节点属性序列
  • 节点指示序列(由节点指示向量 one-hot 表示)
2. 通过这两个序列学习特定的 seq2seq 模型,该模型可以用于将节点属性“翻译”为节点指示向量
3. 步骤二的目的是得到中间层的潜在转换( 是可用于复杂网络分析 )

4. 方法过程

 
由图2 可看出,该过程为:
  • 节点属性---->低维表示( Encoder )
  • 低维表示---->节点序列( Decoder )
 
并行序列 S 包含:
节点身份序列 Si 和 相关内容序列 Sc
(使用并行序列将网络嵌入转化为机器翻译问题,从内容到节点的异构自翻译过程)
 
映射函数 Sc->Si

 

 更详细的总结
posted @ 2018-10-29 20:09  超然haha  阅读(982)  评论(0编辑  收藏  举报
back to top