Temporal Link Prediction: A Survey时间链路预测综述

Keywords:Dynamic networks · Temporal networks · Link prediction

1 介绍

下图表示时变网络的三种常见表示,它们有助于捕获网络的动态

  • 快照:网络被表示为一系列静态网络,每一步一个。
  • 接触序列:如果交互持续时间可以忽略不计,则将网络表示为三个一组(i, j, t),其中i和j为实体,t为交互时间。
  • 区间图:若交互持续时间不可忽略,T(e)={(t1, t1 1),…,(tn,t n)},边缘e处于活动状态。

 

 

 2 背景

2.1 静态网络的链路预测

大多数算法都是将静态网络在特定时间段内进行预测,从而忽略了网络的时间特性。在静态网络中,链路预测是对网络中某一时刻缺少的链路进行预测,以获得网络的全貌。

2.2 Temporal Link Prediction: Problem Definition时间链路预测定义

让G = (V, E)是一个动态的网络,V是顶点的集合和每条边(u, V)휖E代表u和V之间的联系的快照G表示为G1, G2,……从时间步骤1到t,我们如何预测下一个时间步骤Gt+1的网络

 

 

 

2.3 时间链路预测的评估指标

(1)Area under curve(AUC):AUC 被广泛的用来作为链路预测评估指标。这个度量可以解释为随机选择的缺失链路比随机选择的不存在的链路获得更高的分数的概率,前提是所有未观察到的链路的排名。此度量的值在 0 和 1 之间。在 n 个独立比较中,如果缺失的链接有 n′ 得分较高,n′′相同,则 AUC 得分计算如下:
 
(2)Mean average precision(MAP):此度量是平均精度(AP)的扩展,其中计算所有 AP 的平均值以获得MAP 分数。它估计每个节点的精度并计算所有节点的平均值。计算如下:
(3)Area under precision recall(AUPR):AUPR 与召回反精确性密谋。它被认为是解决不平衡分类问题的一种更为相关的措施。
(4)F1-score:F1-score (F-score or F-measure) 是测试准确性的衡量标准。它同时考虑了测试的精确度和召回率来计算分数。该指标计算如下:

 3 时间链路预测技术

(1)矩阵分解(Matrix Factorization)

大致步骤:
  • 动态网络以矩阵形式表示(例如:邻接矩阵);
  • 各种低阶近似算法被用来表征和提取动态网络的基本特征;
  • 引入了几个参数以有效地捕获时间信息和网络属性;
  • 执行基于潜在特征的获得的时间链路预测。

 (2)概率方法(Probabilistic Approaches) 

大致步骤:
  • 动态网络表示为定期间隔的快照序列;
  • 最大似然方法或概率分布(如联合概率分布,伯纳利分布等)用于推断未来链接的可能性。

 (3)光谱聚类(Spectral Clustering)

大致步骤:
  • 动态网络以拉普拉斯矩阵的形式表示为一系列快照;
  • 图谱和图拉普拉斯图的低秩逼近形成了链路预测的基本特征;
  • 时间序列预测模型和线性系统模型等几种模型用于预测未来时间的特征向量;
  • 执行基于预测的特征向量执行链路预测。

 (4)时间序列(Time Series)

大致步骤:
  • 动态网络表示为不同时间段的快照序列;
  • 对于网络中的每对节点,都基于各种节点相似性度量来构建时间序列;
  • 使用时间序列预测模型以预测未来时间段的时间序列得分;
  • 执行基于预测分数执行链路预测。

 

(5)深度学习(Deep learning)

(5.1) 基于嵌入的时态链路预测(Embedding‑Based Temporal Link Prediction) 
 
大致步骤:
  • 为了捕获时间方面,将动态网络表示为快照序列或联系序列或间隔图;
  • 通过保留所有网络属性,使用各种基于深度学习的技术以将网络嵌入到低维向量空间中;
  • 可以预测未来一段时间的嵌入情况,从而确定该时间的网络结构;
  • 执行基于预测嵌入的时间链路预测。

 

(5.2) 基于受限玻尔兹曼机(RBM)(Restricted Boltzmann Machine (RBM) Based) 

大致步骤:
  • 动态网络以固定间隔的快照序列表示;
  • 基于对动态网络结构的观察序列,可以对结合了时间和邻近信息的 RBM 模型进行训练;
  • 计算邻居连接的概率以执行时间链路预测。 

 

 

(6) 其他方法

4、未来方向

矩阵分解技术结合了动态网络的线性特征。 为了提高预测精度,可以进行进一步的改进以考虑时间网络的非线性变化的复杂模式。 大多数概率方法采用最大似然方法。 与费时的最大似然方法相反,概率多层模型可以扩展为包含无向动态网络。 与其使用像FIR滤波器之类的单一线性系统模型,不如扩展基于频谱聚类的技术来部署分布式滤波器以捕获不同用户的潜在特征,这将更好。 时间序列可以有效地捕获网络的演变模式。 但是,计算保留所有网络属性的时间序列分数仍然是一项艰巨的任务。 此外,传统的时间序列预测技术无法捕获网络的非耳式变化时间模式。 因此,通过结合网络的非线性变化的时间模式来预测未来分数的有效时间序列预测方法可以提高时间链路预测的准确性。 嵌入技术通过保留所有网络属性,在将网络映射到低维空间中表现出出色的性能。 从嵌入中构造的时间序列得分将有效地捕获网络的不断发展的本质。 此外,在此时间序列上部署有效的时间序列预测模型将提高时间链接预测的准确性。

本文讨论的时间链路预测技术是在网络中的节点在所有时间段内保持相同的假设下进行的。 但是,在现实世界的异构网络中,节点和边都随时间增加或删除。 如何扩展时间链路预测技术以合并异构网络仍然是一个悬而未决的问题。 此外,绝大多数现实世界网络都与一组丰富的节点属性相关联,并且它们的属性值也有所不同。 扩展时间链路预测以合并归因网络将是未来的一项有前途的任务。 可以在现有系统中进行进一步的改进以减少计算复杂度,从而提高性能。

 

posted @ 2020-11-17 19:24  +D  阅读(1465)  评论(4编辑  收藏  举报