图压缩与图摘要技术的简要介绍

目前用于解决图数据量大问题的技术包括图压缩和**图摘要**(Graph summarization)技术。

1. 图摘要
图摘要技术将具有较高相似度的节点合并成超节点,减少节点和边的数量以降低图的复杂度,主要方法有基于节点分组的方法、基于边分组的方法和基于稀疏化的方法等。
图摘要又叫作图概要,是一种降低大规模图的复杂度和描述长度的技术。它通过一些策略(如合并多个节点成一个超节点、去掉不重要的边等)创建一个摘要图,在降低图的成本的同时也保存了图的结构特征,使得到的摘要图能够更容易地支持图模式挖掘、可视化和邻域查询等下游任务。当前主要的图摘要方法是通过将多个节点压缩成一个超节点创建摘要图。
2. 图压缩
图压缩也是降低图规模的一种方法,和图摘要的区别是它不关注图的结构信息和语义信息,它的目标是尽可能地降低图的存储空间占用,使得大图数据可以存储在较小的磁盘空间上,以解决图数据量较大的问题。目前图压缩的研究还处于起步阶段,这些方法大多压缩节点的边,主要方法有基于顶点重排序的方法和基于邻接矩阵的方法等,其中较为常用的是基于节点重排的方法。
图压缩技术的目的是降低图数据的存储空间占用,并不保留图的结构特征,因此单纯的图压缩技术产生的压缩图不是图的结构,不能直接用于分析,必须进行解码操作
3. 两种技术的对比
这两类技术的侧重点不同,图摘要技术侧重于保存图的结构信息,它的输出是一个更为抽象紧凑的图,因此可以直接用于下游任务分析;图压缩技术则是以各种方式最大限度地降低图数据在磁盘空间或内存空间的存储占用,由于图压缩技术并不关注图的结构信息,因此在降低存储空间方面,图压缩效果更好,但是图压缩产生的图并不能直接使用,需要先对压缩后的图进行解码操作。
通过对比两种技术的特点可以发现,图摘要虽然能够降低图的复杂度,但为了能够恢复原始图和保存结构特征,它的效果比图压缩的效果差;而图压缩虽然能够更好地降低图的消耗,但是不能直接用于分析。

posted @ 2024-05-23 20:16  苍瑾  阅读(102)  评论(0)    收藏  举报