社会网络模块化方法简介(转载)
模块度最优化(Modularity Optimisation)
Newman & Girvan [2004]提出了分割质量的测量
随机图不应该有群体结构
通过比较实际的节点密度与随机图中的节点期望密度里验证群体的存在
Q = (群体中存在的节点数) − (群体中期望存在的节点数)
应用聚合技术迭代合并节点组组成更大的群体,使模块度在合并后提升。
近期出现的模块度最大化的高效贪婪方法可以将图的规模扩展到10的9次方个节点。
Louvain Method [Blondel et al, 2008]
应用在团体发现的问题:
图的总节点数控制哪个团体被识别[Fortunato, 2010]
仅将节点分配给一个团体是否合理?
重叠VS不重叠
在现实的社交网络中,一个节点可能属于多个团体。
在许多的现实网络中,真正的“非重叠”团体很少大规模出现[Leskovec et al, 2008]。
团体重叠的普遍存在,使得无法分割网络而不拆分团体[Reid et al, 2011]。
Overlapping In Large Graph
重叠的团体发现
CFinder:基于小团体渗透技术(clique percolation method [Palla et al, 2005])的一种算法。
K-Clique识别:是完全连接的K各节点的子图。
如果一对K-Clique共享K-1Clique,那么,这两个K-Clique是临近的。
从最大的K-Cliques的组合就可以构成重叠的团体。
K-Cliques的组合是指可以通过临近的K-Clique互相达到的一组K-Clique。
贪婪小团体扩展(Greedy Clique Expansion,GCE):识别不同的小团体作为种子,通过优化本地适应性函数贪婪扩展这些种子[Lee et al, 2010]。
MOSES:识别高度重叠的团体的可扩展方法[McDaid et al, 2010]。
随机选择一条边,在这个边周围贪婪地扩展一个团体,以便优化目标函数。
删除“低质量”的团体
通过重新分配个别节点对团体进行微调
动态团体发现(Dynamic Community Finding)
在许多社交网络分析任务中,需要分析随着时间变化,团体是如何创建和发展的。
通常以“线下的”方式检查大量网络的快照来进行这项研究。
Snapshot of Network
可以用生命周期中的关键事件来描述动态团体的特征[Palla et al, 2007; Berger-Wolf et al, 2007]。
为图的每个快照应用团体发现算法。
将新生成”后续团体”与过去发现的团体进行匹配。
浙公网安备 33010602011771号