SA集群

聚类大型属性信息网络:一种高效的增量计算方法近年来,许多信息网络已经可以用于分析,包括社会网络、道路网络、传感器网络、生物网络等。图聚类在分析和可视化大型网络方面显示出其有效性。图聚类的目标是根据顶点连通性或邻域相似度等不同的准则将图中的顶点划分成簇。现有的许多图聚类方法主要集中在图的拓扑结构上,而忽略了通常是异构的顶点属性。最近,提出了一种新的图聚类算法SA-cluster,它通过统一的距离度量将结构相似性和属性相似性结合起来。SA-Cluster通过矩阵乘法计算图顶点之间的随机游走距离。作为聚类精化的一部分,图的边缘权重被反复调整以平衡结构相似度和属性相似度之间的相对重要性。因此,在聚类过程的每次迭代中重复矩阵乘法,以重新计算受边缘权重更新影响的随机行走距离。为了提高SA聚类的效率和可扩展性,本文提出了一种有效的算法Inc-cluster,在给定边缘权值增量的情况下,对随机行走距离进行增量更新。提供了复杂性分析来估计Inc集群可以节省多少运行时开销。在多核体系结构上进一步设计了并行矩阵计算技术。实验结果表明,Inc聚类在大图上比SA聚类具有显著的加速效果,同时在簇内结构内聚性和属性值均匀性方面达到了完全相同的聚类质量。