功率图

PowerGraph:自然图上的分布式并行计算。大规模图结构计算是从目标广告到自然语言处理等任务的核心,并导致了包括Pregel和GraphLab在内的多个图形并行抽象的发展。然而,现实世界中常见的自然图具有高度扭曲的幂律度分布,这对这些抽象的假设提出了挑战,限制了性能和可伸缩性。在这篇文章中,我们描述了在现有的平行抽象的背景下自然图计算的挑战。然后我们介绍了PowerGraph抽象,它利用图形程序的内部结构来解决这些挑战。利用PowerGraph抽象,我们引入了一种利用幂律图结构的分布式图形布局和表示的新方法。我们对PowerGraph与两个流行的图并行系统进行了详细的分析和实验评估。最后,我们描述了三种不同的PowerGraph实现策略,并通过对大规模实际问题的实证评估,讨论了它们的相对优点。