飞马座

PEGASUS:peta尺度图形挖掘系统的实现与观察。在本文中,我们描述了PEGASUS,一个开源的Peta图挖掘库,它执行典型的图挖掘任务,如计算图的直径、计算每个节点的半径和查找连接的组件。当图形的大小达到几GB、TB或PB时,对这样一个库的需求也随之增加。据我们所知,PEGASUS是第一个这样的库,它是在Hadoop平台上实现的,Hadoop平台是MapReduce的开源版本。许多图挖掘操作(PageRank、谱聚类、直径估计、连通分量等)本质上是一个重复的矩阵向量乘法。本文描述了飞马座的一个非常重要的原语,称为GIM-V(广义迭代矩阵向量乘法)。GIM-V经过高度优化,实现了(a)可用机器数量的良好放大(b)边缘数量的线性运行时间,以及(c)比未优化版本的GIM-V快5倍以上。我们的实验在M45上运行,M45是世界上最大的超级计算机之一。我们在几个真实的图表上报告了我们的发现,其中包括一个最大的公开网络图,感谢雅虎!,有67亿边缘。


zbMATH参考文献(参考 8篇文章 参考)

显示第1到第8个结果,共8个。
按年份排序(引用)

  1. Aydin,Kevin;Bateni,Mohammadhossein;Mirrokni,Vahab:通过线性嵌入实现分布式平衡分区(2019)
  2. 何启荣;尹俊明;邢,埃里克P.:互联网规模网络的潜在空间推理(2016)
  3. Slota,George M.;Madduri,Kamesh;Rajamanickam,Sivasankaran:使用标签传播的复杂网络划分(2016)
  4. Koutra,Danai;Kang,U.;Vreeken,Jilles;Faloutsos,Christos:总结和理解大型图表(2015)
  5. 曹涛,陶伟;蔡,石春;林毅兵:基于流量模式聚类的网络安全管理(2014)ioport公司
  6. Malliaros,Fragkiskos D.;Vazirgiannis,Michalis:定向网络中的聚类和社区检测:调查(2013年)
  7. 李磊;王丁丁;朱顺志;李涛:个性化新闻推荐:回顾与实验研究(2011)ioport公司
  8. Primpton,Steven J.;Devine,Karen D.:大规模图算法MPI中的MapReduce(2011)ioport公司