×

并行最大团算法及其在网络分析中的应用。 (英语) Zbl 1323.05103号

摘要:我们提出了一种用于大型稀疏图的快速并行最大团算法,该算法旨在利用社会和信息网络的特性。该方法在实际网络中显示了大致线性的运行时扩展,范围从1000万到1亿个节点。在一个有18亿条边的社交网络上进行的测试中,该算法在大约20分钟内找到了最大的群组。该算法的核心是采用一种分枝定界策略和新颖而积极的修剪技术。修剪技术包括结合使用顶点的核心数和良好的初始启发式解决方案,以删除绝大多数搜索空间。此外,搜索树的探索是并行的。在搜索过程中,进程会立即传达对最大集团大小的上限和下限的更改。这种信息交换有时会导致超线性加速,因为具有较大搜索空间的任务可以被其他进程修剪。我们使用两个不同的网络分析问题演示了算法对应用程序的影响:计算动态网络中的时间强分量和确定大规模网络节点的压缩友好排序。

MSC公司:

05C69号 具有特殊性质的顶点子集(支配集、独立集、集团等)
05C82号 小世界图形、复杂网络(图形理论方面)
05C85号 图形算法(图形理论方面)
05C90年 图论的应用
90C27型 组合优化
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] N.K.Ahmed、F.Berchmans、J.Neville和R.Kompella,{社交网络活动图的基于时间的采样},《第八届图形挖掘与学习研讨会论文集》(MLG’10),美国计算机学会,华盛顿特区,2010年,第1-9页。
[2] V.Batagelj和M.Zaversnik,网络核分解的{it An\(o(M)\)算法},arXiv:03100492003·Zbl 1284.05252号
[3] S.Bhadra和A.Ferreira,{演化图中连通组件的复杂性和动态网络中多播树的计算},载于ADHOC-NOW 2003年会议录,计算讲义。科学。2865,Springer,纽约,2003年,第259-270页。
[4] P.Boldi、B.Codenotti、M.Santini和S.Vigna,{\it UbiCrawler:一个可扩展的完全分布式网络爬虫},Softw。实际。专家。,34(2004),第711-726页。
[5] P.Boldi、M.Rosa、M.Santini和S.Vigna,{分层标签传播:压缩社交网络的多分辨率无坐标排序},《第20届国际互联网会议论文集》,ACM,纽约,2011年,第587-596页。
[6] P.Boldi和S.Vigna,{\it网络图框架I:压缩技术},《第13届国际互联网会议论文集》,ACM,纽约,2004年,第595-602页。
[7] P.Boldi和S.Vigna,{万维网代码},互联网数学。,2(2005),第407-429页·Zbl 1101.94013号
[8] I.M.Bomze、M.Budinich、P.M.Pardalos和M.Pelillo,{最大团问题},收录于《组合优化手册》4,D.-Z.Du和P.Pardallos,eds.,Springer,纽约,1999年,第1-74页·兹比尔1253.90188
[9] C.Bron和J.Kerbosch,{it Algorithm 457:求无向图的所有团},美国通信协会,16(1973),第575-577页·Zbl 0261.68018号
[10] G.Buehrer和K.Chellapilla,{\it一种可扩展的模式挖掘方法,用于社区的web图形压缩},《web搜索和web数据挖掘国际会议论文集》(WSDM2008),ACM,纽约,2008年,第95-106页。
[11] CAIDA,{\it Skitter},软件可从\burlhttp://caida.org/tools/measument/skitter/。
[12] M.Charikar,{寻找图中稠密分量的贪婪近似算法},《第三届组合优化近似算法国际研讨会论文集》(APPROX'00),Springer-Verlag,纽约,柏林,2000年,第84-95页·Zbl 0976.05062号
[13] 程建华,柯义勇,傅华清,于建新,朱立群,{在大规模网络中寻找最大团},ACM Trans。数据库系统。,36 (2011), 21.
[14] J.Cheng,L.Zhu,Y.Ke,and S.Chu,{有限内存最大团枚举的快速算法},《ACM SIGKDD学报》,2012年,第1240-1248页。
[15] E.Cho、S.A.Myers和J.Leskovec,《友谊与移动性:基于位置的社交网络中的用户运动》,载于《第17届ACM SIGKDD国际知识发现和数据挖掘会议论文集》(KDD’11),ACM,纽约,2011年,第1082-1090页。
[16] M.D.Conover、J.Ratkiewicz、M.Francisco、B.Gonçalves、A.Flammini和F.Menczer,《推特上的政治两极化》,载《第五届AAAI网络日志和社交媒体国际会议(ICWSM)论文集》,2011年,第89-96页。
[17] P.G.Constantine和D.F.Gleich,《在PageRank模型中使用多项式混沌来计算多个随机冲浪者的影响》,发表在第五届网络图算法和模型研讨会论文集(WAW2007)上,A.Bonato和F.C.Graham编辑,《计算讲义》。科学。4863,Springer,纽约,2007年,第82-95页·Zbl 1136.68321号
[18] G.Csardi和T.Nepusz,《复杂网络研究的igraph软件包》,国际期刊,复杂系统,(2006),1695;在线时间:http://necsi.org/events/iccs6/papers/c1602a3c126ba822d0bc4293371c.pdf。
[19] E.D.Dolan和J.J.More∧,{\it Benchmarking optimization software with performance profiles},《数学程序》。,91(2002),第201-213页·邮编:1049.90004
[20] N.Du,C.Faloutsos,B.Wang和L.Akoglu,{大型人类通信网络:模式和实用驱动生成器},载于《ACM SIGKDD会议录》,2009年,第269-278页。
[21] N.Du、B.Wu、L.Xu、B.Wang和P.Xin,《复杂网络中枚举最大集团的并行算法》,《挖掘复杂数据》,第165卷,斯普林格,纽约,2009年,第207-221页·Zbl 1171.68855号
[22] N.Eagle和A.Pentland,《现实挖掘:感知复杂的社会系统》,《个人和普适计算》,10(2006),第255-268页。
[23] D.Eppstein,M.Lo¨ffler,and D.Strash,{it Listing all maximum cliques in sparse graphs in near optimal time},Algorithms Compute.,《算法计算》。,(2010),第403-414页·Zbl 1311.05187号
[24] D.Eppstein和D.Strash,{列出大型稀疏现实世界图中的所有最大团},实验。藻类。,(2011),第364-375页·Zbl 1365.05276号
[25] P.Erdo¨s和A.Hajnal,《关于图和集合系统的色数》,《数学学报》。阿卡德。科学。匈牙利,17(1966),第61-99页·Zbl 0151.33701号
[26] A.Ferreira,{\it On models and algorithms for dynamic communication networks:The case for evolution graphs},载于《ALGOTEL学报》,2002年,第155-161页。
[27] H.J.Finck和H.Sachs,{it U¨ber eine von H.S.Wilf angegebene Schranke fu¨r die chromatische Zahl endlicher Graphen},数学。纳克里斯。,39(1969),第373-386页·兹标0172.25704
[28] M.Gjoka、M.Kurant、C.T.Butts和A.Markopoulou,《在脸书中行走:OSNs无偏抽样的案例研究》,载于《信息通信学报》,2010年,第1-9页。
[29] D.F.Gleich,《Flickr照片共享社交网络图》,DOI:10.4231/D39P2W550,2012年。
[30] L.Isella、J.Stehleí、A.Barrat、C.Cattuto、J.F.Pinton和W.Van den Broeck,{人群中有什么?面对面行为网络分析},J.Theoret。《生物学》,271(2011),第166-180页·Zbl 1405.92255号
[31] H.Jeong、B.Tombor、R.Albert、Z.N.Oltvai和A.L.Barabasi,《代谢网络的大规模组织》,《自然》,407(2000),第651-654页。
[32] U.Kang和C.Faloutsos,《超越“穴居人社区”:图形压缩和挖掘的中心和辐条》,摘自《2011年ICDM会议录》,IEEE出版社,新泽西州皮斯卡塔韦,2011年,第300-309页。
[33] C.Karande、K.Chellapilla和R.Andersen,{加速压缩网络图上的算法},《第二届ACM网络搜索和数据挖掘国际会议论文集》(WSDM’09),ACM,纽约,2009年,第272-281页·Zbl 1235.68037号
[34] S.Khot,{改进MaxClique、色数和近似图着色的不可逼近性结果},第42届IEEE计算机科学基础研讨会论文集,2001年,第600-609页。
[35] J.Konc和D.Janezic,{最大团问题的改进分枝定界算法},《蛋白质》,4(2007),第5页·Zbl 1274.05452号
[36] G.Kortsarz和D.Peleg,《生成稀疏的2扳手》,J.Alg。,17(1994年),第222-236页·Zbl 0867.05072号
[37] H.Kwak、C.Lee、H.Park和S.Moon,《推特、社交网络或新闻媒体是什么?》,载于《第19届国际万维网大会论文集》,ACM,纽约,2010年,第591-600页。
[38] J.Leskovec、D.Huttenlocher和J.Kleinberg,{预测在线社交网络中的积极和消极联系},《第19届国际互联网会议论文集》,ACM,纽约,2010年,第641-650页。
[39] J.Leskovec、K.J.Lang、A.Dasgupta和M.W.Mahoney,{大型网络中的社区结构:自然集群大小和大型明确集群的缺失},互联网。数学。,6(2009年),第29-123页·Zbl 1205.91144号
[40] D.W.Matula,{图的极大极小定理及其在图着色中的应用},SIAM Rev.,10(1968),第481-482页。
[41] C.McCreesh和P.Prosser,{多线程最先进的最大团算法},《算法》,6(2013),第618-635页·Zbl 1461.05215号
[42] V.Nicosia、J.Tang、M.Musolesi、G.Russo、C.Mascolo和V.Latora,{时变图中的组件},混沌,22(2012),023101·Zbl 1331.68156号
[43] T.Opsahl和P.Panzarasa,《加权网络中的聚类》,《社交网络》,31(2009),第155-163页。
[44] P.R.J.O¨sterg \aard,{\it最大团问题的快速算法},Disc。申请。数学。,120(2002),第197-207页·Zbl 1019.05054号
[45] G.Palla、I.J.Farkas、P.Pollner、I.Dereányi和T.Vicsek,{标记网络的基本统计特征和自相似特性},新物理学杂志。,10 (2008), 123026.
[46] R.K.Pan和J.Saramaíki,{时间网络中的路径长度、相关性和中心性},《物理学》。E版,84(2011),016105。
[47] P.M.Pardalos和J.Xue,{最大集团问题},J.Global Opt。,4(1994),第301-328页·Zbl 0797.90108号
[48] B.Pattabiraman,Md.Mostofa Ali Patwary,A.H.Gebremedhin,W.-K.Liao和A.Choudhary,{大规模稀疏图上最大团问题的快速算法},《WAW 2013会议录》,网络图的算法和模型,计算中的讲义。科学。8305,施普林格,纽约,2013年,第156-169页·Zbl 1342.05185号
[49] B.Pattabiraman,Md.Mostofa Ali Patwary,A.H.Gebremedhin,W.-K.Liao和A.Choudhary,{大规模稀疏图上最大团问题的快速算法及其在重叠社区检测中的应用},互联网。数学。,11(2015),第421-448页·Zbl 1342.05185号
[50] P.Prosser,《最大团的精确算法:计算研究》,arXiv:1207.4616v12012·Zbl 1461.90162号
[51] R.A.Rossi、D.F.Gleich、A.H.Gebremedhin和Md.Mostofa Ali Patwary,{大型图的快速最大团算法},第23届万维网国际会议(WWW Companion’14),国际万维网会议指导委员会,瑞士日内瓦,2014年,第365-366页。
[52] P.San Segundo、D.Rodríguez Losada和A.Jiménez,{\it最大集团问题的精确位并行算法},Comput。操作。研究,38(2011),第571-581页·Zbl 1231.90369号
[53] A.E.Sari⁄yu¨ce、B.Gedik、G.Jacques-Silva、K.-L.Wu和U¨。V.Çatalyu¨rek,{k核分解的流算法},《超大数据库捐赠会议论文集》,6(2013),第433-444页。
[54] M.C.Schmidt、N.F.Samatova、K.Thomas和B.H.Park,{最大团枚举的可扩展并行算法},J.并行分布式计算。,69(2009),第417-428页。
[55] S.B.Seidman,{网络结构和最低程度},《社会网络》,5(1983),第269-287页。
[56] R.Singh、J.Xu和B.Berger,{多蛋白质相互作用网络的全球比对及其在功能形态检测中的应用},Proc。国家。阿卡德。科学。美国,105(2008),第12763-12768页。
[57] 社会模式,{\it传染性社会模式动态联系网络},数据集可从http://www.socialpatterns.org/datassets网站/(2012年12月9日访问)。
[58] E.Tomita和T.Kameda,{用计算实验寻找最大团的有效分枝定界算法},J.Global Optim。,37(2007),第95-111页·Zbl 1127.90079号
[59] E.Tomita、A.Tanaka和H.Takahashi,{生成所有最大团和计算实验的最坏情况时间复杂性},理论。计算。科学。,363(2006),第28-42页·Zbl 1153.68398号
[60] A.L.Traud、P.J.Mucha和M.A.Porter,《脸书网络的社会结构》,Phys。A、 391(2012),第4165-4180页。
[61] M.A.Trick和D.S.Johnson,eds.,{\it Cliques,Coloring,and Satisfility:Second DIMACS Implementation Challenge},AMS,纽约,1996年·Zbl 0875.68678号
[62] P.Mahadevan、D.Krioukov、M.Fomenkov、X.Dimitropoulos、A.Vahdat等人{互联网AS级拓扑:三个数据源和一个定义指标},SIGCOMM,36(2006),第17-26页。
[63] C.Wilson、B.Boe、A.Sala、K.P.N.Puttaswamy和B.Y.Zhao,{社交网络中的用户交互及其影响},《第四届欧洲系统会议论文集》,ACM,纽约,2009年,第205-218页。
[64] J.Xiang、C.Guo和A.Aboulnaga,{使用mapreduce}进行可伸缩最大团计算,《数据工程会议论文集》,IEEE出版社,新泽西州皮斯卡塔韦,2013年,第74-85页。
[65] Xie Y.Xie和P.S.Yu,{it Max-clique:A top-down graph-based approach to frequent pattern mining},《第十届IEEE国际数据挖掘会议论文集》,IEEE出版社,新泽西州皮斯卡塔韦,2010年,第1139-1144页。
[66] J.Yang和J.Leskovec,《基于地面实况定义和评估网络社区》,载于《第12届IEEE国际数据挖掘会议论文集》,IEEE出版社,新泽西州皮斯卡塔韦,2012年,第745-754页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。