×

磁盘驻留图上H群接近中心性的I/O-有效计算。 (英文) Zbl 1431.91311号

摘要:我们在本文中引入了(H)-群贴近度中心性。一组节点的(H)-group closeness中心性度量了该节点组与图中其他节点的贴近度,可以用于许多应用,例如度量一组用户在社交网络中的重要性和影响。当一个大型图包含数十亿条不能完全驻留在计算机主内存中的边时,计算和最大化H群贴近度中心性都变得很有挑战性。在这项工作中,我们提出了一个系统的解决方案,仅使用普通PC就可以有效地计算和最大化大型磁盘驻留图中的(H)-群接近中心性,而不是以精确的方式进行详尽的计算。此外,我们设计了一个I/O高效贪婪算法来寻找图中近似最大化(H)-群贴近度中心性的节点群。我们的算法利用了定义的(H)-群贴近度度量的几个吸引人的特性,以减少处理磁盘驻留图的计算成本。对大型真实世界和合成图的广泛评估证明了我们提出的方法的有效性。例如,我们提出的I/O高效贪婪算法比在具有14亿条边的Twitter图上使用简单的多通道方法快300倍。这将识别一个组成员的平均运行时间从将近一个小时减少到不到20秒。

MSC公司:

91天30分 社交网络;意见动态
68周25 近似算法
91-05 博弈论、经济学和金融相关问题的实验工作
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Amancio,D.R。;Oliveira,O.N。;Costa,L.d.F.,《揭示复杂网络指标和词义之间的关系》,《欧洲》。莱特。,98, 18002, 1-6 (2012)
[2] Avrachenkov,K。;利特瓦克,N。;索科尔,M。;Towsley,D.,《大角度节点的快速检测》,第九届网络图算法和模型研讨会论文集,54-65(2012)·Zbl 1342.05175号
[3] Baralis,E。;卡利略,L。;Mahoto,N。;Fiori,A.,Graphsum:发现基于图形的摘要的多个术语之间的相关性,Inf.Sci。,249, 96-109 (2013)
[4] 伯杰,B。;Rompel,J。;Shor,P.W.,《集合覆盖的高效数控算法及其在学习和几何中的应用》,J.Compute。系统。科学。,第49页,第3454-477页(1994年)
[5] Blelloch,G.E。;彭,R。;Tangwongsan,K.,线性工作贪婪并行近似集覆盖和变体,第23届ACM算法和架构并行性研讨会论文集,美国加利福尼亚州圣何塞,23-32(2011)
[6] Boldi,P。;罗莎,M。;Vigna,S.,HyperANF:估算预算上超大图形的邻域函数,第20届国际万维网会议论文集,印度海得拉巴,625-634(2011)
[7] Boldi,P。;Vigna,S.,网络图框架I:压缩技术,第13届国际万维网大会论文集,美国纽约,595-602(2004)
[8] Boldi,P。;Vigna,S.,《中心性公理》,互联网数学。,10, 3-4, 222-262 (2014) ·Zbl 1461.91219号
[9] Buchbinder,N。;费尔德曼,M。;Naor,J.S。;Schwartz,R.,带基数约束的子模块最大化,《ACM-SIAM离散算法研讨会论文集》,俄勒冈州波特兰,1433-1452(2014)·Zbl 1423.90212号
[10] Cha,M。;哈达迪,H。;Benevenuto,F。;Gummadi,K.P.,《衡量推特用户影响力:百万粉丝谬误》,第四届AAAI网络日志和社交媒体国际会议论文集,1-8(2010)
[11] Cheng,J。;刘,Q。;李,Z。;风扇,W。;Lui,J.C。;He,C.,VENUS:单台PC上以顶点为中心的流线型图形计算,第31届IEEE数据工程国际会议论文集,1131-1142(2015)
[12] Chierichetti,F。;库马尔,R。;Lattanzi,S。;Mitzenmacher先生。;Panconesi,A。;Raghavan,P.,《关于压缩社交网络》,第15届ACM SIGKDD国际学术会议论文集,关于知识发现和数据挖掘,219-228(2009)
[13] Chierichetti,F。;库马尔,R。;Tomkins,A.,MapReduce中的Max-cover,第19届国际万维网会议论文集,231-240(2010)
[14] 科恩,E。;Delling,D。;Pajor,T。;Werneck,R.F.,《规模上的计算经典亲密度中心性》,第二届ACM在线社交网络会议,爱尔兰都柏林,37-50(2014)
[15] 科尔莫德,G。;Karloff,H。;Wirth,A.,《超大数据集的集合覆盖算法》,第19届ACM信息和知识管理国际会议论文集,加拿大安大略省多伦多,479-488(2010)
[16] 杜兰德,M。;Flajolet,P.,大基数对数计算,第十一届欧洲算法年会论文集,605-617(2003)·Zbl 1266.68236号
[17] 艾普斯坦,D。;Wang,J.,中心性的快速近似,第20届ACM-SIAM离散算法年会论文集,228-229(2001)·兹比尔0999.91072
[18] 埃弗雷特,M.G。;Borgatti,S.P.,《群体和班级的中心性》,J.Math。社会学。,23, 3, 181-201 (1999) ·Zbl 0949.91036号
[19] Feige,美国。;Mirrokni,V.S.公司。;Vondrák,J.,最大化非单调子模函数,第48届IEEE计算机科学基础研讨会论文集,461-471(2007)
[20] 弗拉乔莱特,P。;Fusy,E。;甘杜埃,O。;Meunier,F.,《HyperLogLog:近最优基数估计算法的分析》,《2007年算法分析国际会议论文集》,法国南希,127-146(2007)·Zbl 1192.68959号
[21] 弗拉乔莱特,P。;Martin,G.N.,概率计算,第24届计算机科学基础年度研讨会论文集,76-82(1983)
[22] Freeman,L.C.,《社交网络的中心性:概念澄清》,Soc.Netw。,1, 79, 215-239 (1978)
[23] 韩,W.S。;Lee,S。;帕克,K。;Lee,J.-H。;Kim,M.-S。;Kim,J。;Yu,H.,TurboGraph:在单个PC上处理十亿级图形的快速并行图形引擎,第19届ACM SIGKDD国际Konwledge发现和数据挖掘会议论文集,美国伊利诺伊州芝加哥,77-85(2013)
[24] Kang,U。;Papadimitriou,S。;Sun,J。;Tong,H.,《大型网络的中心:算法和观测》,《2011年SIAM国际数据挖掘会议论文集》,119-130(2011)
[25] Kempe,D。;Kleinberg,J。;Tardos,E.,《通过社交网络最大限度地扩大影响力》,第九届ACM SIGKDD国际知识发现和数据挖掘会议论文集,美国华盛顿特区,137-146(2003)
[26] 克劳斯,A。;Golovin,D.,《子模函数最大化》(Bordeaux,L.;Hamadi,Y.;Kohli,P.,《可牵引性:解决难题的实用方法》(2014),剑桥大学出版社),71-99·Zbl 1325.68009号
[27] 库马尔,R。;莫斯利,B。;瓦西维茨基,S。;Vattani,A.,mapreduce和流媒体中的快速贪婪算法,ACM Trans。并行计算。,2, 3, 1-22 (2015)
[28] Kyrola,A。;Blelloch,G。;Guestrin,C.,GraphChi:仅在PC上进行大规模图形计算,第14届USENIX操作系统设计与实现研讨会,加利福尼亚州好莱坞,美国,31-46(2012)
[29] Lancichinetti,A。;福图纳托,S。;Radicchi,F.,测试社区检测算法的基准图,Phys。E版,78,046110,1-5(2008)
[30] Leskovec,J。;朗·K·J。;Dasgupta,A。;Mahoney,M.W.,《大型网络中的社区结构:自然集群大小和缺乏定义明确的大型集群》,互联网数学。,6, 1, 1-66 (2009) ·Zbl 1205.91144号
[31] 李毅。;罗,J。;Chow,C.-Y。;Chan,K.-L。;丁,Y。;Zhang,F.,利用轨迹数据分析发展电动汽车充电站网络,第31届IEEE国际数据工程会议论文集,1376-1387(2015)
[32] 低,Y。;比克森,D。;Gonzalez,J.,《分布式图形实验室:云中机器学习和数据挖掘的框架》,《VLDB捐赠会议录》,第5卷,716-727(2012)
[33] Lumsdaine,A。;Gregor博士。;亨德里克森,B。;Berry,J.,并行图形处理的挑战,并行处理。莱特。,17, 5, 1-16 (2007)
[34] Maiya,A.S。;Berger Wolf,T.Y.,社交网络中高中心性个体的在线抽样,第14届太平洋-亚洲知识发现和数据挖掘进展会议论文集,印度海得拉巴,91-98(2010)
[35] Minoux,M.,最大化子模集函数的加速贪婪算法,优化技术,演讲笔记控制信息科学。,7, 234-243 (1978) ·Zbl 0372.90128号
[36] 纳姆豪泽,G。;沃尔西,L。;Fisher,M.,最大化子模集函数的近似分析-i,数学。程序。,14, 1, 265-294 (1978) ·Zbl 0374.90045号
[37] 冈本,K。;Chen,W。;Li,X.-Y.,大型社交网络的亲密度中心性排名,第二届年度算法前沿国际研讨会论文集,中国长沙,186-195(2008)·Zbl 1143.91362号
[38] Oktay,H。;巴尔基尔,A.S。;我·福斯特。;Jensen,D.D.,使用MapReduce和网络结构指数对超大网络进行距离估计,信息网络研讨会论文集,1-5(2011)
[39] Page,L。;布林,S。;Motwani,R。;Winograd,T.,《PageRank引文排名:给网络带来秩序》,《技术报告》(1998),斯坦福大学数字图书馆技术项目
[40] C.R.帕尔默。;吉本斯,P.B。;Faloutsos,C.,ANF:一种快速且可扩展的海量图数据挖掘工具,第八届ACM SIGKDD Konwledge发现和数据挖掘国际会议论文集,加拿大阿尔伯塔省埃德蒙顿,81-90(2002)
[41] 潘,X。;杰格尔卡,S。;冈萨雷斯,J。;布拉德利,J。;Jordan,M.I.,并行双贪婪子模块最大化,神经信息处理系统进展,加拿大蒙特利尔,118-126(2014)
[42] Pfeffer,J。;Carley,K.M.,《中心:基于最短路径的全球测度的局部近似》,第一届大规模网络分析国际研讨会,法国里昂,1043-1050(2012)
[43] 普齐斯,R。;Elovici,Y。;Dolev,S.,连续计算群之间中心性的快速算法,Phys。E版,76,056709,1-9(2007)
[44] 罗伊,A。;米哈伊洛维奇,I。;Zwaenepoel,W.,《X-Stream:使用流分区的边缘中心图形处理》,第23届ACM操作系统原理研讨会论文集,宾夕法尼亚州法明顿,472-488(2013)
[45] Sariyüce,A.E。;Saule,E。;kaya,K。;Catalystürek,U.V.,STREAMER:增量接近中心性计算的分布式框架,2013年IEEE集群会议论文集,1-8(2013)
[46] 林,Y.s。;里贝罗,B。;Menasche,D.S。;巴苏,P。;Towsley,D.,在线估计网络的前k个节点,IEEE网络科学研讨会论文集,118-122(2011)
[47] Tizghadam,A。;Leon-Garcia,A.,《关于通信网络的网络科学第二届IEEE国际研讨会论文集》,第1-6页(2010年)
[48] 奇亚切克,S。;Iyer,R.K。;魏,H。;Bilmes,J.A.,《图像采集摘要的子模块函数混合学习》,《神经信息处理系统进展》,1413-1421(2014)
[49] 黄,K.-Y。;Vander-Zanden,B.T。;Taylor,H.M.,数据库应用的线性时间概率计数算法,ACM Trans。数据库系统。,15, 2, 208-229 (1990)
[50] Yoshida,Y.,使用超图草图实现自适应中间中心性的几乎线性时间算法,第20届ACM SIGKDD国际Konwledge发现和数据挖掘会议论文集,1416-1425(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。