×

树分解和社会图。 (英语) Zbl 1461.68139号

摘要:最近的工作已经确定,当以中等规模观看时,大型信息学图形(如社交和信息网络)具有非平凡的树状结构。在这里,我们展示了第一次详细的经验评估结果,评估了树分解(TD)启发式在社会图结构识别和提取中的应用。尽管TD在历史上一直被用于结构图理论和科学计算,但我们表明,即使现有的TD启发式是为这些非常不同的领域开发的,TD方法也可以在广泛的现实信息学图中识别有趣的结构。我们的主要贡献如下:我们表明,TD方法可以识别与真实网络的核心-边缘结构密切相关的结构,即使使用简单的贪婪启发式;我们表明,这些TD的外围包与使用局部光谱计算发现的低电导群落(如果存在)密切相关;我们还表明,由网络节点上的人口统计学元数据定义的几种大规模“地面真实”社区在TD的大规模和/或外围结构中具有很好的局部性。我们的其他主要贡献如下:我们为玩具和合成网络上的TD启发式提供了详细的经验结果,以建立基线,更好地理解更复杂的现实世界网络上的启发式行为;我们证明了一个定理,为以下直觉提供了形式上的证明:低失真双曲线嵌入的唯一两个障碍是高树宽和长测地圈。我们的结果为改进TD启发式提供了未来的方向,这些启发式更适合于真实的社交图。

MSC公司:

68兰特 计算机科学中的图论(包括图形绘制)
05二氧化碳
05C70号 具有特殊属性的边子集(因子分解、匹配、分区、覆盖和打包等)
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
91天30分 社交网络;意见动态
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] J.Leskovec、K.J.Lang、A.Dasgupta和M.W.Mahoney。大型网络中的社区结构:自然的集群规模和缺乏定义明确的大型集群。互联网数学, 6(1):29-123, 2009. 另请访问:arXiv:0810.1355·Zbl 1205.91144号
[2] L.G.S.Jeub、P.Balachandran、M.A.Porter、P.J.Mucha和M.W.Mahoney。本地思考,本地行动:检测大型网络中的小型、中型和大型社区。物理审查E, 91:012821, 2015. ·doi:10.1103/PhysRevE.91.012821
[3] A.B.Adcock、B.D.Sullivan和M.W.Mahoney。大型社交和信息网络中的树状结构。程序。2013年IEEE ICDM的,第1-10页,2013年。
[4] V.Batagelj和M.Zaversnik。广义核心。技术报告。预打印:arXiv:cs。DS/0202039(2002)·Zbl 1284.05252号
[5] V.Batagelj和M.Zaversnik。一种用于网络核心分解的(O(m))算法。技术报告。预打印:arXiv:cs。DS/0310049(2003)·Zbl 1284.05252号
[6] V.Batagelj和M.Zaversnik。用于确定社交网络中(广义)核心组的快速算法。数据分析和分类进展, 5(2):129-145, 2011. ·Zbl 1284.05252号 ·doi:10.1007/s11634-010-0079-y
[7] N.Robertson和P.D.Seymour。图形子对象。二、。树宽的算法方面。算法杂志, 7(3):309-322, 1986. ·Zbl 0611.05017号 ·doi:10.1016/0196-6774(86)90023-4
[8] S.Arnborg和A.Proskurowski。限制于部分k树的NP-hard问题的线性时间算法。离散应用数学, 23(1):11-24, 1989. ·Zbl 0666.68067号 ·doi:10.1016/0166-218X(89)90031-0
[9] M.W.Bern、E.L.Lawler和A.L.Wong。可分解图的最优子图的线性时间计算。算法杂志, 8(2):216-235, 1987. ·兹比尔0618.68058 ·doi:10.1016/0196-6774(87)90039-3
[10] A.M.C.A.Koster、S.P.M.van Hoesel和A.W.J.Kolen。用树分解法求解部分约束满足问题。网络,第170-180页,2002年·Zbl 1027.90072号 ·数字对象标识代码:10.1002/net.10046
[11] J.拉格格伦。有界树宽图的高效并行算法。算法杂志, 20(1):20-44, 1996. ·Zbl 0840.68058号 ·doi:10.1006/jagm.1996.002
[12] I.V.Hicks、A.M.C.A.Koster和E.Kolotoğlu。离散优化的分支和树分解技术。运筹学教程:INFORMS-新奥尔良, 2005.
[13] J.Zhao、R.L.Malmberg和L.Cai。快速从头算通过图树分解实现RNA折叠,包括假结。第六届生物信息学算法国际研讨会论文集,第262-273页,2006年。
[14] J.Zhao、D.Che和L.Cai。通过图树分解,将路径注释与蛋白质-DNA相互作用和操纵子信息进行比较。太平洋生物计算研讨会,第496-507页,2007年。
[15] C.Liu、Y.Song、B.Yan、Y.Xu和L.Cai。通过树分解进行快速从头测序和光谱比对。太平洋生物计算研讨会,第255-266页,2006年。
[16] S.L.Lauritzen和D.J.Spiegelhalter。图形结构概率的局部计算及其在专家系统中的应用(含讨论)。英国皇家统计学会杂志B辑, 50:157-224, 1988. ·Zbl 0684.68106号
[17] D.Karger和N.Srebro。学习马尔可夫网络:最大有界树宽图。第十二届ACM-SIAM离散算法研讨会论文集,第392-401页,2001年·Zbl 0987.68067号
[18] H.Chen。量化约束满足和有界树宽。第16届欧洲人工智能会议记录,第161-1652004页。
[19] H.L.Bodlaender和R.H.Möhring。齿状图的路径宽度和树宽度。SIAM离散数学杂志, 6(2):181-188, 1993. ·Zbl 0773.05091号 ·数字对象标识代码:10.1137/0406014
[20] C.Chekuri和J.Chuzhoy。格点定理的多项式界。第46届ACM计算理论年会论文集,第60-69页,2014年·Zbl 1315.05131号
[21] P.D.西摩和R.Thomas。呼叫路由和捕鼠器。组合数学, 14(2):217-241, 1994. ·Zbl 0799.05057号 ·doi:10.1007/BF01215352
[22] H.L.Bodlaender和A.M.C.A.Koster。树宽计算I.上限。Inf.计算., 208(3):259-275, 2010. ·Zbl 1186.68328号 ·doi:10.1016/j.ic.2009.03.008
[23] H.L.Bodlaender。求小树宽的树分解的线性时间算法。SIAM计算机杂志, 25(6):1305-1317, 1996. ·Zbl 0864.68074号 ·doi:10.1137/S00975397932321219
[24] E.阿米尔。树宽的近似算法。算法, 56(4):448-479, 2010. ·Zbl 1187.68703号 ·文件编号:10.1007/s00453-008-9180-4
[25] H.Röhrig先生。树分解:可行性研究。1998年,德国萨尔布吕肯萨尔兰德大学硕士论文。
[26] K.Shoikhet和D.Geiger。寻找最优三角网的实用算法。AAAI/IAAI会议记录,第185-190页,1997年。
[27] C.Groör、B.D.Sullivan和D.Weerapurage。INDDGO:用于图形优化的集成网络分解和动态规划。技术报告ORNL/TM-2012/176,橡树岭国家实验室,2012年。
[28] B.D.Sullivan等人,《用于图优化的集成网络分解和动态编程》(INDDGO),20122013。http://github.com/bdsullivan/inddgo。
[29] 树中子树的交集图就是弦图。组合理论杂志B辑, 16(1):47-56, 1974. ·兹比尔0266.05101 ·doi:10.1016/0095-8956(74)90094-X
[30] D.J.Rose和R.E.Tarjan。顶点消除的算法方面。第七届ACM计算理论年会会议记录,第245-254页,1975年·兹伯利0382.05049
[31] A.Berry、J.R.S.Blair和P.Heggenes。用于计算最小三角剖分的最大基数搜索。第28届计算机科学图论概念国际研讨会综述,第1-12页,2002年·Zbl 1022.68088号
[32] A.Berry、J.R.S.Blair、P.Heggenes和B.W.Peyton。用于计算图的最小三角剖分的最大基数搜索。算法, 39(4):287-298, 2004. ·Zbl 1090.68080号 ·doi:10.1007/s00453-004-1084-3
[33] D.Rose、R.Tarjan和G.Lueker。图上顶点消除的算法方面。SIAM计算机杂志, 5:266-283, 1976. ·Zbl 0353.65019号 ·doi:10.1137/0205021
[34] R.E.Tarjan和M.Yannakakis。简单的线性时间算法用于测试图的chordality,测试超图的无圈性,并有选择地减少无圈超图。SIAM计算机杂志, 13:566-579, 1984. ·兹伯利0545.68062 ·数字对象标识代码:10.1137/0213035
[35] R.E.Tarjan和M.Yannakakis。补遗:简单的线性时间算法,用于测试图的弦性,测试超图的非循环性,并有选择地减少非循环超图。SIAM计算机杂志, 14(1):254-255, 1985. ·Zbl 0562.68055号 ·数字对象标识代码:10.1137/0214020
[36] A.Becker和D.Geiger。找到接近最优团树的足够快的算法。人工智能, 125(1-2):3-17, 2001. ·Zbl 0972.68152号 ·doi:10.1016/S0004-3702(00)00075-8
[37] H.L.Bodlaender、J.R.Gilbert、H.Hafsteinsson和T.Kloks。近似树宽度、路径宽度和最小消除树高度。算法杂志, 18:238-255, 1995. ·Zbl 0818.68118号 ·doi:10.1006/jagm.1995.1009
[38] V.Bouchitté、D.Kratsch、H.Müller和I.Todinca。关于树宽近似。离散应用程序。数学。, 136(2-3):183-196, 2004. ·Zbl 1035.05087号 ·doi:10.1016/S0166-218X(03)00440-2
[39] B.A.里德。快速查找近似分隔符并计算树的宽度。第24届ACM计算理论年会论文集,第221-228页,1992年。
[40] J.A.George,常规有限元网格的嵌套剖分。SIAM数值分析杂志, 10:345-363, 1973. ·Zbl 0259.65087号 ·doi:10.1137/0710032
[41] J.R.Gilbert和R.E.Tarjan。嵌套分割算法的分析。数值数学, 50(4):377-404, 1986. ·Zbl 0645.65012号 ·doi:10.1007/BF01396660
[42] G.Karypis和V.Kumar。一种用于划分不规则图的快速高质量多级方案。SIAM科学计算杂志, 20:359-392, 1998. ·Zbl 0915.68129号 ·doi:10.1137/S1064827595287997
[43] H.M.Markowitz。逆的消去形式及其在线性规划中的应用。管理科学, 3(3):255-269, 1957. ·Zbl 0995.90592号 ·数字对象标识代码:10.1287/mnsc.3.225
[44] P.R.Amestoy、T.A.Davis和I.S.Duff。算法837:AMD,一种近似最小度排序算法。ACM数学软件交易(TOMS), 30(3):381-388, 2004. ·Zbl 1070.65534号 ·doi:10.1145/1024074.1024081
[45] P.R.Amestoy、T.A.Davis和I.S.Duff。一种近似最小度排序算法。SIAM矩阵分析与应用杂志, 17(4):886-905, 1996. ·Zbl 0861.65021号 ·doi:10.1137/S0895479894278952
[46] D.Koller和N.Friedman。概率图形模型:原理和技术麻省理工学院出版社,2009年·Zbl 1183.68483号
[47] H.L.Bodlaender。一位穿过树干的导游。控制论学报, 11:1-23, 1993. ·Zbl 0804.68101号
[48] H.L.Bodlaender。发现树宽。第31届计算机科学理论与实践国际会议论文集,第1-16页,2005年·Zbl 1117.68451号
[49] H.L.Bodlaender。树状图:特征描述、应用程序和计算。第32届计算机科学图论概念国际研讨会综述,第1-14页,2006年·Zbl 1167.68404号
[50] H.L.Bodlaender和A.M.C.A.Koster。有界树宽图的组合优化。计算机杂志, 51(3):255-269, 2007. ·doi:10.1093/comjnl/bxm037
[51] J.R.S.布莱尔和B.佩顿。弦图和团树简介。编辑A.George、J.R.Gilbert和J.W.H.Liu,图论与稀疏矩阵计算《数学及其应用IMA卷》,第56卷,第1-29页。Springer-Verlag,1993年·Zbl 0803.68081号 ·doi:10.1007/978-1-4613-8369-7_1
[52] E.阿米尔。最小树宽三角剖分的有效逼近。第17届人工智能不确定性年会论文集,第7-15页,2001年。
[53] A.M.C.A.Koster、H.L.Bodlaender和S.P.M.van Hoesel。树宽:计算实验。离散数学中的电子笔记, 8:54-57, 2001. ·Zbl 1409.05176号 ·doi:10.1016/S1571-0653(05)80078-2
[54] A.Berry、P.Heggenes和G.Simonet。最小度启发式和最小三角剖分过程。编辑H.L.Bodlaender,计算机科学中的图论概念《计算机科学课堂讲稿》,第58-70页。斯普林格,2003年·Zbl 1255.05186号 ·doi:10.1007/978-3-540-39890-56
[55] P.Heggenes(P.海格斯)。图的最小三角剖分:一项调查。离散数学, 306(3):297-317, 2006. ·Zbl 1086.05069号 ·doi:10.1016/j.disc.2005.12.003
[56] C.Wang、T.Liu、P.Cui和K.Xu。关于随机图中树宽度的一个注记。第五届组合优化与应用国际会议综述,第491-499页,2011年·Zbl 1342.05145号
[57] Y.Gao.高。Erdõs-Rényi随机图、随机交集图和无标度随机图的树宽度。离散应用数学, 160(4-5):566-578, 2012. ·Zbl 1239.05166号 ·doi:10.1016/j.dam.2011.10.013
[58] A.B.Adcock、B.D.Sullivan、O.R.Hernandez和M.W.Mahoney。在一定规模上评估OpenMP任务,以计算图形的双曲度。程序。第九届IWOMP,第71-83页,2013年。
[59] A.B.阿德科克。描述、识别和使用社交和信息网络中的树状结构斯坦福大学博士论文,2014年。
[60] M.格罗莫夫。双曲线群。编辑S.M.Gersten,群论论文,数学。科学。Res.Inst.出版。,8,第75-263页。施普林格,1987年·Zbl 0634.20015 ·doi:10.1007/978-1-4613-9586-7_3
[61] J.M.Alonso、T.Brady、D.Cooper、V.Ferlini、M.Lustig、M.Mihalik、H.Shapiro和H.Short。关于双曲群的注释。编辑E.Ghys、A.Haefliger和A.Verjovski,从几何观点看群论,意大利的里雅斯特ICTP,第3-63页。《世界科学》,1991年·Zbl 0849.20023号
[62] E.A.Jonckheere、P.Lohsoonthorn和F.Bonahon。标度Gromov双曲图。图论杂志, 57(2):157-180, 2008. ·Zbl 1160.05017号 ·doi:10.1002/jgt.20275
[63] E.A.Jonckheere、P.Lohsoonthorn和F.Ariaei。网络图曲率计算的标度Gromov四点条件。互联网数学, 7(3):137-177, 2011. ·兹比尔1451.05218
[64] W.Chen、W.Fang、G.Hu和M.W.Mahoney。关于小世界和树状随机图的双曲性。互联网数学, 9(4):434-491, 2013. 另请访问:arXiv:1201.1717·兹比尔1338.05244
[65] K.Verbeek和S.Suri。度量嵌入、双曲线空间和社交网络。第30届计算几何年会论文集,第501-510页,2014年·Zbl 1395.05048号
[66] G.Brinkmann、J.H.Koolen和V.Moulton。关于弦图的双曲性。组合年刊, 5(1):61-69, 2001. ·Zbl 0985.05021号 ·doi:10.1007/s00026-001-8007-7
[67] Y.Wu和C.Zhang。图的双曲性和弦性。组合数学电子杂志,18(1):第43页,2011年·Zbl 1220.05020号
[68] Y.Dourisboure和C.Gavoille。用直径较小的袋子分解树木。离散数学, 307(16):2008-2029, 2007. ·Zbl 1118.05077号 ·doi:10.1016/j.disc.2005.12.060
[69] D.洛克斯塔诺夫。关于计算树长的复杂性。第32届计算机科学数学基础国际会议论文集,第276-287页,2007年·Zbl 1147.68535号
[70] M.Grohe和D.Marx。在树宽、荆棘大小和扩张方面。组合理论杂志B辑, 99(1):218-228, 2009. ·Zbl 1205.05049号 ·doi:10.1016/j.jctb.2008.06.004
[71] A.Kosowski、B.Li、N.Nisse和K.Suchan\(k)-弦图:从警察和强盗到通过树宽的紧凑路由。第39届自动化、语言和编程国际学术讨论会会议记录,第610-6222012页·Zbl 1318.68127号
[72] F.F.德拉甘。图中的树状结构:度量的观点。第39届计算机科学图论概念国际研讨会综述,第1-4页,2013年·Zbl 1417.05028号
[73] M.Abu-Ata和F.F.Dragan。现实网络中的度量树结构:一项实证研究。网络, 67(1):49-68, 2016. ·doi:10.1002/网络21631
[74] M.M.Abu-Ata先生。图的类树结构与树的可嵌入性.肯特州立大学博士论文,2014年。
[75] Y.Shavitt和T.Tankel。用于距离估计和覆盖构造的Internet图的双曲线嵌入。IEEE/ACM网络事务, 16(1):25-36, 2008. ·doi:10.1109/TNET.2007.899021
[76] M.P.Rombach、M.A.Porter、J.H.Fowler和P.J.Mucha。网络中的核心-外围结构。SIAM应用数学杂志, 74(1):167-190, 2014. ·Zbl 1368.62169号 ·数字对象标识代码:10.1137/120881683
[77] S.B.塞德曼。网络结构和最低程度。社交网络, 5(3):269-287, 1983. ·doi:10.1016/0378-8733(83)90028-X
[78] J.Ignacio Alvarez-Hamelin、L.Dall'Asta、A.Barrat和A.Vespignani。使用k核分解的大规模网络指纹识别和可视化。神经信息处理系统的年度进展18:2005年会议记录,第41-50页,2006年。
[79] J.Ignacio Alvarez-Hamelin、L.Dall'Asta、A.Barrat和A.Vespignani。网络图的K-core分解:层次、自相似性和度量偏差。网络和异构媒体, 3(2):371-393, 2008. ·Zbl 1145.68470号 ·doi:10.3934/nhm.2008.3.371
[80] J.Healy、J.Janssen、E.Milios和W.Aiello。使用度核描述图的特征。WAW’08:第六届网络图算法和模型研讨会论文集,第137-148页,2008年·Zbl 1142.68313号
[81] V.Batagelj和A.Mrvar。大型网络的Pajek分析和可视化。图表绘制论文集,第477-478页,2001年·Zbl 1054.68564号
[82] J.Cheng、Y.Ke、S.Chu和M.T.Ozsu。大规模网络中的高效核心分解。第27届IEEE国际数据工程会议论文集,第51-62页,2011年。
[83] P.Colomer-de Simon、A.Serrano、M.G.Beiro、J.Ignacio Alvarez-Hamelin和M.Boguna。解读真实复杂网络中集群的全球组织。科学报告, 3:2517, 2013. ·doi:10.1038/srep02517
[84] M.Kitsak、L.K.Gallos、S.Havlin、F.Liljeros、L.Muchnik、H.E.Stanley和H.A.Makse。识别复杂网络中有影响力的传播者。自然物理学, 6(11):888-893, 2010. ·doi:10.1038/nphys1746
[85] J.Ugander、L.Backstrom、C.Marlow和J.Kleinberg。社会传染中的结构多样性。美国国家科学院院刊, 109(16):5962-5966, 2012.
[86] V.Ramasubramanian、D.Malkhi、F.Kuhn、M.Balakrishnan、A.Gupta和A.Akella。关于网络延迟和带宽的树。2009年ACM SIGMETRICS国际计算机系统测量和建模会议记录,第61-72页,2009年。
[87] F.de Montgolfier、M.Soto和L.Viennot。互联网的树宽和夸张。第十届IEEE网络计算与应用国际研讨会(NCA)会议记录,第25-32页,2011年。
[88] T.Maehara、T.Akiba、Y.Iwata和K.Kawarabayashi。利用图形结构快速计算个性化PageRank。VLDB捐赠会议记录, 7:1023-1034, 2014.
[89] B.Courcelle和M.Mosbah。树分解图的一元二阶估计。理论计算机科学, 109(1-2):49-82, 1993. ·Zbl 0789.68083号 ·doi:10.1016/0304-3975(93)90064-Z
[90] A.G.Percus、G.Istrate、B.Goncalves、R.Z.Sumi和S.Boettcher。随机图二分法的特殊相位结构。数学物理杂志, 49(12):125219, 2008. ·Zbl 1159.81337号 ·doi:10.1063/1.3043666
[91] F.R.K.Chung和L.Lu。复杂图和网络,第107卷,共页CBMS数学区域会议系列美国数学学会,2006年·Zbl 1114.90071号
[92] 支持网站。http://snap.stanford.edu/data/index.html。
[93] A.L.Traud、P.J.Mucha和M.A.Porter。脸书网络的社会结构。物理A, 391:4165-4180, 2012. ·doi:10.1016/j.physa.2011.12.021
[94] L.A.Adamic和N.Glance。政治博客圈和2004年美国大选:他们的博客分裂了。LinkKDD’05:第三届Link Discovery国际研讨会会议记录,第36-43页,2005年。
[95] D.J.Watts和S.H.Strogatz。小世界网络的集体动态。自然, 393:440-442, 1998. ·Zbl 1368.05139号 ·doi:10.1038/30918
[96] E.R.Gansner和S.C.North。开放式图形可视化系统及其在软件工程中的应用。软件–实践和经验, 30(11):1203-1233, 2000. ·Zbl 1147.68782号 ·doi:10.1002/1097-024X(200009)30:11<1203::AID-SPE338>3.0.CO;2-牛顿
[97] T.A.Davis和Y.Hu。佛罗里达大学稀疏矩阵收集。ACM数学软件交易(TOMS), 38(1):1:1-1:25, 2011. ·Zbl 1365.65123号
[98] T.Malisiewicz。开源代码:Graphviz matlab magic。https://github.com/quantombone/graphviz_matlab_magic网站2010年5月。
[99] P.Erdős和A.Rényi。关于随机图的演化。出版物。数学。Inst.Hungar公司。阿卡德。科学。, 5:17-61, 1960. ·Zbl 0103.16301号
[100] B.博洛巴斯。随机图《学术出版社》,伦敦,1985年·兹伯利0567.05042
[101] R.Andersen、F.R.K.Chung和K.Lang。使用PageRank向量的局部图分区。FOCS’06:第47届IEEE计算机科学基础年会论文集第475-486页,2006年。
[102] R.Diestel和M.Muller。连接树宽度。技术报告。预印本:arXiv:arXiv:1211.7353(2012)·Zbl 1399.05207号
[103] F.F.Dragan和I.Lomonosov。关于某些图类中的紧凑高效路由。离散应用数学,155(11):1458-14702007年·Zbl 1122.68084号 ·doi:10.1016/j.dam.2007.03.011
[104] V.Chepoi、F.Dragan、B.Estellon、M.Habib和Y.Vaxès。δ-双曲线测地空间和图的直径、中心和近似树。第24届计算几何年会论文集,第59-68页,2008年·Zbl 1221.68295号
[105] F.Reidl和B.Sullivan。个人通信,2014年。
[106] P.Bellenbaum和R.Diestel。关于树分解的两个简短证明。组合数学、概率和计算, 11:541-547, 2002. ·Zbl 1018.05081号 ·doi:10.1017/S0963548302005369
[107] A.Georgakopoulos和P.Sprussel。局部有限图中的测地拓扑圈。组合数学电子杂志,16(1):R1442009年·Zbl 1230.05219号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。