阿伦·阿德科克(Aaron B.Adcock)。;布莱尔·沙利文。;迈克尔·马奥尼。 树分解和社会图。 (英语) Zbl 1461.68139号 互联网数学。 12,第5号,315-361(2016). 摘要:最近的工作已经确定,当以中等规模观看时,大型信息学图形(如社交和信息网络)具有非平凡的树状结构。在这里,我们展示了第一次详细的经验评估结果,评估了树分解(TD)启发式在社会图结构识别和提取中的应用。尽管TD在历史上一直被用于结构图理论和科学计算,但我们表明,即使现有的TD启发式是为这些非常不同的领域开发的,TD方法也可以在广泛的现实信息学图中识别有趣的结构。我们的主要贡献如下:我们表明,TD方法可以识别与真实网络的核心-边缘结构密切相关的结构,即使使用简单的贪婪启发式;我们表明,这些TD的外围包与使用局部光谱计算发现的低电导群落(如果存在)密切相关;我们还表明,由网络节点上的人口统计学元数据定义的几种大规模“地面真实”社区在TD的大规模和/或外围结构中具有很好的局部性。我们的其他主要贡献如下:我们为玩具和合成网络上的TD启发式提供了详细的经验结果,以建立基线,更好地理解更复杂的现实世界网络上的启发式行为;我们证明了一个定理,为以下直觉提供了形式上的证明:低失真双曲线嵌入的唯一两个障碍是高树宽和长测地圈。我们的结果为改进TD启发式提供了未来的方向,这些启发式更适合于真实的社交图。 引用于12文件 MSC公司: 68兰特 计算机科学中的图论(包括图形绘制) 05二氧化碳 树 05C70号 具有特殊属性的边子集(因子分解、匹配、分区、覆盖和打包等) 68T20型 人工智能背景下的问题解决(启发式、搜索策略等) 91天30分 社交网络;意见动态 软件:INDDGO公司;AMD公司;稀疏矩阵;帕杰克;github;计算TW PDF格式BibTeX公司 XML格式引用 \textit{A.B.Adcock}等人,《互联网数学》。12,第5号,315--361(2016;Zbl 1461.68139) 全文: 内政部 arXiv公司 参考文献: [1] J.Leskovec、K.J.Lang、A.Dasgupta和M.W.Mahoney。大型网络中的社区结构:自然的集群规模和缺乏定义明确的大型集群。互联网数学, 6(1):29-123, 2009. 另请访问:arXiv:0810.1355·Zbl 1205.91144号 [2] L.G.S.Jeub、P.Balachandran、M.A.Porter、P.J.Mucha和M.W.Mahoney。本地思考,本地行动:检测大型网络中的小型、中型和大型社区。物理审查E, 91:012821, 2015. ·doi:10.1103/PhysRevE.91.012821 [3] A.B.Adcock、B.D.Sullivan和M.W.Mahoney。大型社交和信息网络中的树状结构。在程序。2013年IEEE ICDM的,第1-10页,2013年。 [4] V.Batagelj和M.Zaversnik。广义核心。技术报告。预打印:arXiv:cs。DS/0202039(2002)·Zbl 1284.05252号 [5] V.Batagelj和M.Zaversnik。一种用于网络核心分解的(O(m))算法。技术报告。预打印:arXiv:cs。DS/0310049(2003)·Zbl 1284.05252号 [6] V.Batagelj和M.Zaversnik。用于确定社交网络中(广义)核心组的快速算法。数据分析和分类进展, 5(2):129-145, 2011. ·Zbl 1284.05252号 ·doi:10.1007/s11634-010-0079-y [7] N.Robertson和P.D.Seymour。图形子对象。二、。树宽的算法方面。算法杂志, 7(3):309-322, 1986. ·Zbl 0611.05017号 ·doi:10.1016/0196-6774(86)90023-4 [8] S.Arnborg和A.Proskurowski。限制于部分k树的NP-hard问题的线性时间算法。离散应用数学, 23(1):11-24, 1989. ·Zbl 0666.68067号 ·doi:10.1016/0166-218X(89)90031-0 [9] M.W.Bern、E.L.Lawler和A.L.Wong。可分解图的最优子图的线性时间计算。算法杂志, 8(2):216-235, 1987. ·兹比尔0618.68058 ·doi:10.1016/0196-6774(87)90039-3 [10] A.M.C.A.Koster、S.P.M.van Hoesel和A.W.J.Kolen。用树分解法求解部分约束满足问题。网络,第170-180页,2002年·Zbl 1027.90072号 ·数字对象标识代码:10.1002/net.10046 [11] J.拉格格伦。有界树宽图的高效并行算法。算法杂志, 20(1):20-44, 1996. ·Zbl 0840.68058号 ·doi:10.1006/jagm.1996.002 [12] I.V.Hicks、A.M.C.A.Koster和E.Kolotoğlu。离散优化的分支和树分解技术。运筹学教程:INFORMS-新奥尔良, 2005. [13] J.Zhao、R.L.Malmberg和L.Cai。快速从头算通过图树分解实现RNA折叠,包括假结。在第六届生物信息学算法国际研讨会论文集,第262-273页,2006年。 [14] J.Zhao、D.Che和L.Cai。通过图树分解,将路径注释与蛋白质-DNA相互作用和操纵子信息进行比较。在太平洋生物计算研讨会,第496-507页,2007年。 [15] C.Liu、Y.Song、B.Yan、Y.Xu和L.Cai。通过树分解进行快速从头测序和光谱比对。在太平洋生物计算研讨会,第255-266页,2006年。 [16] S.L.Lauritzen和D.J.Spiegelhalter。图形结构概率的局部计算及其在专家系统中的应用(含讨论)。英国皇家统计学会杂志B辑, 50:157-224, 1988. ·Zbl 0684.68106号 [17] D.Karger和N.Srebro。学习马尔可夫网络:最大有界树宽图。在第十二届ACM-SIAM离散算法研讨会论文集,第392-401页,2001年·Zbl 0987.68067号 [18] H.Chen。量化约束满足和有界树宽。在第16届欧洲人工智能会议记录,第161-1652004页。 [19] H.L.Bodlaender和R.H.Möhring。齿状图的路径宽度和树宽度。SIAM离散数学杂志, 6(2):181-188, 1993. ·Zbl 0773.05091号 ·数字对象标识代码:10.1137/0406014 [20] C.Chekuri和J.Chuzhoy。格点定理的多项式界。在第46届ACM计算理论年会论文集,第60-69页,2014年·Zbl 1315.05131号 [21] P.D.西摩和R.Thomas。呼叫路由和捕鼠器。组合数学, 14(2):217-241, 1994. ·Zbl 0799.05057号 ·doi:10.1007/BF01215352 [22] H.L.Bodlaender和A.M.C.A.Koster。树宽计算I.上限。Inf.计算., 208(3):259-275, 2010. ·Zbl 1186.68328号 ·doi:10.1016/j.ic.2009.03.008 [23] H.L.Bodlaender。求小树宽的树分解的线性时间算法。SIAM计算机杂志, 25(6):1305-1317, 1996. ·Zbl 0864.68074号 ·doi:10.1137/S00975397932321219 [24] E.阿米尔。树宽的近似算法。算法, 56(4):448-479, 2010. ·Zbl 1187.68703号 ·文件编号:10.1007/s00453-008-9180-4 [25] H.Röhrig先生。树分解:可行性研究。1998年,德国萨尔布吕肯萨尔兰德大学硕士论文。 [26] K.Shoikhet和D.Geiger。寻找最优三角网的实用算法。在AAAI/IAAI会议记录,第185-190页,1997年。 [27] C.Groör、B.D.Sullivan和D.Weerapurage。INDDGO:用于图形优化的集成网络分解和动态规划。技术报告ORNL/TM-2012/176,橡树岭国家实验室,2012年。 [28] B.D.Sullivan等人,《用于图优化的集成网络分解和动态编程》(INDDGO),20122013。http://github.com/bdsullivan/inddgo。 [29] 树中子树的交集图就是弦图。组合理论杂志B辑, 16(1):47-56, 1974. ·兹比尔0266.05101 ·doi:10.1016/0095-8956(74)90094-X [30] D.J.Rose和R.E.Tarjan。顶点消除的算法方面。在第七届ACM计算理论年会会议记录,第245-254页,1975年·兹伯利0382.05049 [31] A.Berry、J.R.S.Blair和P.Heggenes。用于计算最小三角剖分的最大基数搜索。在第28届计算机科学图论概念国际研讨会综述,第1-12页,2002年·Zbl 1022.68088号 [32] A.Berry、J.R.S.Blair、P.Heggenes和B.W.Peyton。用于计算图的最小三角剖分的最大基数搜索。算法, 39(4):287-298, 2004. ·Zbl 1090.68080号 ·doi:10.1007/s00453-004-1084-3 [33] D.Rose、R.Tarjan和G.Lueker。图上顶点消除的算法方面。SIAM计算机杂志, 5:266-283, 1976. ·Zbl 0353.65019号 ·doi:10.1137/0205021 [34] R.E.Tarjan和M.Yannakakis。简单的线性时间算法用于测试图的chordality,测试超图的无圈性,并有选择地减少无圈超图。SIAM计算机杂志, 13:566-579, 1984. ·兹伯利0545.68062 ·数字对象标识代码:10.1137/0213035 [35] R.E.Tarjan和M.Yannakakis。补遗:简单的线性时间算法,用于测试图的弦性,测试超图的非循环性,并有选择地减少非循环超图。SIAM计算机杂志, 14(1):254-255, 1985. ·Zbl 0562.68055号 ·数字对象标识代码:10.1137/0214020 [36] A.Becker和D.Geiger。找到接近最优团树的足够快的算法。人工智能, 125(1-2):3-17, 2001. ·Zbl 0972.68152号 ·doi:10.1016/S0004-3702(00)00075-8 [37] H.L.Bodlaender、J.R.Gilbert、H.Hafsteinsson和T.Kloks。近似树宽度、路径宽度和最小消除树高度。算法杂志, 18:238-255, 1995. ·Zbl 0818.68118号 ·doi:10.1006/jagm.1995.1009 [38] V.Bouchitté、D.Kratsch、H.Müller和I.Todinca。关于树宽近似。离散应用程序。数学。, 136(2-3):183-196, 2004. ·Zbl 1035.05087号 ·doi:10.1016/S0166-218X(03)00440-2 [39] B.A.里德。快速查找近似分隔符并计算树的宽度。在第24届ACM计算理论年会论文集,第221-228页,1992年。 [40] J.A.George,常规有限元网格的嵌套剖分。SIAM数值分析杂志, 10:345-363, 1973. ·Zbl 0259.65087号 ·doi:10.1137/0710032 [41] J.R.Gilbert和R.E.Tarjan。嵌套分割算法的分析。数值数学, 50(4):377-404, 1986. ·Zbl 0645.65012号 ·doi:10.1007/BF01396660 [42] G.Karypis和V.Kumar。一种用于划分不规则图的快速高质量多级方案。SIAM科学计算杂志, 20:359-392, 1998. ·Zbl 0915.68129号 ·doi:10.1137/S1064827595287997 [43] H.M.Markowitz。逆的消去形式及其在线性规划中的应用。管理科学, 3(3):255-269, 1957. ·Zbl 0995.90592号 ·数字对象标识代码:10.1287/mnsc.3.225 [44] P.R.Amestoy、T.A.Davis和I.S.Duff。算法837:AMD,一种近似最小度排序算法。ACM数学软件交易(TOMS), 30(3):381-388, 2004. ·Zbl 1070.65534号 ·doi:10.1145/1024074.1024081 [45] P.R.Amestoy、T.A.Davis和I.S.Duff。一种近似最小度排序算法。SIAM矩阵分析与应用杂志, 17(4):886-905, 1996. ·Zbl 0861.65021号 ·doi:10.1137/S0895479894278952 [46] D.Koller和N.Friedman。概率图形模型:原理和技术麻省理工学院出版社,2009年·Zbl 1183.68483号 [47] H.L.Bodlaender。一位穿过树干的导游。控制论学报, 11:1-23, 1993. ·Zbl 0804.68101号 [48] H.L.Bodlaender。发现树宽。在第31届计算机科学理论与实践国际会议论文集,第1-16页,2005年·Zbl 1117.68451号 [49] H.L.Bodlaender。树状图:特征描述、应用程序和计算。在第32届计算机科学图论概念国际研讨会综述,第1-14页,2006年·Zbl 1167.68404号 [50] H.L.Bodlaender和A.M.C.A.Koster。有界树宽图的组合优化。计算机杂志, 51(3):255-269, 2007. ·doi:10.1093/comjnl/bxm037 [51] J.R.S.布莱尔和B.佩顿。弦图和团树简介。编辑A.George、J.R.Gilbert和J.W.H.Liu,图论与稀疏矩阵计算《数学及其应用IMA卷》,第56卷,第1-29页。Springer-Verlag,1993年·Zbl 0803.68081号 ·doi:10.1007/978-1-4613-8369-7_1 [52] E.阿米尔。最小树宽三角剖分的有效逼近。在第17届人工智能不确定性年会论文集,第7-15页,2001年。 [53] A.M.C.A.Koster、H.L.Bodlaender和S.P.M.van Hoesel。树宽:计算实验。离散数学中的电子笔记, 8:54-57, 2001. ·Zbl 1409.05176号 ·doi:10.1016/S1571-0653(05)80078-2 [54] A.Berry、P.Heggenes和G.Simonet。最小度启发式和最小三角剖分过程。编辑H.L.Bodlaender,计算机科学中的图论概念《计算机科学课堂讲稿》,第58-70页。斯普林格,2003年·Zbl 1255.05186号 ·doi:10.1007/978-3-540-39890-56 [55] P.Heggenes(P.海格斯)。图的最小三角剖分:一项调查。离散数学, 306(3):297-317, 2006. ·Zbl 1086.05069号 ·doi:10.1016/j.disc.2005.12.003 [56] C.Wang、T.Liu、P.Cui和K.Xu。关于随机图中树宽度的一个注记。在第五届组合优化与应用国际会议综述,第491-499页,2011年·Zbl 1342.05145号 [57] Y.Gao.高。Erdõs-Rényi随机图、随机交集图和无标度随机图的树宽度。离散应用数学, 160(4-5):566-578, 2012. ·Zbl 1239.05166号 ·doi:10.1016/j.dam.2011.10.013 [58] A.B.Adcock、B.D.Sullivan、O.R.Hernandez和M.W.Mahoney。在一定规模上评估OpenMP任务,以计算图形的双曲度。在程序。第九届IWOMP,第71-83页,2013年。 [59] A.B.阿德科克。描述、识别和使用社交和信息网络中的树状结构斯坦福大学博士论文,2014年。 [60] M.格罗莫夫。双曲线群。编辑S.M.Gersten,群论论文,数学。科学。Res.Inst.出版。,8,第75-263页。施普林格,1987年·Zbl 0634.20015 ·doi:10.1007/978-1-4613-9586-7_3 [61] J.M.Alonso、T.Brady、D.Cooper、V.Ferlini、M.Lustig、M.Mihalik、H.Shapiro和H.Short。关于双曲群的注释。编辑E.Ghys、A.Haefliger和A.Verjovski,从几何观点看群论,意大利的里雅斯特ICTP,第3-63页。《世界科学》,1991年·Zbl 0849.20023号 [62] E.A.Jonckheere、P.Lohsoonthorn和F.Bonahon。标度Gromov双曲图。图论杂志, 57(2):157-180, 2008. ·Zbl 1160.05017号 ·doi:10.1002/jgt.20275 [63] E.A.Jonckheere、P.Lohsoonthorn和F.Ariaei。网络图曲率计算的标度Gromov四点条件。互联网数学, 7(3):137-177, 2011. ·兹比尔1451.05218 [64] W.Chen、W.Fang、G.Hu和M.W.Mahoney。关于小世界和树状随机图的双曲性。互联网数学, 9(4):434-491, 2013. 另请访问:arXiv:1201.1717·兹比尔1338.05244 [65] K.Verbeek和S.Suri。度量嵌入、双曲线空间和社交网络。在第30届计算几何年会论文集,第501-510页,2014年·Zbl 1395.05048号 [66] G.Brinkmann、J.H.Koolen和V.Moulton。关于弦图的双曲性。组合年刊, 5(1):61-69, 2001. ·Zbl 0985.05021号 ·doi:10.1007/s00026-001-8007-7 [67] Y.Wu和C.Zhang。图的双曲性和弦性。组合数学电子杂志,18(1):第43页,2011年·Zbl 1220.05020号 [68] Y.Dourisboure和C.Gavoille。用直径较小的袋子分解树木。离散数学, 307(16):2008-2029, 2007. ·Zbl 1118.05077号 ·doi:10.1016/j.disc.2005.12.060 [69] D.洛克斯塔诺夫。关于计算树长的复杂性。在第32届计算机科学数学基础国际会议论文集,第276-287页,2007年·Zbl 1147.68535号 [70] M.Grohe和D.Marx。在树宽、荆棘大小和扩张方面。组合理论杂志B辑, 99(1):218-228, 2009. ·Zbl 1205.05049号 ·doi:10.1016/j.jctb.2008.06.004 [71] A.Kosowski、B.Li、N.Nisse和K.Suchan\(k)-弦图:从警察和强盗到通过树宽的紧凑路由。在第39届自动化、语言和编程国际学术讨论会会议记录,第610-6222012页·Zbl 1318.68127号 [72] F.F.德拉甘。图中的树状结构:度量的观点。在第39届计算机科学图论概念国际研讨会综述,第1-4页,2013年·Zbl 1417.05028号 [73] M.Abu-Ata和F.F.Dragan。现实网络中的度量树结构:一项实证研究。网络, 67(1):49-68, 2016. ·doi:10.1002/网络21631 [74] M.M.Abu-Ata先生。图的类树结构与树的可嵌入性.肯特州立大学博士论文,2014年。 [75] Y.Shavitt和T.Tankel。用于距离估计和覆盖构造的Internet图的双曲线嵌入。IEEE/ACM网络事务, 16(1):25-36, 2008. ·doi:10.1109/TNET.2007.899021 [76] M.P.Rombach、M.A.Porter、J.H.Fowler和P.J.Mucha。网络中的核心-外围结构。SIAM应用数学杂志, 74(1):167-190, 2014. ·Zbl 1368.62169号 ·数字对象标识代码:10.1137/120881683 [77] S.B.塞德曼。网络结构和最低程度。社交网络, 5(3):269-287, 1983. ·doi:10.1016/0378-8733(83)90028-X [78] J.Ignacio Alvarez-Hamelin、L.Dall'Asta、A.Barrat和A.Vespignani。使用k核分解的大规模网络指纹识别和可视化。在神经信息处理系统的年度进展18:2005年会议记录,第41-50页,2006年。 [79] J.Ignacio Alvarez-Hamelin、L.Dall'Asta、A.Barrat和A.Vespignani。网络图的K-core分解:层次、自相似性和度量偏差。网络和异构媒体, 3(2):371-393, 2008. ·Zbl 1145.68470号 ·doi:10.3934/nhm.2008.3.371 [80] J.Healy、J.Janssen、E.Milios和W.Aiello。使用度核描述图的特征。在WAW’08:第六届网络图算法和模型研讨会论文集,第137-148页,2008年·Zbl 1142.68313号 [81] V.Batagelj和A.Mrvar。大型网络的Pajek分析和可视化。在图表绘制论文集,第477-478页,2001年·Zbl 1054.68564号 [82] J.Cheng、Y.Ke、S.Chu和M.T.Ozsu。大规模网络中的高效核心分解。在第27届IEEE国际数据工程会议论文集,第51-62页,2011年。 [83] P.Colomer-de Simon、A.Serrano、M.G.Beiro、J.Ignacio Alvarez-Hamelin和M.Boguna。解读真实复杂网络中集群的全球组织。科学报告, 3:2517, 2013. ·doi:10.1038/srep02517 [84] M.Kitsak、L.K.Gallos、S.Havlin、F.Liljeros、L.Muchnik、H.E.Stanley和H.A.Makse。识别复杂网络中有影响力的传播者。自然物理学, 6(11):888-893, 2010. ·doi:10.1038/nphys1746 [85] J.Ugander、L.Backstrom、C.Marlow和J.Kleinberg。社会传染中的结构多样性。美国国家科学院院刊, 109(16):5962-5966, 2012. [86] V.Ramasubramanian、D.Malkhi、F.Kuhn、M.Balakrishnan、A.Gupta和A.Akella。关于网络延迟和带宽的树。在2009年ACM SIGMETRICS国际计算机系统测量和建模会议记录,第61-72页,2009年。 [87] F.de Montgolfier、M.Soto和L.Viennot。互联网的树宽和夸张。在第十届IEEE网络计算与应用国际研讨会(NCA)会议记录,第25-32页,2011年。 [88] T.Maehara、T.Akiba、Y.Iwata和K.Kawarabayashi。利用图形结构快速计算个性化PageRank。VLDB捐赠会议记录, 7:1023-1034, 2014. [89] B.Courcelle和M.Mosbah。树分解图的一元二阶估计。理论计算机科学, 109(1-2):49-82, 1993. ·Zbl 0789.68083号 ·doi:10.1016/0304-3975(93)90064-Z [90] A.G.Percus、G.Istrate、B.Goncalves、R.Z.Sumi和S.Boettcher。随机图二分法的特殊相位结构。数学物理杂志, 49(12):125219, 2008. ·Zbl 1159.81337号 ·doi:10.1063/1.3043666 [91] F.R.K.Chung和L.Lu。复杂图和网络,第107卷,共页CBMS数学区域会议系列美国数学学会,2006年·Zbl 1114.90071号 [92] 支持网站。http://snap.stanford.edu/data/index.html。 [93] A.L.Traud、P.J.Mucha和M.A.Porter。脸书网络的社会结构。物理A, 391:4165-4180, 2012. ·doi:10.1016/j.physa.2011.12.021 [94] L.A.Adamic和N.Glance。政治博客圈和2004年美国大选:他们的博客分裂了。在LinkKDD’05:第三届Link Discovery国际研讨会会议记录,第36-43页,2005年。 [95] D.J.Watts和S.H.Strogatz。小世界网络的集体动态。自然, 393:440-442, 1998. ·Zbl 1368.05139号 ·doi:10.1038/30918 [96] E.R.Gansner和S.C.North。开放式图形可视化系统及其在软件工程中的应用。软件–实践和经验, 30(11):1203-1233, 2000. ·Zbl 1147.68782号 ·doi:10.1002/1097-024X(200009)30:11<1203::AID-SPE338>3.0.CO;2-牛顿 [97] T.A.Davis和Y.Hu。佛罗里达大学稀疏矩阵收集。ACM数学软件交易(TOMS), 38(1):1:1-1:25, 2011. ·Zbl 1365.65123号 [98] T.Malisiewicz。开源代码:Graphviz matlab magic。https://github.com/quantombone/graphviz_matlab_magic网站2010年5月。 [99] P.Erdős和A.Rényi。关于随机图的演化。出版物。数学。Inst.Hungar公司。阿卡德。科学。, 5:17-61, 1960. ·Zbl 0103.16301号 [100] B.博洛巴斯。随机图《学术出版社》,伦敦,1985年·兹伯利0567.05042 [101] R.Andersen、F.R.K.Chung和K.Lang。使用PageRank向量的局部图分区。在FOCS’06:第47届IEEE计算机科学基础年会论文集第475-486页,2006年。 [102] R.Diestel和M.Muller。连接树宽度。技术报告。预印本:arXiv:arXiv:1211.7353(2012)·Zbl 1399.05207号 [103] F.F.Dragan和I.Lomonosov。关于某些图类中的紧凑高效路由。离散应用数学,155(11):1458-14702007年·Zbl 1122.68084号 ·doi:10.1016/j.dam.2007.03.011 [104] V.Chepoi、F.Dragan、B.Estellon、M.Habib和Y.Vaxès。δ-双曲线测地空间和图的直径、中心和近似树。在第24届计算几何年会论文集,第59-68页,2008年·Zbl 1221.68295号 [105] F.Reidl和B.Sullivan。个人通信,2014年。 [106] P.Bellenbaum和R.Diestel。关于树分解的两个简短证明。组合数学、概率和计算, 11:541-547, 2002. ·Zbl 1018.05081号 ·doi:10.1017/S0963548302005369 [107] A.Georgakopoulos和P.Sprussel。局部有限图中的测地拓扑圈。组合数学电子杂志,16(1):R1442009年·Zbl 1230.05219号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。