×

加权网络中基于显著性的社区检测。 (英语) 兹比尔1472.62123

摘要:社区检测是对网络中强连接节点进行分组的过程。许多针对未加权网络的社区检测方法都有一个空模型的理论基础。因此,通过这些方法发现的社区具有统计意义方面的解释。在本文中,我们为加权网络引入了一个称为连续配置模型的空值。首先,我们提出了一种加权网络社区提取算法,该算法结合了空值下的迭代假设检验。在加权随机块模型下,我们证明了边权和的中心极限定理和算法的渐近一致性。然后,我们将该算法合并到名为CCME的社区检测方法中。为了对该方法进行基准测试,我们提供了一个仿真框架,其中包括带有社区的加权网络中的零到植物“背景”节点。我们表明,CCME在这些模拟中的经验性能与现有方法相比具有竞争力,尤其当存在重叠的社区和背景节点时。为了进一步验证该方法,我们提出了两个具有潜在背景节点的现实世界网络,并用CCME对其进行了分析,得出了揭示相应系统宏观特征的结果。

MSC公司:

62J15型 配对和多重比较;多次测试
62F03型 参数假设检验
60F05型 中心极限和其他弱定理
68T05型 人工智能中的学习和自适应系统
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 克里斯托弗·艾彻(Christopher Aicher)、阿比盖尔·雅各布斯(Abigail Z Jacobs)和亚伦·克劳塞特(Aaron Clauset)。学习加权网络中的潜在块结构。《复杂网络杂志》,第cnu026页,2014年·Zbl 1397.68151号
[2] 里德·安徒生(Reid Andersen)、大卫·F·格莱奇(David F Gleich)和瓦哈布·米罗尼(Vahab Mirrorkni)。用于分布式计算的重叠簇。第五届ACM网络搜索国际会议记录44
[3] 图6:第6.2.1节中描述的模拟结果,以及未转换的oNMI分数。图例指所有绘图。和数据挖掘,第273-282页。ACM,2012年。
[4] 阿尔伯特·拉兹洛·巴拉巴西(Albert-Laszlo Barabasi)和佐尔坦·N·奥尔特瓦伊(Zoltan N Oltvai)。网络生物学:理解细胞的功能组织。《自然评论遗传学》,5(2):101-1132004。
[5] 阿兰·巴拉特(Alain Barrat)、马克·巴瑟利米(Marc Barthelemy)、罗穆尔多·帕斯托尔·萨托拉斯(Romualdo Pastor-Satorras)和亚历山德罗·维斯皮格纳尼(Alessandro Vespignani)。复杂加权网络的体系结构。美国国家科学院院刊,101(11):3747-37522004。
[6] 爱德华·A·本德。具有给定行和列和的非负整数矩阵的渐近数。离散数学,10(2):217–2231974·Zbl 0293.0509号
[7] Yoav Benjamini和Yosef Hochberg,控制错误发现率:一种实用且强大的多重测试方法。《皇家统计学会杂志》,B辑(方法学),第289-300页,1995年·Zbl 0809.62014号
[8] 彼得·比克尔(Peter J Bickel)和陈爱友(Aiyou Chen)。网络模型和newman–girvan及其他模块的非参数视图。《美国国家科学院院刊》,106(50):21068–210732009·Zbl 1359.62411号
[9] 文森特·德·布隆德尔(Vincent D Blondel)、吉安·卢普·纪尧姆(Jean-Loup Guillaume)、雷诺德·兰比奥特(Renaud Lambiotte)和艾蒂安·列斐伏尔(Etienne Lefebvre)。大型网络中社区的快速发展。统计力学杂志:理论与实验,2008(10):P100082008。
[10] 贝拉·博洛布饰。标记正则图个数渐近公式的概率证明。欧洲组合数学杂志,1(4):311–3161980。
[11] Irineo Cabreros、Emmanuel Abbe和Aristotelis Tsirigos。检测hi-c基因组数据中的群落结构。信息科学与系统(CISS),2016年年度会议,第584-589页。IEEE,2016年。45
[12] 范忠,陆林源。给定期望度的随机图的平均距离。《美国国家科学院院刊》,99(25):15879–158822002a·Zbl 1064.05137号
[13] 范忠,陆林元。具有给定期望度序列的随机图中的连通成分。组合数学年鉴,6(2):125-1452002b·Zbl 1009.05124号
[14] Aaron Clauset、Mark EJ Newman和Cristopher Moore。在非常大的网络中发现社区结构。《物理评论》E,70(6):0661112004。
[15] Aaron Clauset、Cosma Rohilla Shalizi和Mark EJ Newman。经验数据中的幂律分布。SIAM评论,51(4):661-7032009年·Zbl 1176.62001号
[16] Amin Coja Oghlan和Andr´e Lanka。在具有一般度分布的随机图中寻找种植分区。SIAM离散数学杂志,23(4):1682-17142009年·兹比尔1207.05178
[17] Gabor Cs’ardi和Tamas Nepusz。用于复杂网络研究的igraph软件包。InterJournal,复杂系统:16952006。
[18] Leon Danon、Albert Diaz Guilera、Jordi Duch和Alex Arenas。比较群落结构识别。统计力学杂志:理论与实验,2005(09):P090082005。
[19] Nurcan Durak、Tamara G Kolda、Ali Pinar和C Seshadhri。匹配所有度分布的有向图的可缩放空模型:输入、输出和倒数。网络科学研讨会(新南威尔士州),2013年IEEE第2期,第23-30页。IEEE,2013年。
[20] 范明、王家春、刘泰武、拉瓦西和高欣。Secom:一种基于散列种子和社区检测的新方法,用于基因组规模的蛋白质域鉴定。《公共科学图书馆·综合》,7:e394752012年6月。
[21] 圣福图纳托。图中的社区检测。物理报告,486(3):75-1742010。
[22] 罗杰·吉梅拉和路易斯·阿纳斯·阿马拉。复杂代谢网络的功能制图。《自然》,433(7028):895-900,2005年。
[23] 阿比盖尔·雅各布斯和亚伦·克劳塞特。网络生成模型的统一观点:模型、方法、机会和挑战。arXiv:1411.40702014年。
[24] David Kahle和Hadley Wickham。ggmap:使用ggplot2进行空间可视化。《R杂志》,5(1):144–1612013年。统一资源定位地址http://journal.r-project.org/archive/2013-1/kahle-wickham.pdf。
[25] Brian Karrer和Mark EJ Newman。网络中的随机块模型和社区结构。物理评论E,83(1):0161072011。
[26] 安德烈亚·兰奇奈蒂和圣托·福图纳托。在有重叠社区的有向图和加权图上测试社区检测算法的基准。物理评论E,80(1):0161182009。46
[27] 安德烈亚·兰西奇内蒂(Andrea Lancichinetti)、桑托·福图纳托(Santo Fortunato)和杰安诺斯·科特斯(J’anos Kert’esz)。检测复杂网络中重叠和分层的社区结构。《新物理杂志》,11(3):0330152009。
[28] Andrea Lancchineti、Filippo Radicchi、Jos´e J Ramasco、Santo Fortunato等人。在网络中发现具有统计意义的社区。《公共科学图书馆·综合》,6(4):e189612011年。
[29] 洛科·兰根(Rocco Langone)、卡洛斯·阿尔扎特(Carlos Alzate)和约翰·阿克·苏肯斯(Johan AK Suykens)。基于模块的核谱聚类模型选择。2011年国际神经网络联合会议,第1849-1856页。IEEE,2011年。
[30] Jure Leskovec等人,斯坦福网络分析项目,2010年。统一资源定位地址http://snap.stanford。教育部。
[31] David Lusseau和Mark EJ Newman。确定动物在其社交网络中扮演的角色。伦敦皇家学会学报B:生物科学,271(增刊6):S477–S4812004。
[32] 迈克尔·莫洛伊和布鲁斯·里德。具有给定度序列的随机图的临界点。随机结构与算法,6(2-3):161-1801995·Zbl 0823.05050号
[33] 马克·纽曼(Mark EJ Newman)。复杂网络的结构和功能。SIAM综述,45(2):167–256,2003年·Zbl 1029.68010号
[34] 马克·纽曼(Mark EJ Newman)。加权网络分析。物理评论E,70(5):0561312004a。
[35] 马克·纽曼(Mark EJ Newman)。检测网络中的社区结构。欧洲物理杂志B-凝聚物质和复杂系统,38(2):321–330,2004b。
[36] 马克·纽曼(Mark EJ Newman)。网络中的模块化和社区结构。《美国国家科学院院刊》,103(23):8577–85822006。
[37] Mark EJ Newman和Michelle Girvan。发现和评估网络中的社区结构。物理评论E,69(2):0261132004。
[38] 克尔兹托夫·诺维基和汤姆·A·B·斯奈德。随机块体结构的估计和预测。美国统计协会杂志,96(455):1077–10872001·Zbl 1072.62542号
[39] Gergely Palla、Albert-L´aszl´o Barab´asi和Tam´as Vicsek。量化社会群体进化。《自然》,446(7136):664-6672007。
[40] 蒂亚戈·P·佩克索托。具有重叠组的大规模网络模型的模型选择和假设检验。物理评论X,5(1):0110332015。
[41] 蒂亚戈·P·佩克索托。非参数加权随机块段模型。arXiv:1708.014322017年。
[42] 约翰·普拉蒂格(John Platig)、彼得·卡斯塔尔迪(Peter Castaldi)、道恩·德梅奥(Dawn DeMeo)和约翰·夸肯布什(John Quackenbush)。eqtls的二元群落结构。arXiv:1509.02816,2015年。
[43] 帕斯卡·蓬斯和马蒂厄·拉塔比。使用随机漫步计算大型网络中的社区。图形算法应用杂志,10(2):191–2182006。47 ·Zbl 1161.68694号
[44] 梅森·A·波特(Mason A Porter)、朱卡·佩卡·昂内拉(Jukka-Pekka Onnela)和彼得·穆查(Peter J Mucha)。网络中的社区。AMS通知,56(9):1082–10972009·Zbl 1188.05142号
[45] J¨org Reichardt和Stefan Bornholdt。通过网络社区对稀疏数据进行聚类是一个大型在线市场的原型研究。统计力学杂志:理论与实验,2007(06):P060162007。
[46] 马丁·罗斯瓦尔(Martin Rosvall)和卡尔·T·伯格斯特罗姆(Carl T Bergstrom)。复杂网络上随机行走的地图揭示了社区结构。《美国国家科学院院刊》,105(4):1118–11232008。
[47] Shaghayegh Sahebi和William W Cohen。基于社区的建议:冷启动问题的解决方案。在推荐系统和社交网络研讨会上,RSWEB,2011年。
[48] 斯科特·怀特和帕德拉克·史密斯。在图中查找社区的谱聚类方法。在SDM中,第5卷,第76-84页。SIAM,2005年。
[49] James D Wilson、Simi Wang、Peter J Mucha、Shankar Bhamidi、Andrew B Nobel等。一种基于测试的提取算法,用于识别网络中的重要社区。《应用统计年鉴》,8(3):1853-1891,2014年·Zbl 1304.05141号
[50] 谢杰瑞、斯兹曼斯基和刘晓明。Slpa:通过说话人-听众互动动态过程,揭示社交网络中重叠的社区。IEEE第11届国际数据挖掘会议,第344-349页。IEEE,2011年。
[51] 谢杰瑞(Jierui Xie)、史蒂芬·凯利(Stephen Kelley)和博莱斯瓦夫·克西曼斯基(Boleslaw K Szymanski)。网络中重叠社区检测:最新和比较研究。ACM计算调查,45(4):432013·Zbl 1288.68191号
[52] 刘欣、鄂海红、宋俊德、宋美娜、童俊杰。基于社区检测的图书推荐。《普及计算与网络世界》,第364-373页。斯普林格,2014年。
[53] Yan Xiaoran、Cosma Shalizi、Jacob E Jensen、Florent Krzakala、Cristopher Moore、Lenka Zdeborov´a、Pan Zhang和Yaojia Zhu。度校正块模型的模型选择。《统计力学杂志:理论与实验》,2014(5):P050072014。
[54] 张世华、王瑞生和张向孙。使用模糊c均值聚类识别复杂网络中重叠的社区结构。物理学A:统计力学及其应用,374(1):483–4902007。
[55] 赵云鹏(Yunpeng Zhao)、伊丽莎维塔·莱维娜(Elizaveta Levina)和季朱(Ji Zhu)。社交网络的社区提取。《美国国家科学院院刊》,108(18):7321–73262011年。
[56] 赵云鹏(Yunpeng Zhao)、伊丽莎维塔·莱维娜(Elizaveta Levina)和季朱(Ji Zhu)。度校正随机块模型下网络中社区检测的一致性。《统计年鉴》,第2266–2292页,2012年·Zbl 1257.62095号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。