严伯伟;Purnamrita萨卡 稀疏图中的协变正则社区检测。 (英语) Zbl 1464.62333号 美国统计协会。 116,编号534,734-745(2021). 摘要:在本文中,我们研究了存在节点协变量的网络中的社区检测。在许多情况下,协变量和网络单独地只给出集群结构的部分视图。我们需要同时考虑这两个因素,共同推断出完整的集群结构。在统计学中,一个新兴的工作重点是结合网络边缘和节点协变量的信息来推断社区成员身份。然而,到目前为止,理论上的保证都是在密集区域建立的,在密集区域中,网络可以在宽参数区域下实现完美的聚类,因此协变量的作用常常不明确。在本文中,我们将稀疏网络与有限维次高斯混合作为协变量,在适度分离条件下进行研究。在这种设置中,每个单独的源只能正确地对一部分非对等节点进行集群。我们提出了一个简单的优化框架,当两个源携带关于集群成员身份的部分信息时,该框架可以提高集群的准确性,因此其自身性能较差。我们的优化问题可以通过可扩展的凸优化算法来解决。通过各种模拟和实际数据示例,我们表明该方法优于其他现有方法。 引用于7文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62J10型 方差和协方差分析(ANOVA) 关键词:渐近分析;核方法;半定规划;随机块体模型;亚高斯混合 软件:2EBD-HPE型;SDPNAL公司+;SDPLR公司 PDF格式BibTeX公司 XML格式引用 \textit{B.Yan}和\textit{P.Sarkar},J.Am.Stat.Assoc.116,No.534,734--745(2021;Zbl 1464.62333) 全文: 内政部 arXiv公司 参考文献: [1] Airoldi,E.M。;布莱,D.M。;菲恩伯格,S.E。;Xing,E.P.,“混合成员随机块模型,机器学习研究杂志,1981-2014年9月(2008年)·Zbl 1225.68143号 [2] 阿米尼,A.A。;陈,A。;Bickel,P.J。;Levina,E.,“大型稀疏网络中社区检测的伪似然方法,统计年鉴,412097-2122(2013)·Zbl 1277.62166号 ·doi:10.1214/13-AOS1138 [3] 阿米尼,A.A。;Levina,E.,“关于块模型的半定松弛,统计年鉴,46,149-179(2018)·Zbl 1393.62021号 ·doi:10.1214/17-AOS1545 [4] Balakrishnan,S。;Wainwright,M.J。;Yu,B.,“EM算法的统计保证:从人口到基于样本的分析”,《统计年鉴》,45,77-120(2017)·Zbl 1367.62052号 ·doi:10.1214/16-AOS1435 [5] Binkiewicz,N。;Vogelstein,J.T。;Rohe,K.,“协变量辅助光谱聚类,Biometrika,104361-377(2017)·Zbl 1506.62319号 ·doi:10.1093/biomet/asx008 [6] Braverman,M。;Makarychev,K。;Makarychev,Y。;Naor,A.,《数学论坛》,Pi,1,“Grothendieck常数严格小于Krivine的界限”,e4(2013),剑桥大学出版社·Zbl 1320.15016号 ·doi:10.1017/fmp.2013.4 [7] 伯尔,S。;Monteiro,R.D.,“通过低秩分解求解半定程序的非线性规划算法,数学规划,95,329-357(2003)·Zbl 1030.90077号 ·doi:10.1007/s10107-002-0352-8 [8] Cai,T.T。;Li,X.,“存在任意孤立节点的鲁棒和计算可行性社区检测,统计年鉴,431027-1059(2015)·Zbl 1328.62381号 ·doi:10.1214/14-AOS1290 [9] 乔杜里,K。;卡卡德,S.M。;Livescu,K。;Sridharan,K.,《基于典型相关分析的多视角聚类》,第26届国际年会,129-136(2009)·数字对象标识代码:10.1145/1553374.1553391 [10] 陈,C。;他,B。;Ye,Y。;Yuan,X.,“多块凸极小化问题ADMM的直接推广不一定收敛,数学规划,155,57-79(2016)·Zbl 1332.90193号 ·doi:10.1007/s10107-014-0826-5 [11] 陈,Y。;Xu,J.,“随着集群和子空间数量的增加,植入式问题和子矩阵本地化的统计计算权衡”,《机器学习研究杂志》,17,1-57(2016)·Zbl 1360.62320号 [12] 达斯古普塔,S。;舒尔曼,L.,“分离的球面高斯混合体EM的概率分析,机器学习研究杂志,8,203-226(2007)·Zbl 1222.62142号 [13] El Karoui,N.,“关于信息加噪声核随机矩阵,统计年鉴,383191-3216(2010)·Zbl 1200.62056号 ·doi:10.1214/10-AOS801 [14] 票价,B。;诺尔·D·。;Apkarian,P.,“通过顺序半定规划实现鲁棒控制,SIAM控制与优化杂志,401791-1820(2002)·Zbl 1009.93022号 ·doi:10.137/S0363012900373483 [15] Gil-Mendieta,J。;施密特,S.,“墨西哥的政治网络,社会网络,18,355-381(1996)·doi:10.1016/0378-8733(95)00281-2 [16] 盖登,O。;Vershynin,R.,“通过Grothendieck不等式、概率理论和相关领域在稀疏网络中进行社区检测,1651025-1049(2015)·Zbl 1357.90111号 ·doi:10.1007/s00440-015-0659-z [17] 哈耶克,B。;Wu,Y。;Xu,J.,“通过半定规划实现精确的集群恢复阈值”,IEEE信息理论汇刊,627788-2797(2016)·Zbl 1359.94222号 ·doi:10.1109/TIT.2016.2546280 [18] 荷兰,P.W。;Laskey,K.B。;Leinhardt,S.,“随机块模型:第一步,社会网络,5109-137(1983)·doi:10.1016/0378-8733(83)90021-7 [19] 徐,D。;卡卡德,S.M。;Zhang,T.,“亚高斯随机向量二次型的尾不等式,概率论中的电子通信,17,1-6(2012)·Zbl 1309.60017号 ·doi:10.1214/ECP.v17-2079 [20] 雅各布,美国。;Thierry,A。;博泽,美国。;Arntz,W.E。;Berg,S。;Brey,T。;费泽尔,I。;Jonsson,T。;Mintenbeck,K。;莫尔曼,C。;Petchey,O.L.,“体型在复杂食物网中的作用:一个冷案例,生态研究进展,45,181-223(2011) [21] Jin,J。;Ke,Z.T。;Wang,W.,“高维聚类的相变及相关问题,统计年鉴,45,2151-2189(2017)·Zbl 1459.62113号 ·doi:10.1214/16-AOS1522 [22] 库马尔,A。;Rai,P。;Daume,H.,“共正则化多视图光谱聚类”,摘自《神经信息处理系统的进展》,第24期,第1413-1421页(2011年) [23] Kushagra,S.、McNabb,N.、Yu,Y.和Ben David,S.(2017),“可证明的噪声鲁棒、正则k-Means聚类”,arXiv编号1711.11247。 [24] Le,C.M.和Levina,E.(2015),“用谱方法估算网络中社区的数量”,arXiv编号1507.00827。 [25] 李·G。;齐,L。;Yu,G.,“对称张量的Z特征值及其在谱超图理论中的应用,数值线性代数及其应用,20,1001-1029(2013)·Zbl 1313.65081号 ·doi:10.1002/nla.1877 [26] 刘杰。;王,C。;高杰。;Han,J.,通过联合非负矩阵分解实现多视图聚类,2013年SIAM数据挖掘国际会议论文集(2013)·doi:10.1137/1.9781611972832.28 [27] 米森,D.G。;维拉尔,S。;Ward,R.,“通过半定规划、信息和推理对亚高斯混合进行聚类”,6389-415(2017)·Zbl 1381.62189号 ·doi:10.1093/imaiai/iax001 [28] Montanari,A。;Sen,S.,稀疏随机图上的半定规划及其在社区检测中的应用(2016)·Zbl 1376.90043号 ·doi:10.1145/2897518.2897548 [29] 蒙特罗,R.D.C。;Zanjcomo,P.,“基于Monteiro和Tsuchiya Newton方向及其变量的半定规划的原对偶方法的实现,优化方法和软件,11,91-140(1999)·Zbl 0957.90105号 ·doi:10.1080/10556789908805749 [30] 蒙特罗,R.D。;奥尔蒂斯,C。;Svaiter,B.F.,“求解两易块结构化半定程序的一阶块分解方法,数学规划计算,6103-150(2014)·Zbl 1342.49045号 ·doi:10.1007/s12532-013-0062-7 [31] Mukherjee,S.、Sarkar,P.和Bickel,P.(2017),“大型网络的两种显著一致的划分和征服聚类算法”,arXiv编号1708.05573。 [32] 纽曼,M.E。;Clauset,A.,“注释网络中的结构和推断”,《自然通讯》,第7期,第11863页(2016年)·doi:10.1038/ncomms11863 [33] Papachristodoulou,A。;安德森,J。;Valmorbida,G。;Prajna,S。;塞勒,P。;帕里罗,P.A.(2013) [34] 彭杰。;Wei,Y.,“通过半定规划逼近k-Means型聚类,SIAM优化杂志,18,186-205(2007)·Zbl 1146.90046号 ·doi:10.1137/050641983年 [35] 佩里,A。;Wein,A.S.,“随机块模型中不平衡多段的半定程序,国际抽样理论与应用会议,64-67(2017) [36] Rauhut,H.和Stojanac。(2015),“Tensor Theta规范和低阶恢复”,arXiv编号1505.05175·Zbl 1333.94023号 [37] Renegar,J.(2014),“线性规划和半定规划的有效一阶方法”,arXiv编号1409.5832。内政部:。 [38] Rohe,K。;Chatterjee,S。;Yu,B.,“谱聚类和高维随机块模型”,《统计年鉴》,391878-1915(2011)·Zbl 1227.62042号 ·doi:10.1214/11-AOS887 [39] 施,T。;贝尔金,M。;Yu,B.,“数据光谱学:卷积算子的特征空间和聚类”,《统计年鉴》,第37期,第3960-3984页(2009年)·Zbl 1191.62114号 ·doi:10.1214/09-AOS700 [40] Sun,D。;Toh,K.-C。;Yang,L.,“四块约束二次规划的收敛近似交替方向乘数法”(2014) [41] 范登伯格,L。;Boyd,S.,“半定规划,SIAM评论,38,49-95(1996)·兹比尔0845.65023 ·数字对象标识代码:10.1137/1038003 [42] Vempala,S。;Wang,G.,“用于学习混合模型的谱算法”,《计算机与系统科学杂志》,68841-860(2004)·Zbl 1074.68028号 ·doi:10.1016/j.jcss.2003.11.008 [43] Verzelen,N。;Arias-Castro,E.,“稀疏混合模型中的检测和特征选择,统计年鉴,451920-1950(2017)·Zbl 1486.62192号 ·doi:10.1214/16-AOS1513 [44] Villar,S.、Bandeira,A.S.、Blumberg,A.J.和Ward,R.(2016),“Gromov-Hausdorff距离的多项式时间松弛”,arXiv编号1610.05214。 [45] Wainwright,M.(2015) [46] 温,Z。;Goldfarb,D。;Yin,W.,“半定规划的交替方向增广拉格朗日方法,数学规划计算,2203-230(2010)·Zbl 1206.90088号 ·doi:10.1007/s12532-010-0017-1 [47] Weng,H.和Feng,Y.(2016),“利用节点信息进行社区检测”,arXiv编号1610.09735。 [48] Yan,B。;Sarkar,P.,“关于核聚类的稳健性”,摘自《神经信息处理系统的进展》,3098-3106(2016)·Zbl 1450.81006号 [49] Yan,B。;Sarkar,P。;Cheng,X.,块模型中块数的可证明估计,84,1185-1194(2018) [50] Yan,B。;尹,M。;Sarkar,P.,“高斯多成分混合物上梯度EM的收敛,神经信息处理系统进展,6959-6969(2017) [51] Yang,L.等人。;Sun,D。;Toh,K.-C.,“SDPNAL++:非负约束半定规划的优化半光滑Newton-CG增广拉格朗日方法,数学规划计算,7331-366(2015)·Zbl 1321.90085号 ·doi:10.1007/s12532-015-0082-6 [52] 张,Y。;Chen,K。;桑普森。;Hwang,K。;Luna,B.(2017) [53] 张,Y。;莱维纳,E。;Zhu,J.,“具有节点特征的网络中的社区检测”,《电子统计杂志》,10,3153-3178(2016)·Zbl 1359.62271号 ·doi:10.1214/16-EJS1206 [54] 郑琦。;Lafferty,J.,“基于随机线性测量的秩最小化和半定规划的收敛梯度下降算法”,载《神经信息处理系统的进展》,109-117(2015) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。