×

通过时间指数族随机图模型对时间演化网络进行基于模型的聚类。 (英语) Zbl 1437.62233号

摘要:动态网络是描述时间演化复杂系统的通用语言,离散时间网络模型为各种应用提供了一种新兴的统计技术。在时间演化网络中,检测一组共享相似连接模式的节点是一个基础研究问题。我们的工作主要是基于时间演化网络的有趣特征(例如稳定性)来检测群体。在这项工作中,我们提出了一种基于离散时间指数族随机图模型的时间演化网络聚类框架,该框架同时允许建模和检测组结构。为了选择组的数量,我们使用条件似然来构造一个有效的模型选择准则。此外,我们提出了一种有效的变分期望最大化(EM)算法,以找到网络参数和混合比例的近似最大似然估计。我们的方法的威力在国际贸易网络和大型研究型大学合作网络的模拟研究和实证应用中得到了证明。

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)
62第20页 统计学在经济学中的应用
05C90年 图论的应用
94C15号机组 图论在电路和网络中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿加瓦尔,A。;Xue,L.,基于模型的非参数加权网络聚类及其在水污染分析中的应用,Technometrics(2019)
[2] 艾若迪,E.M。;布莱,D.M。;菲恩伯格,S.E。;Xing,E.P.,混合成员随机块模型,J.马赫。学习。1981-2014年第9号决议(2008年)·Zbl 1225.68143号
[3] 奥尔曼,E.S。;马蒂亚斯,C。;Rhodes,J.A.,具有多个观测变量的潜在结构模型中参数的可识别性,Ann.Statist。,第37页,第6页,第3099-3132页(2009年)·Zbl 1191.62003号
[4] 奥尔曼,E.S。;马蒂亚斯,C。;Rhodes,J.A.,一类随机图混合模型中的参数可识别性,J.Statist。计划。推理,141,5,1719-1736(2011)·Zbl 1207.62010年
[5] 阿米尼,A.A。;陈,A。;Bickel,P.J。;Levina,E.,大型稀疏网络中社区检测的伪似然方法,Ann.Statist。,41, 4, 2097-2122 (2013) ·Zbl 1277.62166号
[6] Bearman,P.S。;穆迪,J。;Stovel,K.,《情感链:青少年浪漫和性网络的结构》,《美国社会学杂志》。,110, 1, 44-91 (2004)
[7] D.Bertsimas,15.093J优化方法,麻省理工学院:麻省理工学院开放式课件。网址:https://ocw.mit.edu(英文), (2009).
[8] Bickel,P.J。;Chen,A.,网络模型和Newman-Girvan及其他模块的非参数视图,Proc。国家。阿卡德。科学。,106, 50, 21068-21073 (2009) ·Zbl 1359.62411号
[9] Choi博士。;Wolfe,P.J。;Airoldi,E.M.,类数量不断增加的随机块模型,Biometrika,99,2,273-284(2012)·Zbl 1318.62207号
[10] 科内利,M。;拉图什,P。;Rossi,F.,动态网络中的多变化点检测和聚类,统计计算。,28, 5, 989-1007 (2018) ·Zbl 1405.62076号
[11] Daudin,J.-J。;皮卡德,F。;Robin,S.,随机图的混合模型,统计计算。,18, 173-283 (2008)
[12] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,美国统计协会,97,458,611-631(2002)·Zbl 1073.62545号
[13] Girvan,M。;Newman,M.E.,《社会和生物网络中的社区结构》,Proc。国家。阿卡德。科学。,99, 12, 7821-7826 (2002) ·Zbl 1032.91716号
[14] Han,J.-D.J。;北伯丁。;郝,T。;Goldberg,D.S。;Berriz,G.F。;张,L.V。;Dupuy,D。;Walhout,A.J.M。;M.E.库西克。;罗斯,F.P。;Vidal,M.,《酵母蛋白质相互作用网络中动态组织模块性的证据》,《自然》,430,6995,88-93(2004)
[15] 手动旋塞,M.S。;Raftery,A.E。;Tantrum,J.M.,《基于模型的社交网络集群》,J.R.Stat.Soc.A,170,2,301-354(2007)
[16] Hanneke,S。;傅伟(Fu,W.)。;Xing,E.,社会网络的离散时间模型,电子。《美国法律总汇》,4,585-605(2010)·Zbl 1329.91113号
[17] Ho,Q。;宋,L。;Xing,E.,时变网络的进化簇混合成员块模型,J.Mach。学习。结果:车间会议程序。,15342-350(2011年)
[18] 霍夫,P.D。;Raftery,A.E。;Handcock,M.S.,《社交网络分析的潜在空间方法》,J.Amer。统计师。协会,97,460,1090-1098(2002)·兹比尔1041.62098
[19] 荷兰,P.W。;Laskey,K.B。;Leinhardt,S.,《随机块模型:第一步》,《社交网络》,5,2,109-137(1983)
[20] 亨特·D·R。;Lange,K.,MM算法教程,Amer。统计人员。,58, 1, 30-37 (2004)
[21] 吉,P。;金。,J.,《统计学家合著与引用网络》,Ann.Appl。统计,10,4,1779-1812(2016)·Zbl 1454.62541号
[22] 卡勒,B。;Newman,M.E.,网络中的随机块模型和社区结构,物理。版本E,83,1,016107(2011)
[23] Kim,B。;Lee,K。;薛,L。;牛,X.,带潜在变量的动态网络模型综述,统计调查。,12, 105-135 (2018) ·Zbl 1401.62103号
[24] Knecht,A.B.,《友谊的选择与朋友的影响》。《青少年早期网络动态与演员属性》(2008年),乌得勒支大学(论文)
[25] Kossinets,G。;Watts,D.J.,《进化中社会网络的实证分析》,《科学》,311,5757,88-90(2006)·Zbl 1226.91055号
[26] Krivitsky,P.N。;Handcock,M.S.,动态网络的可分离模型,J.R.Stat.Soc.Ser。B统计方法。,76, 1, 29-46 (2014) ·Zbl 1411.90079号
[27] P.N.Krivitsky,M.S.Handcock,:基于指数族随机图模型的网络演化拟合、模拟和诊断模型,Statnet项目(http://www.statnet.org),R包版本3.4.0,(2016)。
[28] Krivitsky,P.N。;手动旋塞,M.S。;Morris,M.,调整指数族随机图模型中的网络大小和组成效应,Stat.Methodol。,8, 4, 319-339 (2011) ·Zbl 1215.91069号
[29] Kruskal,J.B.,《三向数组:三线性分解的秩和唯一性及其在算术复杂性和统计学中的应用》,《线性代数应用》。,18, 2, 95-138 (1977) ·兹比尔0364.15021
[30] Lee,K.H。;Xue,L.,高斯图形模型的非参数有限混合,技术计量学,60,4,511-521(2018)
[31] 马蒂亚斯,C。;Miele,V.,《通过动态随机块模型对时间网络进行统计聚类》,J.R.Stat.Soc.Ser。B统计方法。,79, 4, 1119-1141 (2017) ·Zbl 1373.62312号
[32] 莫里斯,M。;Kretzschmar,M.,《网络中的并发伙伴关系和传输动力学》,《社交网络》,17,3-4,299-318(1995)
[33] Newman,M.E.,合著网络和科学合作模式,Proc。国家。阿卡德。科学。,101,补充1,5200-5205(2004)
[34] 纽曼,M.E。;Girvan,M.,《发现和评估网络中的社区结构》,Phys。E版,69、2、026113(2004)
[35] 诺维基,K。;Snijders,T.A.,《随机块体结构的估算和预测》,J.Amer。统计师。协会,96,455,1077-1087(2001)·Zbl 1072.62542号
[36] .R核心团队,R核心团队R(右):统计计算语言和环境,R(右)统计计算基金会,奥地利维也纳。https://www.R-project.org/, (2016).
[37] 萨尔达纳,D.F。;Yu,Y。;Feng,Y.,有多少社区?,J.计算。图表。统计人员。,26, 1, 171-181 (2017)
[38] Snijders,T.A。;Van de Bunt,G.G。;Steglich,C.E.,《网络动力学随机行为模型导论》,《社会网络》,32,1,44-60(2010)
[39] Snijders,T.A。;Nowicki,K.,具有潜在块结构的图的随机块模型的估计和预测,J.分类,14,1,75-100(1997)·Zbl 0896.62063号
[40] 泰勒,I.W。;林丁,R。;Warde-Farley,D。;刘,Y。;Pesquita,C。;Faria,D。;公牛,S。;Pawson,T。;莫里斯,Q。;Wrana,J.L.,蛋白质相互作用网络中的动态模块性预测乳腺癌结局,《自然生物技术》。,27, 2, 199-204 (2009)
[41] Varin,C.等人。;Vidoni,P.,关于复合似然推断和模型选择的注释,Biometrika,92,3,519-528(2005)·Zbl 1183.62037号
[42] Vu,D.Q。;亨特·D·R。;Schweinberger,M.,《基于模型的大型网络聚类》,Ann.Appl。统计,7,2,1010-1039(2013)·Zbl 1288.62106号
[43] Wainwright,M.J。;Jordan,M.I.,《图形模型、指数族和变分推理》,Found。趋势马赫数。学习。,1, 1-2, 1-305 (2008) ·兹比尔1193.62107
[44] Ward,医学博士。;Hoff,P.D.,《国际商业的持续模式》,《和平研究杂志》,第44、2、157-175页(2007年)
[45] A.H.韦斯特维尔。;Hoff,P.D.,《纵向关系数据和网络数据的混合效应模型及其在国际贸易和冲突中的应用》,Ann.Appl。Stat.,5,2A,843-872(2011年)·Zbl 1454.62509号
[46] Xing,体育。;傅伟(Fu,W.)。;Song,L.,用于动态网络断层扫描的状态空间混合隶属度块模型,Ann.Appl。Stat.,4,2,535-566(2010年)·Zbl 1194.62133号
[47] Xu,K.S。;Hero,A.O.,《时间演化社交网络的动态随机块模型》,IEEE J.Sel。顶部。签署程序。,8,4,552-562(2014)
[48] 薛,L。;邹,H。;Cai,T.,稀疏ising模型的非凹陷惩罚复合条件似然估计,Ann.Statist。,40, 3, 1403-1429 (2012) ·Zbl 1284.62451号
[49] Yang,T。;Chi,Y。;朱,S。;龚,Y。;Jin,R.,《在动态社会网络中检测社区及其演变——贝叶斯方法》,Mach。学习。,82, 2, 157-189 (2011) ·Zbl 1237.91189号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。