×

动态随机块模型中的变点估计。 (英语) Zbl 1524.62409号

摘要:我们考虑由动态随机块模型机制生成的网络中单个变化点的位置估计问题。该模型产生了网络中的社区结构,该结构在单个时间段内发生变化。我们提出了两种估计变化点及其发生前后的模型参数的方法。第一种方法采用最小二乘准则函数,并考虑到随机块模型的完整结构,并在每个时间点进行评估。因此,作为中间步骤,它需要在每个时间点基于聚类算法估计社区结构。第二种方法包括以下两个步骤:在第一种方法中,在每个时间点使用和评估最小二乘函数,但忽略社区结构,只考虑显示变化点的随机图生成机制。一旦确定了变化点,在第二步中,将其前后的所有网络数据与聚类算法一起使用,以获得相应的社区结构,然后估计生成的随机块模型参数。由于第一种方法需要了解社区结构,因此需要在每个时间点进行聚类,因此其计算成本明显高于第二种方法。另一方面,与第二种方法相比,它对变化点和模型参数的一致性估计要求的可识别性条件要少得多;然而,它还需要一个条件,即错误地将网络节点分配到其各自的社区的错误分类率,这在许多实际环境中可能无法保持。尽管第二种方法的可识别性条件明显严格,但我们表明,由结构发生变化的随机块机制生成的网络可以在多种情况下轻松满足此条件,包括合并/拆分社区、节点加入另一个社区等。此外,对于这两种方法,在各自的可辨识性和某些额外的正则性条件下,我们建立了收敛速度,并导出了变点估计量的渐近分布。结果用合成数据进行了说明。总之,这项工作对随机块模型生成的网络的变化点分析这一新问题进行了深入研究,确定了一致估计变化点的关键条件,并提出了一种计算速度快的算法,解决了应用中出现的许多情况下的问题。最后,本文讨论了在这个问题中使用聚类算法所带来的挑战,这些挑战需要进一步研究才能完全解决。

MSC公司:

62米10 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
60G55型 点过程(例如,泊松、考克斯、霍克斯过程)
05C80号 随机图(图论方面)
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] A.Alexander和L.Horv´ath。时间序列中的结构突变。时间序列分析杂志,34(1):2013年1月16日·Zbl 1274.62553号
[2] D.Aloise、A.Deshpande、P.Hansen和P.Popat。欧氏平方和聚类的NP-hardness。机器学习,75(2):245-2482009·Zbl 1378.68047号
[3] I.E.Auger和C.E.Lawrence。段邻域的最佳识别算法。数学生物学公报,51(1):39-541989·Zbl 0658.92010号
[4] W.Bao和G.Michailidis。时间演化网络中的核心社区结构恢复和相变检测。科学报告,8(1):129382018。
[5] 巴塔查吉、巴纳吉和米查利迪斯。从最小二乘和最大似然观点估计面板数据中的常见变化点。arXiv预印本arXiv:1708.058362017。
[6] S.Bhattacharyya和S.Chatterjee。动态随机块模型的谱聚类。2017
[7] E.Brodsky和B.S.Darkhovsky。变点问题中的非参数方法,第243卷。施普林格科学与商业媒体,2013。
[8] D.Choi和P.J.Wolfe。协同集群可单独交换网络数据。《统计年鉴》,42(1):29-632014·Zbl 1294.62059号
[9] H.起重机。统计网络分析的概率基础。查普曼和霍尔/CRC,2018年·Zbl 1490.62001
[10] M.Cs–org–和L.Horv’ath。变点分析中的极限定理,第18卷。John Wiley&Sons Inc,1997年·Zbl 0884.62023号
[11] D.Durante和D.B.Dunson。局部自适应动态网络。应用统计年鉴,10(4):2203-22322016·Zbl 1454.62495号
[12] D.Durante、D.B.Dunson和J.T.Vogelstein。网络种群的非参数贝叶斯建模。《美国统计协会杂志》,112(520):1516-15302017年。
[13] C.Gao、Y.Lu和H.H.Zhou。速率最优图形估计。《统计年鉴》,43(6):2624-26522015·Zbl 1332.60050号
[14] C.Gao、Z.Ma、A.Y.Zhang和H.H.Zhou。在随机块段模型中实现最优误分类比例。机器学习研究杂志,18(1):1980-20242017·Zbl 1440.62244号
[15] Q.Han、K.Xu和E.Airoldi。动态和多层块模型的一致估计。《第32届机器学习国际会议论文集》(ICML15),第1511-1520页,2015年。
[16] P.W.Holland、K.B.Laskey和S.Leinhardt。随机块模型:第一步。《社交网络》,5:109-1371983年。
[17] J.Jin。通过分数快速社区检测。《统计年鉴》,43(1):57-892015·Zbl 1310.62076号
[18] A.约瑟夫和B.余。正则化对光谱聚类的影响。《统计年鉴》,44(4):1765-17912016·Zbl 1357.62229号
[19] O.Klopp、A.B.Tsybakov和N.Verzelen。网络模型和稀疏图形估计的Oracle不等式。《统计年鉴》,45(1):316-3542017年·Zbl 1367.62090号
[20] E.D.Kolaczyk和G.Cs’ardi。使用R对网络数据进行统计分析,使用R!丛书,第65卷。斯普林格,2014年·Zbl 1290.62002号
[21] M.Kolar、L.Song、A.Ahmed和E.P.Xing。估计时变网络。应用统计年鉴,4(1):94-1232010·Zbl 1189.62142号
[22] M.R.Kosorok先生。介绍经验过程和半参数推断。施普林格,2008年·Zbl 1180.62137号
[23] A.Kumar、Y.Sabharwal和S.Sen。任意维k均值聚类的简单线性时间(1+)近似算法。第45届IEEE计算机科学基础年会,第454-4622004页。
[24] C.M.Le、E.Levina和R.Vershynin。随机图的集中和正则化。随机结构与算法,51(3):538-5611917·Zbl 1373.05179号
[25] J.Lei和A.Rinaldo。随机块模型中谱聚类的一致性。《统计年鉴》,43(1):215-2372015·Zbl 1308.62041号
[26] C.Matias和V.Miele。通过动态随机块模型对时间网络进行统计聚类。英国皇家统计学会杂志:B辑(统计方法),79(4):1119-11412017·Zbl 1373.62312号
[27] S.Minhas、P.D.Hoff和M.D.Ward。放松,张量在这里:国际过程中的依赖性。arXiv预印本arXiv:1504082182015。
[28] J.Moody和P.J.Mucha。政党两极分化的写照。网络科学,1(1):119-1212013。
[29] M.Newman、A.L.Barabasi和D.J.Watts。网络的结构和动力学(普林斯顿复杂性研究)。普林斯顿大学出版社,2006年·Zbl 1362.00042号
[30] R.I.奥利维拉。具有独立边的随机图中邻接矩阵和拉普拉斯算子的集中。arXiv预印本arXiv:0911.06002009。
[31] L.Peel和A.Clauset。检测进化网络大规模结构中的变化点。第二十届AAAI人工智能会议记录,第2914-2920页,2015年。
[32] M.彭斯基。动态网络模型和图形估计。《统计年鉴》,47(4):2378-24032019年·Zbl 1466.62337号
[33] M.Pensky和T.Zhang。动态随机块模型中的谱聚类。《电子统计杂志》,13(1):678-7092019·Zbl 1415.62046号
[34] K.Rohe、S.Chatterjee和B.Yu。谱聚类和高维随机块模型。《统计年鉴》,39(4):1878-19152011年·Zbl 1227.62042号
[35] P.Sarkar和P.J.Bickel。归一化在随机块模型谱聚类中的作用。《统计年鉴》,43(3):962-9902015年·Zbl 1320.62150号
[36] A.W.van der Vaart和J.A.Wellner。弱收敛和经验过程:应用于统计学。施普林格,1996年·Zbl 0862.60002号
[37] D.Wang、Y.Yu和A.Rinaldo。稀疏动态网络中的最优变化点检测与定位。arXiv预印本arXiv:1809.096022018。
[38] Y.Wang、A.Chakrabarti、D.Sivakoff和S.Parthasarathy。动态网络上的分层变化点检测。2017年ACM网络科学会议论文集,第171-179页。ACM,2017年。
[39] 邢永平(E.P.Xing)、傅伟强(W.Fu)和宋丽萍(L.Song)。一种用于动态网络层析成像的状态空间混合隶属度块模型。应用统计年鉴,4(2):535-5662010·兹比尔1194.62133
[40] K.Xu。动态网络的随机块转移模型。《人工智能与统计》,第1079-1087页,2015年。
[41] T.Yang、Y.Chi、S.Zhu、Y.Gong和R.Jin。在动态社会网络中检测社区及其演变是贝叶斯方法。机器学习,82(2):157-1892011·Zbl 1237.91189号
[42] A.Y.Zhang和H.H.Zhou。随机块模型中社区检测的最小最大速率。《统计年鉴》,44(5):2252-2280,2016年·兹比尔1355.60125
[43] Y.Zhang、E.Levina和J.Zhu。通过邻域平滑估计网络边缘概率。arXiv预打印arXiv:1509.085882015。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。