×

使用多元时间序列和主题建模研究社交网络中的影响节点和异常主题活动。 (英语) Zbl 07535596号

摘要:了解社交网络中的行为,尤其是节点之间的过度通信,非常重要。网络中的此类过度活动可以深入了解节点之间的通信模式,在某些情况下,这可能会导致欺诈行为。扫描统计数据以前曾被用于检测电子邮件网络中的过度通信。然而,由于扫描统计信息与局部统计信息的最大值相关,因此仅凭它们无法有效地揭示颤振的动态关系和发展过程。在此,我们开发了一个多元时间序列模型,即向量自回归(VAR)模型,并将其应用于组织电子邮件的元数据,作为一个案例研究,以检测一组有影响力的节点及其动态关系。此外,我们设计了一种新的方法,该方法利用从电子邮件内容、扫描统计和最大信息流时间序列中获得的概率主题模型。我们演示了从VAR模型中获得的有影响力的顶点是如何与异常主题活动相联系的。这些方法对于研究其他动态网络中的过度通信和异常主题活动非常有用,例如推特网络、电话、科学合作和其他社交网络。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Akaike,H.,信息理论和最大似然原理的扩展,267-81(1973)·Zbl 0283.62006号
[2] Arranz,M.A.,时间序列中的Portmanteau检验统计,1-8(2005)
[3] Barabási,A.L。;Jeong,H。;内达州。;Ravasz,E。;舒伯特,A。;Vicsek,T.,科学合作社会网络的演变,《物理学A:统计力学及其应用》,311(2002)·Zbl 0996.91086号
[4] Barcelo-Vida,C。;阿吉拉尔。;Martin-Fernandez,J.A.,《合成时间序列:第一种方法》,81-86(2007),西班牙贝塞罗纳
[5] Berger-Wolf,T.Y。;Saia,J.,动态社交网络分析框架,523-28(2006)
[6] 布莱,D.M。;Ng,A.Y。;Jordan,M.I.,潜在的Dirichlet分配,《机器学习研究杂志》,3,993-1022(2003)·Zbl 1112.68379号
[7] Brooks,C.,《金融计量经济学导论》(2008),英国剑桥:剑桥大学出版社,英国剑桥·Zbl 1141.91001号
[8] Chen,W.W。;Deo,R.S.,时间序列的广义组合拟合优度检验,计量经济学理论,20,2382-416(2004)·Zbl 1072.62088号 ·doi:10.1017/S0266466604202067
[9] Cooks,J.(2013)
[10] 迪金森,P。;Bunke,H。;Dadej,A。;Kraetzl,M.,《通信网络中的中值图和异常变化检测》,决策和控制会议(2002年)
[11] Freeman,L.C.,《社会网络概念澄清中的中心性》,《社交网络》,第1、3、215-39页(1978年)·doi:10.1016/0378-8733(78)90021-7
[12] Goswami,S.,《用于检测时间序列图中异常的网络邻域分析》(2019年),乔治梅森大学
[13] Goswami,S。;Wegman,E.J.,《法医学研究分类方法比较》,《统计科学与应用杂志》,4,65-84(2016)
[14] Goswami,S。;Wegman,E.J.,时间序列图中过度活动的检测,应用统计学杂志,47,1176-200(2020)·Zbl 1521.62337号 ·doi:10.1080/02664763.2019.1634680
[15] Griffiths,T.L。;Steyvers,M.,《寻找科学主题》,《美利坚合众国国家科学院学报》,101,补遗1,5228-35(2004)·doi:10.1073/pnas.0307752101
[16] 格罗森迪克,J。;Priebe,C.E。;Gorin,A.L.,《属性随机图的统计推断:图特征和内容的融合》,计算统计与数据分析,54,7,1777-90(2010)·Zbl 1284.62079号 ·doi:10.1016/j.csda.2010.01.017
[17] Hannan,E.J。;Quinn,B.G.,《自回归顺序的确定》,《皇家统计学会杂志》,B辑,41190-95(1979)·Zbl 0408.62076号
[18] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素:数据挖掘推断和预测》(2011年),纽约州纽约市:斯普林格市,纽约州
[19] 詹姆斯·G。;维滕,D。;哈斯蒂,T。;Tibshirani,R.,《R中应用的统计学习导论》(2013),纽约州纽约市:纽约州纽约州斯普林格·Zbl 1281.62147号
[20] 荣格,I。;劳森·A·B。;班纳吉,S。;R.P.海宁。;Ugarte,M.D.,《空间流行病学手册,扫描测试》(2016),佛罗里达州博卡拉顿:查普曼和霍尔,CRC出版社,泰勒和弗朗西斯集团,佛罗里达州波卡拉顿·Zbl 1416.62004号
[21] M.库尔多夫。;黄,L。;Konty,K.,《基于正态概率模型的连续数据扫描统计》,《国际健康地理杂志》,第8期,第58-67页(2009年)·doi:10.1186/1476-072X-8-58
[22] Lee,N.H。;Priebe,C.E.,属性随机图时间序列的潜在过程模型,随机过程的统计推断,14,3,231-53(2011)·Zbl 1225.62125号 ·doi:10.1007/s11203-011-9058-y
[23] 李伟(Li,W.)。;McLeod,A.,多元ARMA时间序列模型中残差自相关的分布,英国皇家统计学会杂志,B系列(统计方法论),43231-39(1981)·Zbl 0505.62079号
[24] Lutkepohl,H.,《多重时间序列分析新导论》(2006),纽约州纽约市:Springer-Verlag,纽约州·Zbl 1141.62071号
[25] Marchette,D.,《图形上的扫描统计》,《威利跨学科评论:计算统计》,第4、5、466-73页(2012年)·doi:10.1002/wics.1217
[26] 莫里茨,S。;Bartz-Beielstein,T.,inputeTS:R中的时间序列缺失值插补,《R杂志》,9,1,207-18(2017)·doi:10.32614/RJ-2017-009
[27] Newman,M.E.J.,《网络:导论》(2010),英国牛津:牛津大学出版社,英国牛津·Zbl 1195.94003号
[28] Ng、S。;Perron,P.,用数据相关方法选择截断滞后的ARMA模型单位根检验,美国统计协会杂志,90,429,268-81(1995)·Zbl 0820.62074号 ·doi:10.1080/01621459.1995.10476510
[29] Pincombe,B.,《使用ARMA过程检测时间序列图中的异常》,ASOR Bulletin,24,2-10(2005)
[30] Pfaff,B.,VAR,SVAR和SVEC模型:在R包变量中的实现,《统计软件杂志》,27,4,1-32(2008)·doi:10.18637/jss.v027.i04
[31] Porter,M.D.和Smith,R.,2010年。网络邻域分析。IEEE国际情报与安全信息学会议(ISI),31-36。
[32] Priebe,C.E。;康罗伊,M.J。;Marchette,D.J。;Park,Y.,安然图的扫描统计,计算和数学组织理论,11,3,229-47(2005)·Zbl 1086.68562号 ·doi:10.1007/s10588-005-5378-z
[33] Priebe,C.E。;Park,Y。;Marchette,D.J。;康罗伊,J.M。;格罗森迪克,J。;Gorin,A.L.,《属性随机图的统计推断:图特征和内容的融合:安然图时间序列的实验》,计算统计与数据分析,54,7,1766-76(2010)·Zbl 1284.62390号 ·doi:10.1016/j.csda.2010.01.008
[34] Salton,G。;McGill,M.J.,《现代信息检索导论》(1983),纽约州纽约市:McGraw-Hill Inc,纽约州·Zbl 0523.68084号
[35] Schwarz,G.,估算模型的维度,《统计年鉴》,6,2,461-64(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[36] Stadnitska,T.,《确定性或随机趋势:基于增强dickey-fuller检验的决策》,《方法论》,683-92(2010)
[37] Tantipathananandh,C。;Berger-Wolf,T。;Kempe,D.,动态社交网络中的社区识别框架,717-26(2007)
[38] Tsay,R.S.,《R和金融应用的多元时间序列分析》(2014年),新泽西州霍博肯:新泽西州威利·Zbl 1279.62012号
[39] Wallis,K.F.,有界经济变量的时间序列分析,时间序列分析杂志,8,1,115-23(1987)·Zbl 0611.90040号 ·doi:10.1111/j.1467-9892.1987.tb00425.x
[40] Wasserman,S。;Faust,K.,《社会网络分析:方法和应用》(1994),英国剑桥:剑桥大学出版社,英国剑桥
[41] Wegman,E.J.,使用平行坐标进行超维数据分析,美国统计协会杂志,85,411,664-75(1990)·doi:10.1080/016214591990.10474926
[42] Zanette,D.H.,《小世界网络谣言传播动力学》,《物理评论E》,65,4,041908(2002)·doi:10.1103/PhysRevE.65.041908
[43] Zivot,E。;Wang,J.,《使用S-PLUS建模金融时间序列》(2006),纽约州纽约市:纽约州纽约州斯普林格·Zbl 1092.91067号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。