×

用于监视高维数据流的集合式EWMA方案。 (英语) Zbl 1440.62208号

摘要:在许多统计过程控制(SPC)应用程序中,对高维数据流的监控对于实时检测异常活动变得越来越重要。尽管文献中对多元SPC进行了广泛研究,但在流间存在相关性的情况下,为高维过程设计实用监测方案所面临的挑战尚未得到很好的解决。由于协方差矩阵估计中的污染偏差随着维数的增加而快速增长,经典的基于T ^ 2检验的方案不能很好地工作。我们提出了一种基于“分治”策略的测试统计量,并将该统计量集成到用于第二阶段过程监控的多元指数加权移动平均制图方案中。其关键思想是计算低维子向量上的(T^2)统计量并将其组合在一起。该方法本质上是无分布的,计算效率高。控制限是通过测试统计量在一些温和条件下的渐近分布来获得的。我们的渐近结果也有助于量化所需参考样本的大小。理论分析和数值结果表明,该方法能够控制虚警率,并提供鲁棒的变化检测。

MSC公司:

62甲12 多元分析中的估计
62兰特 大数据和数据科学的统计方面
62升12 序贯估计
62G10型 非参数假设检验
第60页 统计学在工程和工业中的应用;控制图
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] J.Aston和C.Kirch,《高维设置中的变化点》,预印本(2015),arXiv:1409.1771。
[2] Bai,Z.和Saranadasa,H.,高维效应:通过一个两样本问题的例子,Statist。Sinica6(1996)311-329·Zbl 0848.62030号
[3] Benjamini,Y.和Heller,R.,空间信号的错误发现率,J.Amer。统计师。协会102(2007)1272-1281·Zbl 1332.94019号
[4] Brook,D.和Evans,D.A.,《CUSUM游程的概率分布方法》,《生物统计学》59(1972)539-549·Zbl 0265.62038号
[5] Cai,T.,Liu,W.和Xia,Y.,高维平均数依赖下的双样本检验,J.R.Stat.Soc.Ser。B76(2014)349-372·Zbl 07555454号
[6] Capizzi,G.和Masarotto,G.,《自适应指数加权移动平均控制图》,《技术计量学》45(2003)199-207。
[7] Champ,C.W.、Jones-Farmer,L.A.和Rigdon,S.E.,估算参数时控制图的特性,《技术计量学》47(2005)437-445。
[8] Chatterjee,S.和Qiu,P.,《使用基于引导的控制限的无分布累积和控制图》,Ann.Appl。统计数据3(2009)349-369·Zbl 1160.62095号
[9] S.X.Chen,J.Li和P.-S.Zhong,带阈值和数据转换的高维均值的两样本检验,预印本(2014),arXiv:1410.2848。
[10] Chen,S.X.和Qin,Y.-L.,高维数据的双样本检验及其在基因集测试中的应用,《统计年鉴》38(2010)808-835·Zbl 1183.62095号
[11] Chen,L.S.,Paul,D.,Prentice,R.L.和Wang,P.,蛋白质组学研究中通路分析的正规hotelling’S(t^2)检验,J.Amer。统计师。协会106(2011)1345-1360·兹比尔1234.62082
[12] Cho,H.和Fryzlewicz,P.,通过稀疏二进制分割对高维时间序列进行多变化点检测,J.R.Stat.Soc.Ser。B77(2015)475-507·Zbl 1414.62356号
[13] Croisier,R.B.,累积和质量控制方案的多元推广,《技术计量学》30(1988)243-251。
[14] B.Donovan、A.Mori、N.Agrawal、Y.Meng、J.Lee和D.D.Work,《纽约市小时交通量估算(2010-2013)》(2016),https://doi.org/10.13012/B2IDB-4900670_V1。
[15] J.Fan,Y.Liao和J.Yao,高维截面试验中的功率增强,预印本(2015),arXiv:11310.3899·Zbl 1410.62201号
[16] Feng,L.,Zou,C.和Wang,Z.,双样本位置问题的基于多变量符号的高维测试,J.Amer。统计师。协会111(2016)721-735。
[17] K.B.Gregory、R.J.Carroll、V.Baladadayuthapani和S.N.Lahiri,《高维平均数相等的双样本检验》,J.Amer。统计师。Assoc.(2014),出版中·Zbl 1373.62274号
[18] Guerriro,M.、Willett,P.和Glaz,J.,《使用扫描统计的传感器网络中的分布式目标检测》,IEEE T Signal Proces.57(2009)2629-2639·Zbl 1391.94517号
[19] Han,D.和Tsung,F.,广义EWMA控制图及其与最优EWMA、CUSUM和GLR方案的比较,《统计年鉴》32(2004)316-339·兹比尔1105.62385
[20] Han,D.和Tsung,F.,《动态均值变化检测的无参考cuscore图和绘制性能比较的统一框架》,J.Amer。统计师。协会101(2006)368-386·Zbl 1118.62384号
[21] Hawkins,D.M.和Maboudou-Tchao,E.M.,《自启动多元指数加权移动平均控制图》,《技术计量学》49(2007)199-209。
[22] Hawkins,D.M.和Olwell,D.H.,《累积和图表和质量改进图表》(Springer-Verlag,纽约,1998年)·Zbl 0990.62537号
[23] Horváth,L.和Hušková,M.,面板数据中的变化点检测,J.Time Ser。分析33(2012)631-648·Zbl 1282.62181号
[24] Huang,Y.和Li,R.,最优方向高维均值的投影检验,手稿(2015)。
[25] Jiang,W.,Wang,K.和Tsung,F.,基于变量选择的过程监测和诊断多元EWMA图,J.Qual。Technol.44(2012)209-230。
[26] Jones,L.A.、Champ,C.W.和Rigdon,S.E.,《带估计参数的指数加权移动平均图的性能》,《技术计量学》43(2001)156-167。
[27] Li,W.,Pu,X.,Tsung,F.和Xiang,D.,基于前向变量选择的稳健自启动空间秩多元EWMA图,计算。工业工程103(2017)116-130。
[28] Liang,W.,Xiang,D.和Pu,X.,检测稀疏均值漂移的稳健多元ewma控制图,J.Qual。Technol.48(2016)265-265。
[29] Lopes,M.E.、Jacob,L.和Wainwright,M.J.,《使用随机投影进行高维更强大的双样本测试》,载于《神经信息处理系统进展》(2011),第1206-1214页。
[30] Lowry,C.A.、Woodall,W.H.、Champ,C.W.和Rigdon,S.E.,《多元指数加权移动平均控制图》,《技术计量学》34(1992)46-53·Zbl 0761.62144号
[31] Lucas,J.M.和Saccucci,M.S.,指数加权移动平均控制方案的特性和增强,Technometrics32(1990)1-29。
[32] McCulloh,I.A.、Johnson,A.N.和Carley,K.M.,《识别周期的社交网络谱分析》,J.Math。《社会学》.36(2012)80-96。
[33] Mei,Y.,《监控大量数据流的高效可扩展方案》,Biometrika97(2010)419-433·Zbl 1406.62088号
[34] Ro,K.,Zou,C.,Wang,Z.和Yin,G.,高维数据的离群检测,Biometrika102(2015)589-599·Zbl 1452.62378号
[35] Runger,G.C.和Prabhu,S.S.,多元指数加权移动平均线控制图的马尔可夫链模型,J.Amer。统计师。协会91(1996)1701-1706·Zbl 0881.62105号
[36] Spiegelhalter,D.、Sherlaw-Johnson,C.、Bardsley,M.、Blunt,I.、Wood,C.和Grigg,O.,《医疗保健监管的统计方法:评级、筛查和监督》,J.R.Stat.Soc.Ser。A175(2012)1-47。
[37] Srivastava,M.S.和Du,M.,《观测值少于维数的平均向量检验》,J.Multivar。分析99(2008)386-402·Zbl 1148.62042号
[38] Stoumbos,Z.G.、Marion,R.、Reynolds,J.、Ryan,T.P.和Woodall,W.H.,《进入21世纪的统计过程控制状况》,J.Amer。统计师。协会95(2000)992-998。
[39] Sun,W.G.,Reich,B.J.,Cai,T.,Guindani,M.和Schwartzman,A.,大规模空间多重测试中的错误发现控制,J.R.Stat.Soc.Seri。B77(2015)59-83·Zbl 1414.62043号
[40] Tartakovsky,A.G.、Rozovskii,B.L.、Blazek,R.B.和Kim,H.,《通过顺序转换点方法检测信息系统中的入侵》(含讨论),《统计方法》第3卷(2006年)252-340页·Zbl 1248.94032号
[41] Tsung,F.,Zhou,Z.H.和Jiang,W.,《将批量生产技术应用于不完整客户信息的欺诈检测》,IIE Trans.39(2007)671-680。
[42] Veeravalli,V.V.,《分散式最快变化检测》,IEEE T.Inform。Theory47(2001)1657-1665·Zbl 1017.94516号
[43] Wang,L.,Peng,B.和Li,R.,均值向量的高维非参数多元检验,J.Amer。统计师。协会110(512)(2015)1658-1669·Zbl 1373.62280号
[44] Woodall,W.H.和Montgomery,D.C.,统计过程监测理论和应用的一些当前方向,J.Qual。Technol.46(2014)79-94。
[45] Xie,Y.和Siegmund,D.,《顺序多传感器变化点检测》,《统计年鉴》41(2013)670-692·Zbl 1267.62084号
[46] C.Xu,Y.Q.Zhang和R.Li,《关于大数据分布式核回归的可行性》,预印本(2015),arXiv:1505.00869。
[47] Zhong,P.-S.,Chen,S.X.和Xu,M.,《在稀疏性和列式依赖下,高维平均数的测试替代了更高的批评》,《Ann.Statist.41》(2013)2820-2851·Zbl 1294.62128号
[48] 邹,C.和邱,P.,使用LASSO,J.Amer的多元统计过程控制。统计师。Assoc.104(2009)1586-1596·Zbl 1205.62214号
[49] Zou,C.,Wang,Z.,Jiang,W.和Zi,X.,一种高效的高维数据流在线监测方法,Technometrics57(2015)374-387。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。