×

高维时间序列中的顺序变化点检测。 (英语) Zbl 1493.62524号

摘要:近年来,高维数据中的变化点检测引起了人们的极大兴趣。大多数文献要么设计了用于回顾性分析的方法,其中当统计推断开始时,整个样本已经可用,要么考虑在线检测方案来控制直到误报的平均时间。本文从不同的角度为在线场景开发了监控方案,其中高维数据连续到达,目标是尽可能快地检测变化,同时控制虚警I类错误的概率。我们开发了一种序列程序,能够检测连续观测的具有空间和时间相关性的高维时间序列的平均向量的变化。在样本量和维数都趋于无穷大的情况下,分析了该方法的统计特性。在这种情况下,可以看出,新的监测方案在无变化的零假设下具有渐近水平α,并且在高维平均向量的至少一个分量发生变化的情况下是一致的。该方法基于一种新型的一维数据监控方案,该方案通常比通常使用的CUSUM和Page-CUSUM方法更强大,并且通过最大统计量聚合组件级统计信息。为了分析我们的监测方案的渐近性质,我们证明了给定区间上布朗运动的范围在Gumbel分布的吸引域内,这是极值理论的独立兴趣的结果。通过仿真研究和数据实例分析,说明了新方法的有限样本特性。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
6220国集团 非参数推理的渐近性质
62小时15分 多元分析中的假设检验
60克70 极值理论;极值随机过程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Anatolyev,S.和Kosenok,G.(2018年)。均匀分布尺寸的顺序测试。时间序列计量经济学杂志,10(2)·Zbl 1499.62280号
[2] Andrews,D.(1991)。异方差和自相关一致协方差矩阵估计。计量经济学, 59(3):817-858. ·Zbl 0732.62052号
[3] Arratia,R.、Goldstein,L.和Gordon,L.(1989)。两个矩足以用于泊松近似:Chen-Stein方法。概率年鉴, 17(1):9-25. ·Zbl 0675.60017号
[4] Aue,A.、Hörmann,S.、Horváth,L.、Hušková,M.和Steinebach,J.G.(2012)。高频投资组合贝塔稳定性的序贯测试。计量经济学理论, 28(4):804-837. ·Zbl 1245.91089号
[5] Aue,A.和Horváth,L.(2004)。连续检测变化的延迟时间。统计与概率信件, 67(3):221-231. ·Zbl 1059.62085号
[6] Aue,A.、Horváth,L.、Hušková,M.和Kokoszka,P.(2006年)。线性模型中的变化点监测。计量经济学杂志, 9(3):373-403. ·Zbl 1106.62067号
[7] Avanesov,V.和Buzun,N.(2018年)。高维协方差结构中的变点检测。电子统计杂志, 12(2):3254-3294. ·Zbl 1454.62252号
[8] Berkes,I.、Liu,W.和Wu,W.B.(2014)。相关性下的Komlós-Major-Tusnády近似。概率年鉴, 42(2):794-817. ·Zbl 1308.60037号
[9] Billingsley,P.(1999)。概率测度的收敛性《概率统计威利级数》。John Wiley&Sons,Inc.,纽约,第二版·Zbl 0944.60003号
[10] Borodin,A.和Salminen,P.(1996年)。布朗运动手册-事实和公式概率及其应用。Birkhäuser,巴塞尔·兹比尔0859.60001
[11] Chen,Y.、Wang,T.和Samworth,R.J.(2020年)。高维、多尺度在线变化点检测。arXiv电子打印arXiv:2003.03668v1。
[12] Chen,Z.和Tian,Z.(2010)。线性模型中变化点监测的改进程序。模拟中的数学和计算机, 81(1):62-75. ·Zbl 1201.62073号
[13] Chernozhukov,V.、Chetverikov,D.和Kato,K.(2013年)。高维随机向量和最大值的高斯近似和乘数引导。统计年鉴, 41(6):2786-2819. ·Zbl 1292.62030
[14] Chernozhukov,V.、Chetverikov,D.、Kato,K.和Koike,Y.(2019年)。改进了高维中心极限定理和bootstrap近似。arXiv电子打印arXiv:1912.10529版本1。
[15] Cho,H.和Fryzlewicz,P.(2015)。基于稀疏二进制分割的高维时间序列多变点检测。英国皇家统计学会杂志:B辑(统计方法), 77(2):475-507. ·Zbl 1414.62356号
[16] Chocola,O.、Hušková,M.、Prásková,Z.和Steinebach,J.G.(2013)。对资本资产定价组合贝塔进行稳健监控。多元分析杂志, 115:374-395. ·Zbl 1271.62057号
[17] Chu,C.-S.J.、Stinchcombe,M.和White,H.(1996)。监测结构变化。计量经济学, 64(5):1045-1065. ·Zbl 0856.90027号
[18] Chu,L.和Chen,H.(2018)。高维和非欧几里德数据的顺序变点检测。arXiv电子打印arXiv:1810.05973 v1。
[19] Ciuperca,G.(2013)。非线性模型中变化点顺序检测的两个测试。统计规划与推断杂志,143(10):1719-1743·Zbl 1432.62272号
[20] de Haan,L.和Ferreira,A.(2006年)。极值理论简介《Springer运筹学与金融工程系列》,Springer Science+Business Media,纽约·Zbl 1101.62002号
[21] Dette,H.、Bornkamp,B.和Bretz,F.(2013)。关于两阶段响应自适应设计的效率。医学统计学, 32(10):1646-1660.
[22] Dette,H.和Gösmann,J.(2018)。高维时间序列中的相关变化点。电子统计杂志, 12(2):2578-2636. ·Zbl 1403.62158号
[23] Dette,H.和Gösmann,J.(2019年)。一种用于一般参数序列变化点检测的似然比方法。美国统计协会杂志。预打印可从以下网址获得:https://doi.org/10.1080/01621459.2019.1630562。 ·兹比尔1441.62212
[24] Dette,H.、Pan,G.M.和Yang,Q.(2018)。估计高维协方差矩阵序列中的变化点。arXiv电子打印arXiv:1807.10797v1。
[25] El Machkouri,M.、Volný,D.和Wu,W.B.(2013)。平稳随机场的中心极限定理。随机过程及其应用, 123(1):1-14. ·Zbl 1308.60025号
[26] Embrechts,P.、Klüppelberg,C.和Mikosch,T.(1997)。保险和金融极端事件建模,第33卷,共33卷数学应用(纽约)柏林施普林格·Zbl 0873.62116号
[27] Enikeeva,F.和Harchaoui,Z.(2019年)。稀疏替代下的高维变点检测。统计年鉴, 47(4):2051-2079. ·Zbl 1427.62036号
[28] Fan,J.、Liao,Y.和Yao,J.(2015)。高维横断面测试中的功率增强。计量经济学, 83(4):1497-1541. ·Zbl 1410.62201号
[29] 费勒,W.(1951年)。独立随机变量和范围的渐近分布。数理统计年报, 22(3):427-432. ·Zbl 0043.34201号
[30] Fremdt,S.(2014)。Page顺序过程中延迟时间的渐近分布。统计规划与推断杂志, 145:74-91. ·Zbl 1432.62273号
[31] Fremdt,S.(2015)。时间序列回归中用于变化点检测的Page顺序过程。统计, 49(1):128-155. ·Zbl 1395.62267号
[32] Gösmann,J.、Kley,T.和Dette,H.(2020年)。一种新的开放式顺序变化点监测方法。出现在:时间序列分析杂志。预打印可在https://doi.org/10.1111/jtsa.12555。 ·兹比尔1468.62338
[33] Hawkins,D.M.、Qiu,P.和Kang,C.W.(2003)。统计过程控制的变更点模型。质量技术杂志, 35(4):355-366.
[34] Hinkley,D.V.(1971)。从累积和测试中推断出变化点。生物特征, 58(3):509-523. ·Zbl 0254.62019号
[35] Hoga,Y.(2017)。监测多元时间序列。多元分析杂志, 155:105-121. ·Zbl 1359.62369号
[36] Horváth,L.、Hušková,M.、Kokoszka,P.和Steinebach,J.(2004)。监测线性模型的变化。统计规划与推断杂志, 126(1):225-251. ·Zbl 1075.62054号
[37] Hušková,M.和Kirch,C.(2012)。线性回归的自举序列变点测试。梅特里卡,75(5):673-708·Zbl 1362.62161号
[38] 胡什科娃,M.和库布科娃,A.(2005)。监测线性模型中的跳跃变化。统计研究杂志, 39(2):51-70.
[39] 姜涛(2004)。样本相关矩阵最大项的渐近分布。应用概率年鉴, 14(2):865-880. ·Zbl 1047.60014号
[40] Jirak,M.(2015年a)。补充:高维均匀变化点测试。统计年鉴, 43(6):2451-2483. 附录可从以下网址获得:https://doi.org/10.1214/15-AOS1347SUPP。 ·Zbl 1327.62467号
[41] Jirak,M.(2015年b)。高维均匀变化点测试。统计年鉴,43(6):2451-2483·Zbl 1327.62467号
[42] Karatzas,I.和Shreve,S.(1991年)。布朗运动与随机微积分,第113卷,共页数学研究生课程Springer-Verlag,纽约,第二版·Zbl 0734.60060号
[43] Kaul,A.、Jandhyala,V.K.和Fotopoulos,S.B.(2019年)。一种无网格搜索的高维变点回归模型的高效两步算法。J.马赫。学习。物件。,20:第111、40号论文·Zbl 1434.62151号
[44] Kirch,C.(2008)。引导顺序切换点测试。顺序分析, 27(3):330-349. ·Zbl 1145.62060号
[45] Kirch,C.和Kamgaing,J.T.(2015)。在监测时间序列变化点时使用估计函数。统计规划与推断杂志, 161:25-49. ·Zbl 1311.62122号
[46] Kirch,C.和Stoehr,C.(2019年)。基于U统计的顺序变化点测试。arXiv电子打印arXiv:1912.08580v1。
[47] Kirch,C.和Weber,S.(2018年)。基于估计函数修改了顺序变化点程序。电子统计杂志, 12(1):1579-1613. ·Zbl 1392.62241号
[48] Kock,A.B.和Preinerstorfer,D.(2019年)。高维测试问题的威力。计量经济学, 87(3):1055-1069. ·Zbl 1420.62253号
[49] Lai,T.L.(2001)。序贯分析:一些经典问题和新挑战。中国统计局, 11(2):303-351. ·Zbl 1037.62081号
[50] Lévy-Leduc,C.和Roueff,F.(2009年)。高维网络流量数据中变化点的检测和定位。应用统计年鉴,3(2):637-662·兹比尔1166.62094
[51] Liu,W.,Xiao,H.和Wu,W.B.(2013)。相关性下的概率和力矩不等式。中国统计局, 23(3):1257-1272. ·兹布尔06202706
[52] Mei,Y.(2008)。错误报警的平均运行长度是否始终是一个信息标准?顺序分析, 27(4):354-376. ·Zbl 1149.62070号
[53] Mei,Y.(2010)。用于监控大量数据流的高效可扩展方案。生物特征, 97(2):419-433. ·Zbl 1406.62088号
[54] Moustakides,G.V.(1986年)。检测分布变化的最佳停止时间。统计年鉴, 14(4):1379-1387. ·Zbl 0612.62116号
[55] Nikiforov,I.(1987)。随机系统中变化的顺序检测。IFAC会议记录卷, 20(2):321-327.
[56] Otto,S.和Breitung,J.(2019)。用于测试和监测结构变化的向后CUSUM。arXiv电子打印arXiv:2003.02682版本。
[57] 佩奇·E.S.(1954)。连续检查计划。生物特征, 41(1/2):100-115. ·Zbl 0056.38002号
[58] 佩奇·E.S.(1955)。带有警告线的控制图。生物特征, 42(1/2):243-257. ·Zbl 0067.37204号
[59] Ross,G.J.(2014)。存在未知参数时的顺序变化检测。统计与计算, 24(6):1017-1030. ·Zbl 1332.62269号
[60] Schröter,K.、Mühr,B.、Elmer,F.、Kunz-Plapp,T.和Trieselmann,W.(2013)。2013年6月中欧洪水-聚焦德国。CEDIM法医灾难分析小组(美国食品药品监督管理局). https://www.cedim.kit.edu/2850.php。
[61] Serfling,R.J.(2009)。数理统计的逼近定理。概率统计威利级数。John Wiley&Sons,Inc.,纽约。
[62] Sharipov,O.、Tewes,J.和Wendler,M.(2016)。希尔伯特空间中的顺序块引导及其在变点分析中的应用。加拿大统计杂志, 44(3):300-322. ·Zbl 1357.62187号
[63] Soh,Y.S.和Chandrasekaran,V.(2017)。高维变点估计:将滤波与凸优化相结合。应用和计算谐波分析, 43(1):122-147. ·Zbl 1366.62182号
[64] Steland,A.(2006年)。AR(1)系列Dickey-Fuller控制图的引导视图。奥地利统计杂志, 35:339-346.
[65] Tartakovsky,A.、Nikiforov,I.V.和Basseville,M.(2014)。序列分析:假设检验和变点检测,第136卷,共页查普曼和霍尔/CRC统计学与应用概率专著查普曼和霍尔/CRC、泰勒和弗朗西斯集团·Zbl 1341.62026号
[66] Tartakovsky,A.G.、Rozovskii,B.L.、Blazek,R.B.和Hongjoong Kim(2006年)。一种通过自适应序列和批序列变化点检测方法检测计算机网络中入侵的新方法。IEEE信号处理汇刊, 54(9):3372-3382. ·Zbl 1373.68144号
[67] van der Vaart,A.W.(1998)。渐近统计剑桥统计与概率数学系列。剑桥大学出版社,剑桥·Zbl 0910.62001号
[68] Wald,A.(1945年)。统计假设的顺序检验。数理统计年报,16(2):117-186·Zbl 0060.30207号
[69] Wang,D.、Yu,Y.和Rinaldo,A.(2017)。高维最优协方差变化点定位。arXiv电子打印arXiv:1712.09912第1版。
[70] Wang,D.,Zhao,Z.,Lin,K.Z.和Willett,R.(2021)。回归设置中统计和计算效率高的变化点定位。J.马赫。学习。物件。,22:论文编号[248],46·Zbl 07626763号
[71] Wang,R.和Shao,X.(2020)。确定高维数据中断的时间。arXiv电子打印arXiv:2002.04115v1。
[72] Wang,R.、Volgushev,S.和Shao,X.(2019)。高维数据中变化点的推断。arXiv电子打印arXiv:1905.08446v1·Zbl 1486.62246号
[73] Wang,T.和Samworth,R.J.(2018年)。基于稀疏投影的高维变点估计。英国皇家统计学会杂志:B辑(统计方法), 80(1):57-83. ·兹比尔1439.62199
[74] Wied,D.和Galeano,P.(2013年)。监测随机变量序列中的相关性变化。统计规划与推断杂志, 143(1):186-196. ·Zbl 1251.62025号
[75] Woodall,W.H.和Montgomery,D.C.(1999)。统计过程控制的研究问题和思路。质量技术杂志, 31(4):376-386.
[76] Wu,W.B.(2005)。非线性系统理论:从另一个角度看相关性。美国国家科学院院刊, 102(40):14150-14154. ·Zbl 1135.62075号
[77] Wu,W.B.和Zhou,Z.(2011)。非平稳多重时间序列的高斯近似。中国统计局, 21(3):1397-1413. ·兹比尔1251.60029
[78] Xie,Y.和Siegmund,D.(2013)。顺序多传感器切换点检测。统计年鉴, 41(2):670-692. ·Zbl 1267.62084号
[79] Yu,Y.、Padilla,O.H.M.、Wang,D.和Rinaldo,A.(2020)。关于在线变化点检测的注释。arXiv电子打印arXiv:2006.03283v1。
[80] Zeileis,A.(2004)。使用HC和HAC协方差矩阵估值器进行经济计量计算。统计软件杂志,11(10):1-17。
[81] Zhang,X.和Cheng,G.(2018)。物理依赖下高维向量的高斯近似。伯努利,24(4A):2640-2675·Zbl 1419.62257号
[82] 邹,C.、王,Z.、子,X.和江,W.(2015)。一种高效的高维数据流在线监测方法。技术计量学, 57(3):374-387.
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。