×

通过采样分割一致地选择更改点的数量。 (英语) Zbl 1442.62126号

本文提出了一个统一的框架,用于在统一的框架下选择多个变化点模型中的变化点数量。一个名为CPOSS的通用过程选择使平方预测误差最小的变化点的数量,该过程用于测量指定模型对新样本的拟合度。根据时间顺序的奇偶性,将样本分为一个训练集和一个验证集,从而使用针对变点问题定制的顺序保留样本分割进行了两次交叉验证。建立了渐近一致性,确保得到的估计变化点数量等于真实的变化点数量,在温和条件下概率接近1。在大量模拟示例上,与通过修改损失函数和相关惩罚项获得的BIC或其变体相比,所提出的选择策略的有效性在多种数值实验中得到了证明。模型考虑了位置、规模、分布和回归关系等不同方面的变化。数据可以是单变量、多元或线性模型结构,可以是独立的,也可以是相关的。还提供了两个实际数据示例。首先,CPOSS用于检测英国富时100指数每日收益的方差变化。第二种方法考虑了人类染色体序列中G+C组成比例的变化。

MSC公司:

62甲12 多元分析中的估计
62G10型 非参数假设检验
90立方厘米 动态编程
62页第10页 统计学在生物学和医学中的应用;元分析
62第20页 统计学在经济学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arlot,S.和Celisse,A.(2011年)。通过交叉验证分割异方差数据的平均值。统计计算。21 613-632. ·Zbl 1221.62061号 ·doi:10.1007/s11222-010-9196-x
[2] Aue,A.和Horváth,L.(2013)。时间序列中的结构性中断。J.时间序列分析。34 1-16. ·Zbl 1274.62553号
[3] Auger,I.E.和Lawrence,C.E.(1989)。段邻域的最佳识别算法。牛市。数学。生物.51 39-54·Zbl 0658.92010号 ·doi:10.1016/S0092-8240(89)80047-3
[4] Bai,J.(1998)。具有最小绝对偏差的多变量回归估计。J.统计。计划。推论74 103-134·Zbl 0952.62021号 ·doi:10.1016/S0378-3758(98)00082-2
[5] Bai,Z.、Fujikoshi,Y.和Choi,K.P.(2017)。在高维主成分分析中,AIC和BIC在估计重要成分数量方面的一致性。安。统计师。46 1050-1076. ·Zbl 1395.62119号 ·doi:10.1214/17-AOS1577
[6] Bai,J.和Perron,P.(1998年)。评估和测试具有多重结构变化的线性模型。《计量经济学》66 47-78·Zbl 1056.62523号 ·doi:10.2307/298540
[7] Bai,J.和Perron,P.(2003年)。多种结构变化模型的计算和分析。J.应用。计量经济学18 1-22。
[8] Birgé,L.和Massart,P.(2001)。高斯模型选择。《欧洲数学杂志》。Soc.(JEMS)3 203-268·Zbl 1037.62001
[9] Braun,J.V.、Braun、R.K.和Müller,H.G.(2000)。通过拟似然法进行多变化点拟合,并应用于DNA序列分割。生物特征87 301-314·Zbl 0963.62067号 ·doi:10.1093/biomet/87.2.301
[10] Cao,H.和Wu,W.B.(2015)。变更点估计:从另一个角度看多个测试问题。生物特征102 974-980·兹比尔1390.62138 ·doi:10.1093/biomet/asv031
[11] Chen,J.和Gupta,A.K.(1997年)。使用股票价格应用程序测试和定位差异变化点。J.Amer。统计师。协会92 739-747·Zbl 1090.62565号 ·doi:10.1080/01621459.1997.10474026
[12] Chen,J.和Gupta,A.K.(2012年)。参数统计变化点分析:应用于遗传学、医学和金融,第2版,Birkhäuser/Springer,纽约·Zbl 1273.62016年
[13] Darling,D.A.和Erdös,P.(1956年)。独立随机变量归一化和最大值的极限定理。杜克大学数学。期刊23 143-155·Zbl 0070.13806号
[14] Fryzlewicz,P.(2014)。用于多变化点检测的野生二进制分割。安。统计师。42 2243-2281. ·Zbl 1302.62075号 ·doi:10.1214/14-AOS1245
[15] Hannart,A.和Naveau,P.(2012年)。一种改进的多变点模型贝叶斯信息准则。技术计量54 256-268。
[16] Hao,N.、Niu,Y.S.和Zhang,H.(2013)。通过筛选和排序算法检测多个变化点。统计师。中国23 1553-1572·Zbl 1417.62236号
[17] Harchaoui,Z.和Lévy-Leduc,C.(2010年)。具有总变差惩罚的多个变点估计。J.Amer。统计师。协会105 1480-1493·Zbl 1388.62211号 ·doi:10.198/jasa.2010.tm09181
[18] 霍金斯,D.M.(2001)。将多个转换点模型拟合到数据。计算。统计师。数据分析。37 323-341. ·Zbl 0990.62019号 ·doi:10.1016/S0167-9473(00)00068-2
[19] Haynes,K.、Eckley,I.A.和Fearnhead,P.(2017)。针对一系列惩罚的高效计算变更点检测。J.计算。图表。统计师。26 134-143. ·Zbl 1505.62181号 ·doi:10.1007/s11222-016-9687-5
[20] Haynes,K.、Fearnhead,P.和Eckley,I.A.(2017年)。一种用于变化点检测的计算效率高的非参数方法。统计计算。27 1293-1305. ·Zbl 1505.62181号 ·doi:10.1007/s11222-016-9687-5
[21] Horváth,L.(1993)。用于测试正态观测参数变化的最大似然方法。安。统计师。21 671-680之间·兹比尔0778.62016
[22] Jeng,X.J.、Cai,T.T.和Li,H.(2010)。最优稀疏段识别及其在拷贝数变化分析中的应用。J.Amer。统计师。协会105 1156-1166·Zbl 1390.62170号 ·doi:10.1198/jasa.2010.tm10083
[23] Killick,R.、Fearnhead,P.和Eckley,I.A.(2012年)。具有线性计算成本的最佳变化点检测。J.Amer。统计师。协会107 1590-1598·Zbl 1258.62091号 ·doi:10.1080/01621459.2012.737745
[24] Künsch,H.R.(1989)。一般静态观测的折刀和引导。安。统计师。17 1217-1241. ·Zbl 0684.62035号
[25] Lavielle,M.(2005)。对转换点问题使用惩罚对比度。信号处理。85 1501-1510. ·Zbl 1160.94341号 ·doi:10.1016/j.sigpro.2005.01.012
[26] Lee,C.-B.(1996)。非参数多变点估计量。统计师。普罗巴伯。莱特。27 295-304. ·Zbl 0847.62022号 ·doi:10.1016/0167-7152(95)00089-5
[27] Loader,C.R.(1996)。使用非参数回归进行变点估计。安。统计师。24 1667-1678. ·Zbl 0867.62033号 ·doi:10.1214/aos/1032298290
[28] Matteson,D.S.和James,N.A.(2014年)。多元数据多变化点分析的非参数方法。J.Amer。统计师。协会109 334-345·Zbl 1367.62260号 ·doi:10.1080/01621459.2013.849605
[29] 穆勒,H.-G.和斯塔特穆勒,U.(1999)。不连续回归与平滑回归。安。统计师。27 299-337. ·Zbl 0954.62052号
[30] Nishii,R.(1984)。多元回归中变量选择准则的渐近性质。安。统计师。12 758-765·兹伯利0544.62063 ·doi:10.1214操作系统/1176346522
[31] Niu,Y.S.、Hao,N.和Zhang,H.(2016)。多切换点检测:选择性概述。统计师。科学。31 611-623. ·兹比尔1442.62170 ·doi:10.1214/16-STS587
[32] Niu,Y.S.和Zhang,H.(2012)。检测DNA拷贝数变化的筛选和排序算法。附录申请。《美国联邦法律》第6卷第1306-1326页·Zbl 1401.92145号 ·doi:10.1214/12-AOAS539
[33] Schwarz,G.(1978年)。估算模型的维度。安。统计师。6 461-464. ·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[34] Shao,J.(1993)。通过交叉验证选择线性模型。J.Amer。统计师。协会88 486-494·Zbl 0773.62051号 ·doi:10.1080/01621459.1993.10476299
[35] Shao,J.(1997)。线性模型选择的渐近理论。统计师。Sinica 7 221-264号。带着作者的评论和反驳·Zbl 1003.62527号
[36] Venkatraman,E.S.(1992年)。一致性会导致多个转换点问题。斯坦福大学博士论文,ProQuest LLC,密歇根州安阿伯。
[37] Wang,G.,Zou,C.和Yin,G.(2018年)。具有大量类别的多项式数据中的变点检测。安。统计师。46 2020-2044. ·Zbl 1408.62110号 ·doi:10.1214/17-AOS1610
[38] Wu,W.B.和Zhao,Z.(2007)。时间序列趋势推断。J.R.统计社会服务。B.统计方法。69 391-410. ·Zbl 07555358号
[39] Yang,Y.(2005)。能否分享AIC和BIC的优势?模型识别和回归估计之间的冲突。Biometrika 92 937-950·Zbl 1151.62301号 ·doi:10.1093/biomet/92.4.937
[40] Yang,Y.(2007)。用于比较回归过程的交叉验证的一致性。安。统计师。35 2450-2473. ·Zbl 1129.62039号 ·doi:10.1214/009053607000000514
[41] 姚明(1988)。通过Schwarz标准估计转换点的数量。统计师。普罗巴伯。莱特。6 181-189. ·Zbl 0642.62016号 ·doi:10.1016/0167-7152(88)90118-6
[42] Yao,Y.C.和Au,S.T.(1989)。阶跃函数的最小二乘估计。Sankhyá,Ser。甲51 370-381·Zbl 0711.62031号
[43] 张平(1993)。通过多重交叉验证进行模型选择。安。统计师。21 299-313. ·Zbl 0770.62053号 ·doi:10.1214/aos/1176349027
[44] Zhang,N.R.和Siegmund,D.O.(2007年)。一种改进的贝叶斯信息准则,用于比较基因组杂交数据的分析。生物统计学63 22-32309·Zbl 1206.62174号 ·文件编号:10.1111/j.1541-0420.2006.00662.x
[45] 邹,C.,王,G.和李,R.(2020)。补充“通过样本分割一致选择变更点数量”https://doi.org/10.1214/19-AOS1814SUPP。
[46] Zou,C.、Yin,G.、Feng,L.和Wang,Z.(2014)。多变点问题的非参数极大似然方法。安。统计师。42 970-1002. ·Zbl 1305.62158号 ·doi:10.1214/14-AOS1210
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。