×

多尺度变化点推断。通过讨论和作者的回复。 (英语) Zbl 1411.62065号

摘要:针对指数族回归中的变点问题,我们引入了一种新的估计量——同时多尺度变点估计量SMUCE。通过最小化多尺度测试可接受区域内的变化点数量,在水平\(\α\)下估计未知阶跃函数。高估变化点真实数量(K)的概率由多尺度检验统计量的渐近零分布控制。进一步,我们导出了低估概率(K)的指数界。通过平衡这些量,将选择(α),从而使正确估计(K)的概率最大化。对于正常情况,所有结果都是非渐近的。基于这些界,我们构造了未知阶跃函数及其变点的(渐近)诚实置信集。同时,我们获得了估计变化点位置的指数界,例如,它产生了对数项的最小最大速率(mathcal{O}(n^{-1}))。最后,即使对于无限数量的变化点,同时多尺度变化点估计器也能实现消失信号的最佳检测率。我们说明了如何使用动态规划技术来有效计算估计量和置信区域。所提出的多尺度方法的性能通过模拟以及在基因工程和光电子能谱学的两个前沿应用中进行了说明。

MSC公司:

2012年12月62日 参数估计量的渐近性质
62层25 参数公差和置信区域
62J02型 一般非线性回归
62-02 与统计有关的研究展览(专著、调查文章)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arias‐Castro,E.、Candès,E.J.和Durand,A.(2011)网络中异常簇的检测。安。统计师。, 39, 278– 304. ·Zbl 1209.62097号
[2] Arlot,S.、Celisse,A.和Harchaoui,Z.(2012)《内核变化点检测》。预打印. ·Zbl 1446.62120号
[3] Bai,J.和Perron,P.(1998)估计和测试具有多重结构变化的线性模型。计量经济学, 66, 47– 78. ·Zbl 1056.62523号
[4] Basseville,M.和Nikiforov,I.V.(1993)《突变检测:理论与应用》。恩格尔伍德悬崖:普伦蒂斯大厅·Zbl 1407.62012年
[5] Benjamini,Y.和Hochberg,Y.(1995)控制错误发现率:一种实用且强大的多重测试方法。J.R.统计。Soc.B公司, 57, 289– 300. ·Zbl 0809.62014号
[6] Bhattacharya,P.K.(1987)独立随机变量分布中变化点的最大似然估计:一般多参数情况。J.Multiv.公司。分析。, 23, 183– 208. ·Zbl 0659.62033号
[7] Birgé,L.和Massart,P.(2001)高斯模型选择。《欧洲数学杂志》。Soc公司。, 3, 203– 268. ·Zbl 1037.62001
[8] Blythe,D.、von Bunau,P.、Meinecke,F.和Muller,K.(2012)使用平稳子空间分析进行变化点检测的特征提取。IEEE传输。诺尔。网络学习。系统。, 23, 631– 643.
[9] Bormann,R.、Gulde,M.、Weismann,A.、Yalunin,S.V.和Ropers,C.(2010)尖端增强强场光电发射。物理学。修订稿。第147601条。
[10] Boysen,L.、Kempe,A.、Liebscher,V.、Munk,A.和Wittich,O.(2009)跳跃惩罚最小二乘估计量的一致性和收敛速度。安。统计师。, 37, 157– 183. ·Zbl 1155.62034号
[11] 布劳恩(Braun,J.)、米勒(Mueller,R.)和米勒(Muller,H.‐G.)。(2000)通过拟似然的多变化点拟合,应用于dna序列分割。生物特征, 87, 301– 314. ·Zbl 0963.62067号
[12] Brodsky,B.E.和Darkhovsky,B.S.(1993),变点问题中的非参数方法。多德雷赫特:克鲁沃·Zbl 1274.62512号
[13] Brown,L.D.,Cai,T.和Zhou,H.H.(2010)指数族中的非参数回归。安。统计师。, 38, 2005– 2046. ·Zbl 1202.62050
[14] Bühlmann,P.和van de Geer,S.(2011)高维数据统计。海德堡:施普林格·Zbl 1273.62015年
[15] Candès,E.和Tao,T.(2007)Dantzig选择器:当第页n个安.统计师。,35, 2313– 2351. ·Zbl 1139.62019号
[16] Carlstein,E.,Müller,H.‐G。和Siegmund,D.(1994)《变化点问题》。海沃德:数理统计研究所·Zbl 0942.00037号
[17] Chan,H.P.和Walther,G.(2013)使用扫描和平均似然比进行检测。预打印arXiv:1107.4344v1. ·Zbl 1257.62096号
[18] Chaudhuri,P.和Marron,J.S.(1999)《SiZer曲线结构勘探》。《美国统计杂志》。助理。, 94, 807– 823. ·Zbl 1072.62556号
[19] Chaudhuri,P.和Marron,J.S.(2000),曲线估计的尺度空间视图。安。统计师。, 28, 408– 428. ·Zbl 1106.62318号
[20] Chen,J.和Gupta,A.K.(2000)参数统计变化点分析。波士顿:Birkhäuser·Zbl 0980.62013.中
[21] Chernoff,H.和Zacks,S.(1964)估算受时间变化影响的正态分布的当前平均值。安。数学。统计人员。, 35, 999– 1018. ·Zbl 0218.62033号
[22] Csörgő,M.和Horváth,L.(1997)《变点分析中的极限定理》。奇切斯特:威利·Zbl 0884.62023号
[23] Davies,L.、Höhenrieder,C.和Krämer,W.(2012)分段常数波动率的递归计算。计算统计。数据分析。, 56, 3623– 3631. ·Zbl 1254.91751号
[24] Davies,P.L.和Kovac,A.(2001)局部极值、运行、字符串和多分辨率(含讨论)。安。统计师。, 29, 1– 65. ·兹比尔1029.62038
[25] Davies,P.L.、Kovac,A.和Meise,M.(2009)非参数回归、置信区间和正则化。安。统计师。, 37, 2597– 2625. ·Zbl 1173.62023号
[26] Demaret,L.、Friedrich,F.、Liebscher,V.和Winkler,G.(2013)复杂性L{}{0}惩罚的M估计:更多维度的一致性。预打印. ·Zbl 1296.41005号
[27] Dette,H.、Munk,A.和Wagner,T.(1998)非参数回归中的方差估计——什么是合理的选择?J.R.统计。Soc.B公司, 60, 751– 764. ·Zbl 0944.62041号
[28] Donoho,D.L.(1988)关于密度泛函的单侧推断。安。统计师。, 16, 1390– 1420. ·兹比尔0665.62040
[29] Donoho,D.L.(1995)《软阈值降噪》。IEEE传输。通知。理论。, 41, 613– 627. ·兹比尔0820.62002
[30] Du,C.和Kou,S.(2012)通过边际似然逐步提取信号。预印本。哈佛大学,剑桥。
[31] Dümbgen,L.(1991)一些非参数变点估计的渐近行为。安。统计师。, 19, 1471– 1495. ·兹比尔0776.62032
[32] Dümbgen,L.和Kovac,A.(2009)通过拉紧弦延伸平滑。电子。J.统计。, 3, 41– 75. ·Zbl 1326.62087号
[33] Dümbgen,L.、Piterbarg,V.I.和Zholud,D.(2006)关于非参数曲线估计的多尺度检验统计量的极限分布。数学。方法。统计人员。, 15, 20– 25.
[34] Dümbgen,L.和Spokoiny,V.G.(2001)定性假设的多尺度测试。安。统计师。, 29, 124– 152. ·Zbl 1029.62070号
[35] Dümbgen,L.和Walther,G.(2008)关于密度的多尺度推断。安。统计师。, 36, 1758– 1785. ·Zbl 1142.62336号
[36] Fearnhead,P.(2006)多个变点问题的精确有效贝叶斯推理。统计师。计算。, 16, 203– 213.
[37] Frick,K.、Marnitz,P.和Munk,A.(2012)成像中的统计多分辨率Dantzig估计:基本概念和算法框架。电子。J.统计。, 6, 231– 268. ·Zbl 1314.62094号
[38] Fridlyand,J.、Snijders,A.M.、Pinkel,D.、Albertson,D.G.和Jain,A.N.(2004)阵列CGH数据分析的隐马尔可夫模型方法。J.Multiv.公司。分析。, 90, 132– 153. ·兹比尔1047.92026
[39] Friedman,J.、Hastie,T.、Höfling,H.和Tibshirani,R.(2007)《路径坐标优化》。附录申请。统计人员。, 1, 302– 332. ·Zbl 1378.90064号
[40] Friedrich,F.、Kempe,A.、Liebscher,V.和Winkler,G.(2008)复杂性惩罚了M‐估计:快速计算。J.计算图表。统计人员。, 17, 201– 224.
[41] Fryzlewicz,P.(2007)非参数函数估计的非平衡Haar技术。《美国统计杂志》。助理。, 102, 1318– 1327. ·Zbl 1333.62014年
[42] Fryzlewicz,P.(2012)多变化点检测的野生二进制分割。技术报告伦敦政治经济学院,伦敦。
[43] Genovese,C.和Wasserman,L.(2004)错误发现控制的随机过程方法。安。统计师。, 32, 1035– 1061. ·Zbl 1092.62065号
[44] Harchaoui,Z.和Lévy‐Leduc,C.(2008)用套索捕捉变化点。高级Neur。通知。处理系统。, 20, 161– 168.
[45] Harchaoui,Z.和Lévy‐Leduc,C.(2010)带总变化惩罚的多变化点估计。《美国统计杂志》。助理。,1051480–1493·Zbl 1388.62211号
[46] Herink,G.、Solli,D.、Gulde,M.和Ropers,C.(2012年)纳米结构的场驱动光电发射可淬灭颤动。自然, 483, 190– 193.
[47] Hinkley,D.V.(1970)关于随机变量序列中变化点的推断。生物特征, 57, 1– 17. ·Zbl 0198.51501号
[48] Hinkley,D.V.和Hinkley,E.A.(1970)关于二项式变量序列中变化点的推断。生物特征, 57, 477– 488. ·Zbl 0214.46603号
[49] Höhenrieder,C.(2008)Nichtparametrische Volatitäts‐und Trendaproximation von Finanzdaten。博士论文杜伊斯堡-埃森大学·Zbl 1187.91001号
[50] Hotz,T.、Schütte,O.M.、Sieling,H.、Polupanow,T.,Diederichsen,U.、Steinem,C.和Munk,A.(2012)通过跳跃分段和统计多分辨率分析实现离子通道记录的理想化。IEEE传输。纳米生物学。, 12, 376– 386.
[51] Hüfner,S.(2003)《光电光谱:原理和应用》。柏林:斯普林格。
[52] Hušková,M.和Antoch,J.(2003)《回归中结构变化的检测》。塔特。数学山。出版物。,26201–215·Zbl 1154.62350号
[53] Inclán,C.和Tiao,G.C.(1994)使用累积平方和回顾性检测方差变化。《美国统计杂志》。助理。, 89, 913– 923. ·Zbl 0825.62678号
[54] James,G.M.和Radchenko,P.(2009)具有收缩调整的通用Dantzig选择器。生物特征, 96, 323– 337. ·Zbl 1163.62054号
[55] Jeng,X.J.,Cai,T.T.和Li,H.(2010)最佳稀疏段识别及其在拷贝数变化分析中的应用。《美国统计杂志》。助理。, 105, 1156– 1166. ·兹比尔1390.62170
[56] Kabluchko,Z.和Munk,A.(2009)关于多维数组标准化随机游动增量最大值的Shao定理。欧洲药典。申请。工业数学。普罗巴伯。统计人员。, 13, 409– 416. ·Zbl 1188.60014号
[57] Kallioniemi,A.、Kallioniema,O.、Sudar,D.、Rutovitz,D.、Gray,J.、Waldman,F.和Pinkel,D.(1992年)用于实体肿瘤分子细胞遗传学分析的比较基因组杂交。科学类,258818–821。
[58] Kander,Z.和Zacks,S.(1966)未知时间点统计分布参数可能变化的测试程序。安。数学。统计人员。, 37, 1196– 1210. ·Zbl 0143.41002号
[59] Khodadadi,A.和Asgharian,M.(2008)《变化点问题和回归:注释书目》预打印44.生物统计学研究档案的收集。
[60] Kiesel,H.、Renz,A.和Hasselbach,F.(2002)自由电子Hanbury Brown‐Twiss反相关的观察。自然, 418, 392– 394.
[61] Killick,R.、Fearnhead,P.和Eckley,I.(2012)用线性计算成本优化变化点检测。《美国统计杂志》。助理。, 107, 1590– 1598. ·兹比尔1258.62091
[62] Kolaczyk,E.D.和Nowak,R.D.(2004)多尺度似然分析和复杂性惩罚估计。安。统计师。, 32, 500– 527. ·Zbl 1048.62036号
[63] Kolaczyk,E.D.和Nowak,R.D.(2005)非参数函数估计的多尺度广义线性模型。生物特征, 92, 119– 133. ·Zbl 1068.62046号
[64] Lai,W.R.、Johnson,M.D.、Kucherlapati,R.和Park,P.J.(2005)《识别阵列cgh数据中放大和删除的算法的比较分析》。生物信息学, 21, 3763– 3770.
[65] Lavielle,M.(2005)使用惩罚对比来解决变化点问题。信号处理,851501–1510·Zbl 1160.94341号
[66] Lavielle,M.和Moulines,E.(2000)时间序列中未知移位数的最小二乘估计。J.时间序列。分析。, 21, 33– 59. ·Zbl 0974.62070号
[67] Lavielle,M.,Teyssière,G.(2007)资产价格波动性多个变化点的自适应检测。《经济学中的长期记忆》(编辑G.Teyssière和A.P.Kirmani),第129-156页。柏林:斯普林格·Zbl 1181.91348号
[68] Lebarbier,E.和Picard,F.(2011年),CGH细分分析。加兹。数学。,编号130,65–70。
[69] Li,K.‐C(李,K.‐C)。(1989)非参数回归的诚实置信区。安。统计师。, 17, 1001– 1008. ·Zbl 0681.62047号
[70] Luong,T.M.、Rozenholc,Y.和Nuel,G.(2012)通过约束隐马尔可夫模型快速估计变化点模型中的后验概率。计算统计。数据分析。,待发布·Zbl 1471.62127号
[71] Mammen,E.和van de Geer,S.(1997)局部自适应回归样条。安。统计师。, 25, 387– 413. ·Zbl 0871.62040号
[72] Meinshausen,N.和Yu,B.(2009)高维数据稀疏表示的Lasso类型恢复。安。统计师。, 37, 246– 270. ·Zbl 1155.62050号
[73] Nemirovski,A.(1985)平滑回归函数的非参数估计。特克尼奇。基伯恩。, 3, 50– 60.
[74] Nielsen,B.O.(1973)指数族与条件作用。奇切斯特:威利·Zbl 0297.62001号
[75] Olshen,A.B.、Venkatraman,E.S.、Lucito,R.和Wigler,M.(2004)用于分析基于阵列的dna拷贝数数据的循环二进制分割。生物统计学, 5, 557– 572. ·Zbl 1155.62478号
[76] Page,E.S.(1955)在未知点发生参数变化的测试。生物特征, 42, 523– 527. ·Zbl 0067.11602号
[77] Rigaill,G.、Lebarbier,E.和Robin,S.(2012)多变化点检测问题的精确后验分布和模型选择标准。统计师。计算。, 22, 917– 929. ·Zbl 1252.62027号
[78] Rigollet,P.和Tsybakov,A.(2012)指数加权稀疏估计。统计师。科学。,即将发布·Zbl 1331.62351号
[79] Rivera,C.和Walther,G.(2012)使用似然比统计对泊松过程强度或密度突变的最佳检测。扫描。J.统计。, 40, 752– 769. ·Zbl 1283.62179号
[80] Ropers,C.、Solli,D.R.、Schulz,C.P.、Lienau,C.和Elsaesser,T.(2007)金属纳米尖端飞秒电子脉冲的局部化多光子发射。物理学。修订稿。,98,第043907条。
[81] Schmidt,R.、Krasselt,C.和von Borczyskowski,C.(2012)具有中等强度水平的单个cdse/zns量子点的基质相关光致发光间歇的变点分析。化学。物理学。, 406, 9– 14.
[82] Schmidt‐Hieber,J.、Munk,A.和Duembgen,L.(2013)反褶积中形状约束的多尺度方法:定性特征的置信度陈述。安。统计师。, 41, 1299– 1328. ·Zbl 1293.62104号
[83] Schwarz,G.(1978)估算模型的维数。安。统计师。, 6, 461– 464. ·Zbl 0379.62005年
[84] Sen,A.和Srivastava,M.S.(1975)关于检测平均值变化的测试。安。统计师。,3,98–108·Zbl 0305.62014号
[85] Siegmund,D.(1986)《越境概率和统计应用》。安。统计师。, 14, 361– 404. ·Zbl 0632.62077号
[86] Siegmund,D.(1988)置信集在变化点问题中的应用。国际统计。版次。, 56, 31– 48. ·Zbl 0684.62028号
[87] Siegmund,D.(2013)变化点:从顺序检测到生物学再到生物。顺序。分析。, 32, 2– 14. ·Zbl 1271.62191号
[88] Siegmund,D.和Venkatraman,E.S.(1995)使用广义似然比统计对变化点进行顺序检测。安。统计师。, 23, 255– 271. ·Zbl 0821.62044号
[89] Siegmund,D.和Yakir,B.(2000)扫描统计的零分布的尾部概率。伯努利, 6, 191– 213. ·Zbl 0976.62048号
[90] Spokoiny,V.(2009)多尺度局部变化点检测与风险价值应用。安。统计师。, 37, 1405– 1436. ·Zbl 1160.62084号
[91] Tibshirani,R.、Saunders,M.、Rosset,S.、Zhu,J.和Knight,K.(2005)通过融合套索实现的稀疏性和流畅性。J.R.统计。Soc.B公司, 67, 91– 108. ·Zbl 1060.62049号
[92] Tibshirani,R.和Wang,P.(2008)使用融合套索对cgh数据进行空间平滑和热点检测。生物统计学, 9, 18– 29. ·Zbl 1274.62886号
[93] Vostrikova,L.J.(1981)多维随机过程中“不一致”的发现。多克。阿卡德。诺克SSSR, 259, 270– 274.
[94] Walther,G.(2010)使用扫描统计优化和快速检测空间簇。安。统计师。, 38, 1010– 1033. ·兹比尔1183.62076
[95] Winkler,G.和Liebscher,V.(2002)不连续信号的平滑。J.Nonparam(非参数)。统计人员。, 14, 203– 222. ·Zbl 1019.62090号
[96] Wittich,O.,Kempe,A.,Winkler,G.和Liebscher,V.(2008)复杂性惩罚最小二乘估计:分析结果。数学。纳克里斯。, 281, 582– 595. ·Zbl 1152.62062号
[97] Worsley,K.J.(1983)二项式概率变化的似然比和累积和检验的幂。生物特征, 70, 455– 464. ·Zbl 0529.62025号
[98] Worsley,K.J.(1986)指数族随机变量序列中的置信区域和变化点测试。生物特征, 73, 91– 104. ·2016年5月89日
[99] Wu,Y.(2005)CUSUM检验后变化点和变化后均值的推断。纽约:斯普林格·Zbl 1067.62082号
[100] Yakir,B.和Pollak,M.(1998)更新理论常数的新表示,出现在大偏差的渐近近似中。附录申请。普罗巴伯。, 8, 749– 774. ·Zbl 0937.60082号
[101] 姚,Y.C。(1988)通过Schwarz标准估计变化点的数量。统计师。普罗巴伯。莱特。, 6, 181– 189. ·Zbl 0642.62016号
[102] 姚,Y.C。和Au,S.T.(1989)阶跃函数的最小二乘估计。Sankhya A公司, 51, 370– 381. ·Zbl 0711.62031号
[103] Zhang,H.、Dantu,R.和Cangussu,J.(2009)基于呼叫详细记录的更改点检测。《情报与安全信息学》,2009年,第55-60页。纽约:电气和电子工程师协会。
[104] Zhang,N.R.和Siegmund,D.O.(2007)一种改进的贝叶斯信息标准,用于比较基因组杂交数据的分析。生物计量学, 63, 22– 32. ·Zbl 1206.62174号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。