×

Huber污染模型下的稳健协方差和散布矩阵估计。 (英语) Zbl 1408.62104号

协方差矩阵估计是统计学中最重要的问题之一。为了适应现代数据集的复杂性,需要有一种估计程序,它不仅可以包含协方差矩阵的结构假设,而且对来自任意来源的离群值也具有鲁棒性。本文定义了一个新的概念,称为矩阵深度,然后通过最大化经验深度函数,提出了一种稳健的协方差矩阵估计。所提出的估计器在P.J.Huber先生《数学年鉴》第35卷,第73–101页(1964年;Zbl 0136.39805号); 同上36,1753-1758(1965年;Zbl 0137.12702号)](varepsilon)-污染模型,用于估计具有各种结构的协方差/散射矩阵,包括带性和稀疏性。

MSC公司:

62甲12 多元分析中的估计
62C20个 统计决策理论中的Minimax过程
62层35 鲁棒性和自适应程序(参数推断)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bickel,P.J.和Levina,E.(2008)。通过阈值进行协方差正则化。统计年鉴36 2577–2604·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[2] Bickel,P.J.和Levina,E.(2008)。大协方差矩阵的正则化估计。统计年鉴36 199-227·Zbl 1132.62040号 ·doi:10.1214/009053607000000758
[3] Birnbaum,A.、Johnstone,I.M.、Nadler,B.和Paul,D.(2013)。含噪声高维数据的稀疏PCA的极小极大界。统计年鉴41 1055–1084·Zbl 1292.62071号 ·doi:10.1214/12-AOS1014
[4] Buja,A.(1986年)。关于Huber–Strassen定理。普罗巴伯。理论相关领域73 149–152·Zbl 0578.62040号 ·doi:10.1007/BF01845998
[5] Cai,T.T.,Ma,Z.和Wu,Y.(2013)。稀疏主成分分析:最优速率和自适应估计。统计年鉴41 3074–3110·Zbl 1288.62099号 ·doi:10.1214/13-AOS1178
[6] Cai,T.T.,Ma,Z.和Wu,Y.(2015)。稀疏峰值协方差矩阵的最优估计和秩检测。普罗巴伯。理论相关领域161 781–815·Zbl 1314.62130号 ·doi:10.1007/s00440-014-0562-z
[7] Cai,T.T.,Ren,Z.和Zhou,H.H.(2013)。估计Toeplitz协方差矩阵的最佳收敛速度。普罗巴伯。理论相关领域156 101–143·Zbl 06176807号 ·doi:10.1007/s00440-012-0422-7
[8] Cai,T.T.,Ren,Z.和Zhou,H.H.(2016)。估计结构化高维协方差和精度矩阵:最佳速率和自适应估计。电子。J.Stat.10 1–59·Zbl 1331.62272号 ·doi:10.1214/15-EJS1081
[9] Cai,T.T.,Zhang,C.-H.和Zhou,H.H.(2010)。协方差矩阵估计的最佳收敛速度。统计年鉴38 2118–2144·Zbl 1202.62073号 ·doi:10.1214/09-AOS752
[10] Cai,T.T.和Zhou,H.H.(2012)。稀疏协方差矩阵估计的最佳收敛速度。统计年鉴40 2389–2420·Zbl 1373.62247号 ·doi:10.1214/12-AOS998
[11] Chen,M.、Gao,C.和Ren,Z.(2018)。补充“Huber污染模型下的稳健协方差和散布矩阵估计”。DOI:10.1214/17-AOS1607SUPP。
[12] Davidson,K.R.和Szarek,S.J.(2001)。局部算子理论、随机矩阵和Banach空间。巴拿赫空间几何手册131·Zbl 1067.46008号
[13] Davis,C.和Kahan,W.M.(1970年)。特征向量的扰动旋转。三、 SIAM J.数字。分析7 1–46·Zbl 0198.47201号 ·doi:10.1137/0707001
[14] Donoho,D.和Huber,P.J.(1983年)。击穿点的概念。在《埃里希·莱曼的节日》中。157–184之间。加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 0523.62032号
[15] Donoho,D.L.(1982)。多元位置估计的分解性质。波士顿哈佛大学技术报告。可在http://www-stat.stanford.edu/donoho/Reports/Oldies/BPMLE.pdf。
[16] Donoho,D.L.(1994)。统计估计和最佳回收率。《统计年鉴》22 238–270·Zbl 0805.62014号 ·doi:10.1214/aos/1176325367
[17] Donoho,D.L.和Gasko,M.(1992年)。基于半空间深度和投影边距的位置估计的分解特性。《统计年鉴》,1803-1827年·Zbl 0776.62031号 ·doi:10.1214/aos/1176348890
[18] Donoho,D.L.和Liu,R.C.(1991)。几何收敛速度,III.Ann.Statist.19 668–701·Zbl 0754.62029号 ·doi:10.1214/aos/1176348115
[19] Donoho,D.L.和Montanari,A.(2015)。Huber(M)-估计的方差分解:(n/p→M∈(1,∞))。预印本。可在arXiv:153.02106购买。
[20] Dudley,R.M.(1978)。经验测度的中心极限定理。Ann.Probab.6 899–929·Zbl 0404.60016号 ·doi:10.1214/aop/1176995384
[21] Dümbgen,L.(1998)。关于高维散射的泰勒M泛函。Ann.Inst.统计。数学50 471–491·Zbl 0912.62061号
[22] Fang,K.-T.,Kotz,S.和Ng,K.W.(1990年)。对称多元及相关分布。查普曼和霍尔,伦敦·Zbl 0699.62048号
[23] Friston,K.J.、Jezzard,P.和Turner,R.(1994年)。功能性MRI时间序列分析。人脑映射153-171。
[24] Hampel,F.R.(1971)。稳健性的一般定性定义。安。数学。Stat.42 1887–1896年·Zbl 0229.62041号 ·doi:10.1214/oms/1177693054
[25] Han,F.和Liu,H.(2013)。跨椭圆分布中潜在广义相关矩阵估计的最佳收敛速度。预印本。可在arXiv:1305.6916购买。
[26] Han,F.和Liu,H.(2014)。高维超椭圆数据的尺度不变稀疏PCA。J.Amer。统计师。协会109 275–287·Zbl 1367.62185号 ·doi:10.1080/01621459.2013.844699
[27] Han,F.和Liu,H.(2017)。ECA:非高斯分布中的高维椭圆分量分析。J.Amer。统计师。关联显示·Zbl 1398.62153号
[28] Huber,P.J.(1964年)。位置参数的稳健估计。安。数学。统计数字35 73–101·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[29] Huber,P.J.(1965年)。概率比测试的稳健版本。安。数学。统计数据36 1753-1758·Zbl 0137.12702号 ·doi:10.1214/aoms/1177699803
[30] Huber,P.J.和Strassen,V.(1973)。容量的Minimax检验和Neyman–Pearson引理。统计年鉴。1 251–263·Zbl 0259.62008年 ·doi:10.1214/aos/1176342363
[31] Johnstone,I.M.和Lu,A.Y.(2009年)。关于高维主成分分析的一致性和稀疏性。J.Amer。统计师。协会104 682–693·Zbl 1388.62174号 ·doi:10.1198/jasa.2009.0121
[32] Lam,C.和Fan,J.(2009年)。大协方差矩阵估计中的稀疏性和收敛速度。Ann.Statist.37 4254–4278·Zbl 1191.62101号 ·doi:10.1214/09-AOS720
[33] 刘瑞云(1990)。基于随机单纯形的数据深度概念。《统计年鉴》18 405–414·Zbl 0701.62063号 ·doi:10.1214/aos/1176347507
[34] Liu,R.Y.、Parelius,J.M.和Singh,K.(1999)。按数据深度进行的多变量分析:描述性统计、图形和推理。《统计年鉴》27 783–858·Zbl 0984.62037号
[35] Ma,Z.(2013)。稀疏主成分分析和迭代阈值。统计年鉴41 772–801·Zbl 1267.62074号 ·doi:10.1214/13-AOS1097
[36] Maronna,R.A.(1976年)。多元位置和散布的稳健M估计。《统计年鉴》,451-67·Zbl 0322.62054号 ·doi:10.1214/aos/1176343347
[37] Mitra,R.和Zhang,C.-H.(2014)。大相关矩阵非参数估计的多元分析。预印。arXiv:1403.6195提供。
[38] Mizera,I.(2002年)。关于深度和深度点:微积分。统计年鉴30 1681–1736·Zbl 1039.62046号 ·doi:10.1214/aos/1043351254
[39] Mizera,I.和Müller,C.H.(2004)。位置刻度深度。J.Amer。统计师。协会99 949–966·Zbl 1071.62032号
[40] Oja,H.(1983年)。多元分布的描述性统计。统计师。普罗巴伯。第1327–332页·Zbl 0517.62051号 ·doi:10.1016/0167-7152(83)90054-8
[41] Rousseeuw,P.J.和Hubert,M.(1999)。回归深度。J.Amer。统计师。协会94 388–402·Zbl 1007.62060号 ·doi:10.1080/01621459.1999.10474129
[42] Serfling,R.(2004)。关于位置和比例深度函数的一些观点。J.Amer。统计师。协会99 970–973。
[43] Tukey,J.W.(1975年)。数学和数据的图像化。国际数学家大会会议记录523–531·Zbl 0347.6202号
[44] Tyler,D.E.(1987)。多元散度的无分布M估计。《统计年鉴》15 234–251·Zbl 0628.62053号 ·doi:10.1214/aos/1176350263
[45] van der Vaart,A.W.(2000)。渐进统计。剑桥大学出版社,剑桥·Zbl 0910.62001号
[46] Vapnik,V.N.和Chervonenkis,A.Y.(1971)。关于事件相对频率与其概率的一致收敛性。理论概率论。申请16 264–280·Zbl 0247.60005号 ·数字对象标识代码:10.1137/1116025
[47] Vardi,Y.和Zhang,C.-H.(2000)。多元中值和相关数据深度。程序。国家。阿卡德。科学。美国97 1423-1426年·Zbl 1054.62067号 ·doi:10.1073/pnas.97.4.1423
[48] Visser,H.和Molenaar,J.(1995)。气候时间序列中的趋势估计和回归分析:结构时间序列模型和卡尔曼滤波的应用。J.气候8 969–979。
[49] Vu,V.Q.和Lei,J.(2013)。高维极小极大稀疏主子空间估计。统计年鉴41 2905–2947·Zbl 1288.62103号 ·数字对象标识代码:10.1214/13-AOS1151
[50] Wegkamp,M.和Zhao,Y.(2016)。半参数椭圆copula相关矩阵的自适应估计。伯努利22 1184–1226·Zbl 1388.62162号 ·doi:10.3150/14-BEJ690
[51] Xue,L.和Zou,H.(2013)。半参数高斯连接函数稀疏相关矩阵的最优估计。统计接口7 201–209·Zbl 1388.62091号 ·doi:10.4310/SI.2014.v7.n2.a5
[52] Xue,L.和Zou,H.(2014)。带状相关矩阵的基于秩的锥形估计。统计师。Sinica24 83–100·Zbl 1285.62062号
[53] 张杰(2002)。Tukey深度函数的一些扩展。《多变量分析杂志》82 134–165·Zbl 1010.62058号
[54] Zuo,Y.和Cui,H.(2005)。深度加权散射估值器。统计年鉴33 381-413·Zbl 1065.62048号 ·doi:10.1214/009053604000000922
[55] Zuo,Y.和Serfling,R.(2000)。统计深度函数的一般概念。统计年鉴28 461–482·Zbl 1106.62334号 ·doi:10.1214/aos/1016218226
[56] Zuo,Y.和Serfling,R.(2000)。基于统计深度函数的多元“分散度”和“更分散”的非参数概念。《多变量分析杂志》75 62–78·Zbl 1011.62054号 ·doi:10.1006/jmva.1999.1894
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。