×

多元位置和形状的稳健估计。 (英语) Zbl 0900.62281号

摘要:我们描述了稳健估计多元位置和形状的总体策略,以及由此识别的异常值和杠杆点。该策略的部分内容已在之前的一系列论文中进行了描述[D.M.火箭《Ann.Stat.24》,第3期,1327-1345(1996年;Zbl 0862.62049号);D.M.火箭D.L.半月《Neerlandica统计》47、27-42(1993);美国统计学杂志。协会(出版中);D.L.半月D.M.火箭,J.计算。图形统计。2, 69-95 (1993); 《多元数据中异常值的识别》,《美国统计协会期刊》第89期,第888-896页(1994年;Zbl 0825.62485号)]由整体结构首次在这里提出。在描述了该问题的一类算法的一级体系结构之后,我们回顾了有关过程中每个主要步骤的可能策略的可用信息。我们发现有必要的主要步骤如下:(1)将数据划分为可能是维的五倍的组;(2) 对于每个组,搜索组合估计量的最佳可用解决方案,例如最小协方差行列式(MCD)——这些是初步估计;(3) 对于每个初步估计,迭代到为鲁棒性和抗离群值而选择的平滑估计的解;(4)根据鲁棒性准则(如最小体积)在最终迭代中进行选择。使用该算法架构可以对高维(>20)中严重污染的多元数据进行可靠、快速、稳健的估计,即使有大量数据。作者提供了实现该算法的计算机程序。

理学硕士:

62甲12 多元分析中的估计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德鲁斯·D·F。;Bickel,P.J。;汉佩尔,F.R。;胡贝尔,P.J。;罗杰斯,W.H。;Tukey,J.W.,《位置的稳健估计:调查与进展》(1972),普林斯顿大学出版社:普林斯顿大学出版·Zbl 0254.62001号
[2] Atkinson,A.C.,检测多元异常值的钟乳石图和稳健估计,(Morgenthaler,S.;Ronchetti,E.;Stahel,W.,《数据分析和稳健》(1993),Birkhäuser:Birkháuser Basel)·Zbl 0825.62486号
[3] Atkinson,A.C.,《检测多个离群值的快速非常稳健的方法》,J.Amer。统计师。协会,891329-1339(1994)·Zbl 0825.62429号
[4] 阿特金森。;Mulira,H.-M.,用于检测多个异常值的Stalacite图,Statist。计算。,3, 27-35 (1993)
[5] 巴特勒,R.W。;Davies,P.L。;Jhun,M.,最小协方差行列式估计的渐近性,Ann.Statist。,21, 1385-1400 (1993) ·Zbl 0797.62044号
[6] 坎贝尔,N.A.,《多元分析中的稳健程序I:稳健协方差估计》,应用。统计人员。,29, 231-237 (1980) ·Zbl 0471.62047号
[7] 坎贝尔,N.A.,《多元分析中的稳健程序II:稳健规范变量分析》,应用。统计人员。,31, 1-8 (1982) ·Zbl 0497.62035号
[8] Clarke,B.R.,最大似然型方程泛函解的唯一性和Fréchet可微性,Ann.Statist。,11, 1196-1205 (1983) ·Zbl 0541.62023号
[9] Davies,P.L.,多元位置参数和离散矩阵S-估计的渐近行为,Ann.Statist。,15, 1269-1292 (1987) ·Zbl 0645.62057号
[10] 戴维斯,P.L.,卢梭最小体积椭球估计量的渐近性,《统计年鉴》。,20, 1828-1843 (1992) ·Zbl 0764.62046号
[11] Donoho,D.L.,多元位置估计的分解特性,(哈佛大学统计系博士论文(1982))·Zbl 0995.65150号
[12] Grübel,R。;Roke,D.M.,《关于椭圆族仿射等变估计的累积量》,《多元分析杂志》。,35, 203-222 (1990) ·Zbl 0725.62050号
[13] Hadi,A.S.,识别多元数据中的多个离群值,JRSSB,54,761-771(1992)
[14] 汉佩尔,F.R。;Ronchetti,E.M。;Rousseeuw,P.J。;Stahel,W.A.,《稳健统计:基于影响函数的方法》(1986),威利:威利纽约·Zbl 0593.62027号
[15] Hawkins,D.M.,最小体积椭球估计器的可行解算法,计算。统计人员。,95-107(1993年)
[16] Hawkins,D.M.,多元数据中最小协方差行列式估计量的可行解算法,计算。统计师。数据分析。,17, 197-210 (1994) ·Zbl 0937.62595号
[17] 霍金斯博士。;Bradu,D。;Kass,G.V.,使用元素集在多元回归数据中定位几个离群值,技术计量学,26197-208(1984)
[18] Huber,P.J.,《稳健统计》(1981),威利出版社:威利纽约·Zbl 0536.62025号
[19] Kent,J.T。;Tyler,D.E.,《多元位置和离散度的重降M估计》,《统计年鉴》。,19, 2102-2119 (1991) ·兹比尔0763.62030
[20] Lopuhaä,H.P.,关于多元位置和协方差的S-估计和M-估计之间的关系,《统计年鉴》。,17, 1662-1683 (1989) ·Zbl 0702.62031号
[21] Lopuhaä,H.P.,具有高崩溃点的多元位置的高效估计量,Ann.Statist。,20, 398-413 (1992) ·Zbl 0757.62030号
[22] Maronna,R.A.,多元位置和散布的稳健M-估计,《统计年鉴》。,4, 51-67 (1976) ·Zbl 0322.62054号
[23] Roke,D.M.,高维多元位置和形状S-估计的稳健性,Ann.Statist。(1996),出版·Zbl 0862.62049号
[24] Roke,D.M。;伍德拉夫,D.L.,多元位置和形状稳健估计的计算,统计学。Neerlandica,47,27-42(1993)
[25] Roke,D.M。;Woodruff,D.L.,多元数据中异常值的识别,J.Amer。统计师。协会(1996),出版中·Zbl 0882.62049号
[26] Roke,D.M。;伍德拉夫,D.L.,《多元异常值识别》(Proc.26 Symp.on the Interface:Computing Science and Statistics(1995)),(出版中)
[27] Rousseeuw,P.J.,《高崩溃点的多元估计》(Grossmann,W.;Pflug,G.;Vincze,T.;Werz,W.,《数理统计与应用》,第B卷(1985),Reidel:Reidel Dordrecht)·Zbl 0609.62054号
[28] Rousseeuw,P.J。;Leroy,A.M.,《稳健回归和异常值检测》(1987),威利出版社,纽约·Zbl 0711.62030号
[29] Rousseeuw,P.J。;van Zomeren,B.C.,《揭示多元异常值和杠杆点》,J.Amer。统计师。协会,85,633-639(1990)
[30] Rousseeuw,P.J。;van Zomeren,B.C.,《稳健距离:模拟和截止值》(Stahel,W.;Weisberg,S.,《稳健统计和诊断方向》,第二部分(1991),Springer:Springer New York)
[31] Ruppert,D.,《计算回归和多元位置/离散的S-估计量》,J.Compute。图形统计。,1, 253-270 (1992)
[32] Stahel,W.A.,Robuste schätzungen:infinitie optimalität und schätzungen von kovarianzmatrizen,(博士论文(1981年),苏黎世联邦理工学院)·Zbl 0531.62036号
[33] Tyler,D.E.,分散矩阵的稳健性和效率特性,生物特征,70411-420(1983)·兹比尔0536.62042
[34] Tyler,D.E.,关于多元位置和散布的M估计的存在性、唯一性和计算的一些结果,SIAM J.科学统计。计算。,9, 354-362 (1988) ·Zbl 0648.65098号
[35] Tyler,D.E.,《多元位置和散布稳健估计中的一些问题》(Stahel,W.;Weisberg,S.,稳健统计和诊断方向,第二部分(1991),Springer:Springer New York)
[36] 伍德拉夫·D·L。;Roke,D.M.,最小体积椭球体的启发式搜索算法,J.Compute。图形统计。,2, 69-95 (1993)
[37] 伍德拉夫·D·L。;Rocke,D.M.,使用复合估计量对高维中的多变量位置和形状进行可计算的鲁棒估计,J.Amer。统计师。协会,89,888-896(1994)·Zbl 0825.62485号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。