×

多元数据主要非参数离群值标识符的掩蔽和淹没稳健性。 (英语) Zbl 1394.62060号

作者摘要:对于任何离群值检测程序,一个关键问题是对可能的误分类错误、掩蔽(I型)和淹没(II型)的鲁棒性。虽然基于参数化模型的仿真结果信息丰富,但人们还需要更广泛适用的非参数掩蔽和鲁棒性措施。为此,为任意数据设置中的离群函数抽象制定了有限样本掩蔽和淹没分解点的概念[作者,“研究离群标识符掩蔽和覆盖稳健性的一般基础”,统计方法20,79–90(2014)]本文将其引入到多元数据设置中。推导了三个重要的仿射不变非参数多元离群函数的度量公式:马氏距离、马氏空间和投影。使用这些公式,对于使用最小协方差行列式(MCD)位置和散布估计量的马氏距离异常,以及对于使用中值和MAD的单变量位置和尺度的投影异常,可以看到均衡的良好掩蔽和淹没崩溃点。此外,当淹没稳健性比掩蔽稳健性优先时,MCD标准化的马氏空间离群性具有竞争力。用双变量污染标准正态模型和污染指数模型进行的小型模拟研究得出了与理论公式一致的结果。讨论了一些实用建议。

MSC公司:

62G35型 非参数稳健性
62甲12 多元分析中的估计
62小时99 多元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 贝克尔,C。;Gather,U.,《多元异常值识别规则的掩蔽分解点》,J.Amer。统计师。协会,94947-955(1999)·Zbl 1072.62600号
[2] 党,X。;Serfling,R.,《基于非参数深度的多元离群值标识符和掩蔽稳健性属性》,J.Statist。计划。推理,140198-213(2010)·Zbl 1191.62084号
[3] Davies,P.L.,多元位置参数和离散矩阵S-估计的渐近行为,Ann.Statist。,15, 1269-1292 (1987) ·Zbl 0645.62057号
[4] Davies,P.L。;Gather,U.,《多个异常值的识别》,J.Amer。统计师。协会,88,782-801(1993)·Zbl 0797.62025号
[5] 集合,U。;Hilker,T.,关于泰勒修正Stahel-Donoho估计量MAD的注记,Ann.Statist。,25, 2024-2026 (1997) ·Zbl 0881.62033号
[6] Liu,R.Y.,数据深度和多元秩检验,(Dodge,Y.,(L_1)-统计学和相关方法(1992),北荷兰人:北荷兰阿姆斯特丹),279-294
[7] 刘,X。;Zuo,Y.,计算投影深度及其相关估计,统计。计算。,24, 51-63 (2014) ·Zbl 1325.62014号
[8] 刘,X。;Zuo,Y.,CompPD:用于计算投影深度的MATLAB包,J.Statist。软质。,65 (2015)
[9] 马哈拉诺比斯,P.C.,《统计学中的广义距离》,Proc。自然科学研究所。印度,1249-55(1936)·Zbl 0015.03302号
[10] Oja,H.,多元非参数方法:基于空间标志和排名的方法(2010),施普林格·兹比尔1269.62036
[11] Rousseeuw,P.J.,《具有高崩溃点的多元估计》,(Grossmann,W.;Pflug,G.;Vincze,I.;Wertz,W.,《数理统计与应用》,第8卷(1985年),Reidel:Reidel Dordrecht),283-297·Zbl 0609.62054号
[12] 卢梭,P。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,212-223(1999)
[13] Serfling,R.,《多元分位数和相关函数的等方差和不变性以及标准化的作用》,J.Nonparametr。统计,22915-936(2010)·Zbl 1203.62103号
[14] Serfling,R。;Mazumder,S.,中值绝对偏差的指数概率不等式和收敛结果及其修正,Statist。普罗巴伯。莱特。,79, 1767-1773 (2009) ·Zbl 1456.62056号
[15] Serfling,R。;Mazumder,S.,通过有限多个方向的投影追踪进行计算简单的异常值检测,J.非参数。统计,25,447-461(2013)·Zbl 1297.62145号
[16] Serfling,R。;Wang,S.,研究离群值标识符掩蔽和淹没稳健性的一般基础,Stat.Methodol。,20、79-90(2014),纪念凯萨尔·辛格教授专刊·Zbl 1486.62143号
[17] Tyler,D.E.,基于投影的多元位置和散布统计的有限样本分解点,《统计年鉴》。,22, 1024-1044 (1994) ·Zbl 0815.62015号
[18] 瓦尔迪,Y。;Zhang,C.H.,多元(L_1)中值和相关数据深度,Proc。国家。阿卡德。科学。美国,971423-1426(2000)·Zbl 1054.62067号
[19] 王,S。;Serfling,R.,《关于单变量数据领先非参数离群值标识符的掩蔽和淹没稳健性》,J.Statist。计划。推断,162,62-74(2015)·Zbl 1320.62112号
[20] Zuo,Y.,基于投影的深度函数和相关中位数,Ann.Statist。,31, 1460-1490 (2003) ·Zbl 1046.62056号
[21] Zuo,Y.,多元分析中的稳健位置和分散估计,(Fan,J.;Koul,H.L.,《统计学前沿》(2006),帝国理工学院出版社:帝国理工大学出版社伦敦),467-490·兹比尔1119.62051
[22] Zuo,Y。;Serfling,R.,统计深度函数的一般概念,Ann.Statist。,28, 461-482 (2000) ·Zbl 1106.62334号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。