×

使用随机投影的高维异常值检测。 (英语) Zbl 1478.62134号

摘要:文献中存在多种方法来检测多元数据中的离群值,但大多数方法都需要估计协方差矩阵。维数越高,矩阵的估计在高维中就越复杂。为了避免估计这个矩阵,我们提出了一种新的基于随机投影的方法来检测高斯多元数据中的异常值。它包括在几个一维子空间中投影数据,其中应用了适当的单变量异常值检测方法,类似于Tukey的方法,但阈值取决于初始维度和样本大小。使用顺序分析确定所需的预测数量。仿真和实际数据集表明了该方法的性能。

MSC公司:

62H15型 多元分析中的假设检验
62升10 顺序统计分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aggarwal,CC,离群分析(2017),柏林:施普林格,柏林·Zbl 1353.68004号 ·doi:10.1007/978-3-319-47578-3
[2] 巴内特,V。;Lewis,T.,《统计数据中的异常值》(1994年),霍博肯:威利·Zbl 0801.62001
[3] 贝克尔,C。;Gather,U.,多元异常值识别规则的掩蔽分解点,美国统计协会,94447,947-955(1999)·Zbl 1072.62600号 ·doi:10.1080/01621459.1999.10474199
[4] Cardot,H。;马斯·A。;Sarda,P.,《函数线性回归模型中的Clt》,Probab理论相关领域,138,3-4,325-361(2007)·Zbl 1113.60025号 ·doi:10.1007/s00440-006-0025-2
[5] Cerioli,A.,用高分解估计量进行多变量异常值检测,美国统计协会杂志,105,489,147-156(2010)·Zbl 1397.62167号 ·doi:10.1198/jasa.2009.tm09147
[6] Cerioli,A。;Riani,M。;Atkinson,AC,用MCD分散估计值控制多元异常值检验的大小,统计计算,19,3,341-353(2009)·doi:10.1007/s11222-008-9096-5
[7] 加利福尼亚州库斯塔·阿尔贝托斯;del Barrio,E。;R·弗雷曼。;Matrán,C.,《函数数据拟合优度的随机投影法》,《计算统计数据分析》,51,10,4814-4831(2007)·Zbl 1162.62363号 ·doi:10.1016/j.csda.2006.09.007
[8] 司法部长Cuesta Albertos;Febrero-Bande,M.,功能数据的简单多元方差分析,TEST,19,3,537-557(2010)·Zbl 1203.62122号 ·doi:10.1007/s11749-010-0185-3
[9] 加利福尼亚州库斯塔·阿尔贝托斯;R·弗雷曼。;Ransford,T.,无限维空间中的随机投影和良好性检验,Bull Braz Math Soc,37,4,477-501(2006)·Zbl 1112.62037号 ·doi:10.1007/s00574-006-0023-0
[10] 加利福尼亚州库斯塔·阿尔贝托斯;R·弗雷曼。;Ransford,T.,Cramér-Wold定理的一个尖锐形式,J Theor Probab,20,2201-209(2007)·邮编1124.60004 ·doi:10.1007/s10959-007-0060-7
[11] 加利福尼亚州库斯塔·阿尔贝托斯;Gamboa,F。;Nieto-Reyes,A.,《测试平稳过程是否为高斯的基于随机投影的程序》,《计算统计数据分析》,75,124-141(2014)·Zbl 1506.62137号 ·doi:10.1016/j.csda.2014.01.013
[12] 加利福尼亚州库斯塔·阿尔贝托斯;加西亚-葡萄牙,E。;Febrero-Bande,M。;González-Manteiga,W.,基于随机预测经验过程的函数线性模型的Goodness-of-fit检验,Ann Stat,47,1,439-467(2019)·Zbl 1415.62027号 ·doi:10.1214/18-AOS1693
[13] 加利福尼亚州库斯塔·阿尔贝托斯;Nieto-Reyes,A.,《随机Tukey深度》,《计算统计数据分析》,52、11、4979-4988(2008)·Zbl 1452.62344号 ·doi:10.1016/j.csda.2008.04.021
[14] 戴维斯,L。;Gather,U.,《多个离群值的识别》,美国统计协会期刊,88,423,782-792(1993)·Zbl 0797.62025号 ·doi:10.1080/016214519993.10476339
[15] Donoho DL(1982)多元位置估计的分解性质。博士资格论文
[16] Esbensen,K。;Guyot,D。;韦斯塔,F。;Houmoller,L.,《实践中的多元数据分析:多元数据分析和实验设计导论》(2002),《假名:CAMO,假名》
[17] 费布雷罗,M。;加利亚诺,P。;González Manteiga,W.,(NO_x)水平的函数分析:位置和尺度估计以及异常值检测,Comput。统计学。,22, 3, 411-427 (2007) ·Zbl 1197.62154号 ·doi:10.1007/s00180-007-0048-x
[18] Filzmoser,P。;Maronna,R。;Werner,M.,《高维异常识别》,《计算统计数据分析》,52,3,1694-1711(2008)·Zbl 1452.62370号 ·doi:10.1016/j.csda.2007.05.018
[19] 希利,MJR,多元正态图,J R Stat Soc Ser C Appl Stat,17,2,157-161(1968)
[20] 休伯特,M。;罗素,PJ;Segaert,P.,多元函数异常值检测,统计方法应用,24,2,177-202(2015)·Zbl 1441.62124号 ·doi:10.1007/s10260-015-0297-8
[21] 约翰逊,W。;林登斯特劳斯,J.,《利普希茨映射到希尔伯特空间的扩展》,《康普数学》,26189-206(1984)·Zbl 0539.46017号 ·doi:10.1090/conm/026/737400
[22] 约翰斯通,IM;Lu,AY,《关于高维主成分分析的一致性和稀疏性》,美国统计协会,104,486,682-693(2009)·Zbl 1388.62174号 ·doi:10.198/jasa.2009.0121
[23] FH拉森;范登伯格,F。;Engelsen,SB,《餐酒核磁共振波谱的探索性化学计量学研究》,《化学杂志》,20,5,198-208(2006)·doi:10.1002/cem.991
[24] 玛丽娜,RA;马丁,RD;尤海,VJ;Salibián-Barrera,M.,《稳健统计:理论和方法(与R)》(2019年),霍博肯:威利·Zbl 1409.62009号
[25] 玛丽娜,RA;Yohai,VJ,Stahel-Donoho稳健多元估计的行为,美国统计协会,90,429,330-341(1995)·Zbl 0820.62050号 ·doi:10.1080/01621459.1995.10476517
[26] 潘,J。;冯·W。;Fang,K.,使用投影追踪技术检测多元数据中的多个离群值,J Stat Plann推断,83,1,153-167(2000)·Zbl 0970.62041号 ·doi:10.1016/S0378-3758(99)00091-9
[27] 佩尼亚,D。;Prieto,FJ,多变量离群值检测和稳健协方差矩阵估计,技术计量学,43,3,286-310(2001)·doi:10.19198/004017001316975899
[28] Ro,K。;邹,C。;王,Z。;Yin,G.,高维数据的离群检测,Biometrika,102,3,589-599(2015)·Zbl 1452.62378号 ·doi:10.1093/biomet/asv021
[29] 罗素,PJ;Debruyne,M。;Engelen,S。;Hubert,M.,《化学计量学中的稳健性和异常值检测》,Crit Rev Anal Chem,36,3-4,221-242(2006)·doi:10.1080/10408340600969403
[30] Serfling,R。;Mazumder,S.,通过有限多个方向的投影追踪进行计算简单的离群值检测,《非参数统计杂志》,25,2,447-461(2013)·兹比尔1297.62145 ·doi:10.1080/10485252.2013.766335
[31] Stahel WA(1981)协方差估计的分解。面部花纹皮毛统计
[32] 塔塔科夫斯基,A。;尼基福罗夫,I。;Basseville,M.,《序列分析:假设检验和变化点检测》(Sequential analysis:hyperation testing and changepoint detection)(2014),博卡拉顿:查普曼和霍尔,博卡拉通·doi:10.1201/b17279
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。