托马斯·奥尔特纳;彼得·菲兹莫瑟;梅亚·罗姆;萨尔卡·布罗迪诺娃;克里斯蒂安·布雷特内德 用于高维异常值检测的局部投影。 (英语) Zbl 1484.62064号 Metron公司 79,第2期,189-206(2021). 摘要:基于局部异常因子(LOF)的概念,提出了一种新的异常检测方法,称为局部投影[M.M.Breunig先生等,“LOF:识别基于密度的局部异常值”,ACM SIGMOD记录29,第2期,93–104(2000;doi:10.1145/335191.335388)]和ROBPCA[M.休伯特等,“ROBPCA:稳健主成分分析的新方法”,《技术计量学》47,第1期,64–79页(2005;doi:10.1198/00401700400000563)]. 通过使用这两种方法的各个方面,该算法对噪声变量具有鲁棒性,并且能够在多组情况下执行离群点检测。这个想法是使用线性投影集中于对观测值及其邻域的局部描述。观测值的离群性由观测值到所有已识别投影空间的加权距离决定,权重取决于局部描述的适当性。仿真和实际数据的实验表明,与现有的孤立点检测算法相比,该方法是有效的。 MSC公司: 62甲12 多元分析中的估计 62H30型 分类和区分;聚类分析(统计方面) 软件:mvoutlier值;rrcovHD公司;ELKI公司 PDF格式BibTeX公司 XML格式引用 \textit{T.Ortner}等人,Metron 79,No.2,189--206(2021;Zbl 1484.62064) 全文: 内政部 arXiv公司 OA许可证 参考文献: [1] Achtert,E.,Kriegel,H.-P.,Zimek,A.:Elki:用于评估子空间聚类算法的软件系统。摘自:科学和统计数据库管理,纽约施普林格,第580-585页(2008年) [2] Aggarwal,C.C.,Yu,P.S.:高维数据的异常检测。收录:ACM Sigmod记录,ACM,第30卷,第37-46页(2001年) [3] 阿玛尼诺,C。;里尔迪,R。;Lanteri,S。;莫迪,G.,托斯卡纳橄榄油的化学分析,化学计量学。智力。实验室系统。,5, 4, 343-354 (1989) ·doi:10.1016/0169-7439(89)80034-6 [4] Breunig,M.M.,Kriegel,H.-P.,Ng,R.T.,Sander,J.:Lof:识别基于密度的局部异常值。收录于:ACM sigmod记录,ACM,第29卷,第93-104页(2000) [5] 坎佩罗,RJ;Moulavi,D。;Zimek,A。;Sander,J.,数据聚类、可视化和离群值检测的层次密度估计,ACM Trans。知识。发现。数据(TKDD),10,1,5(2015) [6] 坎波斯,GO;Zimek,A。;桑德,J。;坎佩罗,RJ;Micenková,B。;舒伯特,E。;同意,I。;Houle,ME,《非监督异常值检测的评估:测量、数据集和实证研究》,Data Min.Knowl。光盘。,30, 4, 891-927 (2016) ·doi:10.1007/s10618-015-0444-8 [7] De Maesschalck,R。;Jouan-Rimbaud,D。;马萨特,DL,《马氏距离》,《化学家》。智力。实验室系统。,50, 1, 1-18 (2000) ·doi:10.1016/S0169-7439(99)00047-7 [8] Fawcett,T.,岩石分析简介,模式识别。莱特。,27, 8, 861-874 (2006) ·doi:10.1016/j.patrec.2005.10.010 [9] Filzmoser,P。;Gschwandtner,M.,mvoutlier:基于稳健方法的多元离群值检测,R包版本,2,6(2015) [10] Filzmoser,P。;Maronna,R。;Werner,M.,高维离群识别,计算。统计数据分析。,52, 3, 1694-1711 (2008) ·Zbl 1452.62370号 ·doi:10.1016/j.csda.2007.05.018 [11] 亨利安,M。;手,DJ;甘地,A。;Mortlock,DJ,Casos:高维天文数据库中异常检测的子空间方法,统计分析。数据最小ASA数据科学。J.,6,1,53-72(2013)·Zbl 07260352号 ·doi:10.1002/sam.1167 [12] 胡,Y。;默里,W。;Shan,Y.,Australia Rlof:R本地异常因子(LOF)的并行实现,R包版本,1,1,1(2015) [13] 休伯特,M。;罗素,PJ;Vanden Branden,K.,Robpca:稳健主成分分析的新方法,技术计量学,47,1,64-79(2005)·doi:10.1198/00401700400000563 [14] 休伯特,M。;Van Driessen,K.,《快速稳健判别分析》,计算机。统计数据分析。,45, 2, 301-320 (2004) ·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2 [15] Janssens,K.,Deraedt,I.,Freddy,A.,Veekman,J.:比利时安特卫普出土的15-17世纪考古玻璃器皿的组成。米克罗奇。《学报》。15(iSuppl),253-267(1998) [16] Kriegel,H.-P.,Kröger,P.,Schubert,E.,Zimek,A.:高维数据的轴平行子空间中的异常点检测。高级知识。发现。Data Min.第831-838页(2009年) [17] Kriegel,H.-P.,Kroger,P.,Schubert,E.,Zimek,A.:任意定向子空间中的异常检测。摘自:数据挖掘(ICDM),2012年IEEE第12届国际会议,第379-388页。IEEE(2012) [18] Lemberge,P。;德雷特,I。;詹森,KH;魏,F。;Van Espen,PJ,使用epxma和(mu)-xrf数据的pls回归对16-17世纪考古玻璃器皿进行定量分析,J.Chemom。,14, 5-6, 751-763 (2000) ·doi:10.1002/1099-128X(200009/12)14:5/6<751::AID-CEM622>3.0.CO;二维 [19] 奥特纳,T。;Filzmoser,P。;罗姆,M。;Breiteneder,C。;Brodinova,S.,《分析高维数据结构的引导投影》,J.Compute。图表。统计,27,4,750-762(2018)·Zbl 07498988号 ·doi:10.1080/10618600.2018.1459304 [20] Pomerantsev,AL,通过投影方法导出的多元分类的接受域,J.Chemom。,22, 11-12, 601-609 (2008) ·doi:10.1002/cem.1147 [21] Ramaswamy,S.、Rastogi,R.、Shim,K.:从大型数据集中挖掘离群值的高效算法。在:ACM Sigmod记录,第29卷,第427-438页。ACM(2000年) [22] Serneels,S。;克罗克斯,C。;Filzmoser,P。;Van Espen,PJ,偏稳健m-回归,化学计量学。智力。实验室系统。,79, 1, 55-64 (2005) ·doi:10.1016/j.chemolab.2005.04.007 [23] Todorov,V.:rrcovHD:高维数据的稳健多元方法。R包版本0.2-5(2016) [24] 托多罗夫,V。;Filzmoser,P.,稳健多元分析的面向对象框架,J.Stat.Softw。,32, 3, 1-47 (2009) ·doi:10.18637/jss.v032.i03 [25] Zimek,A。;舒伯特,E。;Kriegel,H-P,《高维数值数据中非监督离群值检测的调查》,《统计分析》。数据最低ASA数据科学。J.,5,5,363-387(2012)·Zbl 07260336号 ·doi:10.1002/sam.1161 [26] Zimek,A。;Filzmoser,P.,《There and back again:统计推理和数据挖掘算法之间的离群值检测》,威利Interdiscip。版本数据最小知识。发现。,8、6、e1280(2018)·doi:10.1002/widm.1280 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。