×

高维异常检测的局部投影。 (英语) Zbl 1484.62064号

摘要:基于局部异常因子(LOF)的概念,提出了一种新的异常检测方法,称为局部投影[M.M.Breunig先生等,“LOF:识别基于密度的局部异常值”,ACM SIGMOD记录29,第2期,93–104(2000;doi:10.1145/335191.335388)]和ROBPCA[M.休伯特等,“ROBPCA:稳健主成分分析的新方法”,《技术计量学》47,第1期,64–79页(2005;doi:10.1198/00401700400000563)]. 通过使用这两种方法的各个方面,该算法对噪声变量具有鲁棒性,并且能够在多组情况下执行离群点检测。这个想法是使用线性投影集中于对观测值及其邻域的局部描述。观测的前景由观测到所有识别的投影空间的加权距离确定,权重取决于局部描述的适当性。与现有的异常值检测算法相比,模拟和真实数据的实验证明了该方法的有效性。

MSC公司:

62甲12 多元分析中的估计
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achtert,E.,Kriegel,H.-P.,Zimek,A.:Elki:用于评估子空间聚类算法的软件系统。摘自:科学和统计数据库管理,纽约施普林格,第580-585页(2008年)
[2] Aggarwal,C.C.,Yu,P.S.:高维数据的异常检测。收录于:ACM Sigmod Record,ACM,第30卷,第37-46页(2001)
[3] 阿玛尼诺,C。;李尔迪,R。;Lanteri,S。;莫迪,G.,托斯卡纳橄榄油的化学分析,化学计量学。智力。实验室系统。,5, 4, 343-354 (1989) ·doi:10.1016/0169-7439(89)80034-6
[4] Breunig,M.M.,Kriegel,H.-P.,Ng,R.T.,Sander,J.:Lof:识别基于密度的局部异常值。收录于:ACM sigmod记录,ACM,第29卷,第93-104页(2000)
[5] 坎佩罗,RJ;Moulavi,D。;Zimek,A。;Sander,J.,数据聚类、可视化和离群值检测的层次密度估计,ACM Trans。知识。发现。数据(TKDD),10,1,5(2015)
[6] 坎波斯,GO;Zimek,A。;桑德,J。;坎佩罗,RJ;Micenková,B。;舒伯特,E。;同意,I。;Houle,ME,《非监督异常值检测的评估:测量、数据集和实证研究》,Data Min.Knowl。光盘。,30, 4, 891-927 (2016) ·doi:10.1007/s10618-015-0444-8
[7] De Maesschalck,R。;Jouan-Rimbaud,D。;马萨特,DL,《马氏距离》,《化学家》。智力。实验室系统。,50, 1, 1-18 (2000) ·doi:10.1016/S0169-7439(99)00047-7
[8] Fawcett,T.,岩石分析简介,模式识别。莱特。,27, 8, 861-874 (2006) ·doi:10.1016/j.patrec.2005.10.010
[9] Filzmoser,P。;Gschwandtner,M.,mvoutlier:基于稳健方法的多元离群值检测,R包版本,2,6(2015)
[10] Filzmoser,P。;Maronna,R。;Werner,M.,《高维异常值识别》,计算机。统计数据分析。,1694-1711年3月52日(2008年)·Zbl 1452.62370号 ·doi:10.1016/j.csda.2007.05.018
[11] 亨利安,M。;手,DJ;甘地,A。;Mortlock,DJ,Casos:高维天文数据库中异常检测的子空间方法,统计分析。数据最小ASA数据科学。J.,6,1,53-72(2013)·Zbl 07260352号 ·doi:10.1002/sam.1167
[12] 胡,Y。;默里,W。;Shan,Y.,澳大利亚Rlof:R局部异常因子(LOF)的并行实现,R包版本,1,1,1(2015)
[13] 休伯特,M。;罗素,PJ;Vanden Branden,K.,Robpca:鲁棒主成分分析的新方法,Technometrics,47,1,64-79(2005)·doi:10.1198/00401700400000563
[14] 休伯特,M。;Van Driessen,K.,《快速稳健判别分析》,计算机。统计数据分析。,45, 2, 301-320 (2004) ·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2
[15] Janssens,K.,Deraedt,I.,Freddy,A.,Veekman,J.:比利时安特卫普出土的15-17世纪考古玻璃器皿的组成。米克罗奇。《学报》。15(iSuppl),253-267(1998)
[16] Kriegel,H.-P.,Kröger,P.,Schubert,E.,Zimek,A.:高维数据的轴平行子空间中的异常检测。高级知识。发现。Data Min.第831-838页(2009年)
[17] Kriegel,H.-P.,Kroger,P.,Schubert,E.,Zimek,A.:任意定向子空间中的异常检测。摘自:数据挖掘(ICDM),2012年IEEE第12届国际会议,第379-388页。IEEE(2012)
[18] Lemberge,P。;德雷特,I。;詹森,KH;魏,F。;Van Espen,PJ,使用epxma和(mu)-xrf数据的pls回归对16-17世纪考古玻璃器皿进行定量分析,J.Chemom。,14, 5-6, 751-763 (2000) ·doi:10.1002/1099-128X(200009/12)14:5/6<751::AID-CEM622>3.0.CO;二维
[19] 奥特纳,T。;Filzmoser,P。;罗姆,M。;Breiteneder,C。;Brodinova,S.,《分析高维数据结构的引导投影》,J.Compute。图表。统计,27,4,750-762(2018)·兹伯利07498988 ·doi:10.1080/101816600.2018.1459304
[20] Pomerantsev,AL,通过投影方法导出的多元分类的接受域,J.Chemom。,22, 11-12, 601-609 (2008) ·doi:10.1002/cem.1147
[21] Ramaswamy,S.、Rastogi,R.、Shim,K.:从大型数据集中挖掘离群值的高效算法。收录于:ACM Sigmod Record,第29卷,第427-438页。ACM(2000年)
[22] Serneels,S。;克罗克斯,C。;Filzmoser,P。;Van Espen,PJ,部分稳健m-回归,化学计量学。智力。实验室系统。,79, 1, 55-64 (2005) ·doi:10.1016/j.chemolab.2005.04.007
[23] Todorov,V.:rrcovHD:高维数据的稳健多元方法。R包版本0.2-5(2016)
[24] 托多罗夫,V。;Filzmoser,P.,鲁棒多变量分析的面向对象框架,J.Stat.Softw。,32, 3, 1-47 (2009) ·doi:10.18637/jss.v032.i03
[25] Zimek,A。;舒伯特,E。;Kriegel,H-P,《高维数值数据中非监督离群值检测的调查》,《统计分析》。数据最小ASA数据科学。J.,5,5,363-387(2012)·Zbl 07260336号 ·doi:10.1002/sam.1161
[26] Zimek,A。;Filzmoser,P.,《There and back again:统计推理和数据挖掘算法之间的离群值检测》,威利Interdiscip。版本数据最小知识。发现。,8、6、e1280(2018)·doi:10.1002/widm.1280
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。