×

局部多元异常值的识别。 (英语) Zbl 1416.62297号

摘要:多变量观测值对之间的马氏距离被用作观测值之间相似性的度量。导出了理论分布,并将其结果用于判断观测值的隔离度。在空间坐标可用的空间相关数据的情况下,引入了不同的探索工具来研究观测值与其相邻部分的隔离程度,从而识别局部多元离群值。

MSC公司:

62甲12 多元分析中的估计
62层35 鲁棒性和自适应程序(参数推断)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aitchison J(1986)成分数据的统计分析。查普曼和霍尔,伦敦·Zbl 0688.62004号 ·doi:10.1007/978-94-009-4109-0
[2] Anselin L(1995)空间关联的局部指标。地理分析27(2):93-115·doi:10.1111/j.1538-46321995.tb00338.x
[3] Anselin,L。;Fischer,M.(编辑);Scholten,H.(编辑);Unwin,D.(编辑),《Moran散点图作为ESDA工具评估空间关联中的局部不稳定性》,111-125(1996),伦敦
[4] Anselin L,Syabri I,Smirnov O(2002)用动态链接窗口可视化多元空间相关性。In:Anselin L,Rey S(编辑)空间数据分析的新工具:研讨会论文集,加州大学圣巴巴拉分校空间综合社会科学中心(CD-ROM)
[5] Atkinson AC,Mulira H-M(1993)检测多变量异常值的钟乳石图。J统计计算3(1):27-35·doi:10.1007/BF00146951
[6] Atkinson AC,Riani M,Cerioli A(2004)用正向搜索探索多元数据。纽约州施普林格·Zbl 1049.62057号 ·数字对象标识代码:10.1007/978-0-387-21840-3
[7] Breunig MM、Kriegel H-P、Ng RT、Sander J(2000)《LOF:识别基于密度的局部异常值》。摘自:ACM SIGMOD(2000)数据管理国际会议记录,德克萨斯州达拉斯,第93-104页
[8] Cerioli A(2010)使用高分解估值器进行多变量异常值检测。美国统计学会杂志105:147-156·Zbl 1397.62167号 ·doi:10.1198/jasa.2009.tm09147
[9] Cerioli A,Riani M(1999)空间数据的排序和多个离群值的检测。J计算图形统计8:239-258
[10] Cerioli A、Farcomeni A、Riani M(2012)《无离群值良好性测试的稳健距离》。计算统计数据分析(印刷中)·Zbl 1471.62036号
[11] Chauvet P(1982)变异函数云。摘自:第17届APCIM研讨会会议记录,科罗拉多矿业学校,1982年4月19日至23日,戈尔登,第757-764页
[12] Chiu AL,Fu AW(2003)局部异常检测的增强。在:第七届国际数据库工程与应用论文集,研讨会(IDEAS'03),第298-307页
[13] Cressie N(1993)空间数据统计。纽约威利
[14] Dale MRT,Fortin M-J(2009)《空间自相关和统计测试:一些解决方案》。农业生物环境杂志Stat 14(2):188-206·Zbl 1306.62263号 ·doi:10.1198/jabes.2009.0012
[15] Evans M、Hastings N、Peacock B(1993)《统计分布》,第2版。纽约威利·兹伯利0834.62001
[16] Filzmoser P,Gschwandtner M(2012)mvoutlier:基于稳健方法的多元离群值检测。R软件包版本1.9.8。http://CRAN.R-project.org/package=mvoutlier
[17] Filzmoser P,Hron K(2008)使用稳健方法对成分数据进行异常检测。数学地质40(3):233-248·Zbl 1135.62040号 ·doi:10.1007/s11004-007-9141-5
[18] Filzmoser P,Garrett RG,Reimann C(2005),勘探地球化学中的多变量异常值检测。计算地质科学31:579-587·doi:10.1016/j.cageo.2004.11.013
[19] Filzmoser P,Hron K,Reimann C(2012)成分数据的多元异常值解释。计算地质科学39:77-85·doi:10.1016/j.cageo.2011.06.014
[20] 盖里A-M(1833)《法国统计士气》。克罗查德(Crochard),巴黎。英文译本:HP Whitt和VW Reinking,埃德温·梅伦出版社,刘易斯顿,2002年
[21] Hardin J,Rocke DM(2005)稳健距离的分布。计算机图形统计杂志14:910-927·doi:10.1198/106186005X77685
[22] Haslett J、Bradley R、Craig P、Unwin A、Wills G(1991)《探索空间数据并应用于定位全球和局部异常的动态图形》。美国统计局45(3):234-242
[23] 卢CT,陈迪,寇勇(2004)多变量空间异常值检测。国际艺术智能工具杂志13(4):801-812·doi:10.1142/S021821300400182X
[24] 马哈拉诺比斯PC(1936)《统计学中的广义距离》。摘自:《印度国家科学院学报》A2,第49-55页·Zbl 0015.03302号
[25] Maronna R、Martin D、Yohai V(2006)《稳健统计:理论和方法》。威利加拿大有限公司,多伦多·邮编1094.62040 ·doi:10.1002/0470010940
[26] Papadimitriou S,Kitawaga H,Gibbons PB,Faloutsos C(2003)LOCI:使用局部相关积分的快速离群值检测。收录于:Dayal U、Ramamritham K、Vijayaraman TM(eds)《第19届数据工程国际会议论文集》,2003年3月5日至8日,印度班加罗尔,IEEE计算机学会,第315-326页
[27] Reimann C、Siewers U、Tarvainen T、Bityukova L、Eriksson J、Gilucis A、Gregorauskiene V、Lukashev VK、Matinian NN、Pasieczna A(2003)《北欧农业土壤:地球化学地图集》。收录:Geologisches Jahrbuch。Schweizerbart‘sche Verlagsbuchhandlung,斯图加特
[28] Riani M,Atkinson AC,Cerioli A(2009)发现未知数量的多元异常值。J R Stat Soc系列B 71:447-466·Zbl 1248.62091号 ·文件编号:10.1111/j.1467-9868.2008.00692.x
[29] Rousseeuw PJ,Leroy AM(2003)稳健回归和异常值检测。纽约威利
[30] Rousseeuw PJ,Van Driessen K(1999)最小协方差行列式估计的快速算法。技术计量41(3):212-223·doi:10.1080/00401706.1999.10485670
[31] Rousseeuw PJ,Van Zomeren BC(1990)《揭示多元异常值和杠杆点》。美国统计协会杂志85(411):633-651·网址:10.1080/01621459.1990.10474920
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。