×

基于粒子群优化的投影寻踪法检测多变量异常值。 (英语) Zbl 1436.62306号

Lechevallier,Yves(编辑)等人,《COMPSTAT期刊》2010。2010年8月22日至27日在法国巴黎举行的第19届国际计算统计会议。主题演讲、邀请和贡献论文。海德堡:Physica Verlag。89-98 (2010).
摘要:检测多元数据中的离群值是一项重要但困难的任务,并且已经存在几种检测方法。大多数提出的方法要么基于观测值到分布中心的马氏距离,要么基于投影寻踪(PP)方法。在本论文中,我们重点讨论一维PP方法,当数据不是椭圆对称时,这种方法可能会特别有趣。我们对多元异常值检测的PP统计文献进行了调查,并研究了不同方法的优缺点。我们还建议使用最近的启发式优化算法Tribes来检测投影追踪上下文中的多变量异常值。
关于整个系列,请参见[Zbl 1202.62001].

MSC公司:

62小时99 多元分析
62小时25分 因子分析和主成分;对应分析
62-08 统计问题的计算方法
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] ACHARD,V.、LANDREVIE,A.和FORT,J.-C.(2004):使用投影追踪算法检测高光谱图像中的异常in:L.Bruzzone(Ed):遥感图像和信号处理X.《SPIE学报》,第5573卷,193-202年。
[2] BARNETT,V.和LEWIS,T.(1994):统计数据中的异常值,第三版。威利·Zbl 0801.62001
[3] BERRO,A.、LARABI MARIE-SAINTE,S.和RUIZ-GAZEN,A.(2009):探索性投影追踪的遗传和粒子群优化。已提交·Zbl 1231.62001号
[4] CAUSSINUS,H.、FEKRI,M.、HAKAM,S.和RUIZ-GAZEN,A.(2003):多变量异常值的监测显示。计算统计与数据分析44,237-252·Zbl 1429.62217号 ·doi:10.1016/S0167-9473(03)00059-8
[5] CAUSSINUS,H.和RUIZ-GAZEN,A.(1990):通过广义主成分分析对多维数据进行有趣的预测,COMPSTAT 90,Physica-Verlag,121-126。
[6] 考西努斯,H.和RUIZ-GAZEN,A.(2009):探索性投影追踪。收录:G.Govaert:数据分析(数字信号和图像处理系列)。威利,67-89。
[7] CERIOLI,A.、RIANI,M.和ATKINSON A.C.(2009年):用MCD分散估计值控制多变量离群值检验的大小。统计与计算19,341-353·doi:10.1007/s11222-008-9096-5
[8] CLERC,M.(2005):L'optimization par essaims specialires。拉瓦锡·Zbl 1078.90068号
[9] 库克·D·布贾。A.和CABRERA,J.(1993):基于正交函数展开的投影寻踪指数。计算与图形统计杂志225-250·doi:10.2307/1390644
[10] COOK,D.和SWAYNE,D.F.(2007):用于数据分析的交互式和动态图形。纽约施普林格-弗拉格·Zbl 1154.62006年 ·数字对象标识代码:10.1007/978-0-387-71762-3
[11] COOREN,Y.,CLERC,M.SIARRY,P.(2009):自适应粒子群优化算法TRIBES的性能评估。Swarm Intelligence 3,149-178·Zbl 1219.90152号 ·doi:10.1007/s11721-009-0026-8
[12] CROUX C.和RUIZ-GAZEN,A.(2005):主要成分的高分解估计:重新审视投影-探索方法。多元分析杂志,95,206-226·Zbl 1065.62040号 ·doi:10.1016/j.jmva.2004.08.002
[13] CROUX,C.、FILZMOSER,P.和OLIVEIRA,M.R.(2007):投影追踪稳健主成分分析算法。化学计量学和智能实验室系统,87,218-225·doi:10.1016/j.chemolab.2007.01.004
[14] DONOHO,D.L.(1982):多元位置估计的分解性质。哈佛大学博士资格论文。
[15] EBERHART,R.C.和KENNEDY,J.(1995):使用粒子群理论的新优化器。摘自:第六届国际微机械与人类科学研讨会论文集。日本名古屋,39-43。
[16] 弗里德曼·J·H(1987):探索性投影追求。《美国统计协会杂志》,82249-266·Zbl 0664.62060号 ·doi:10.2307/2289161
[17] FRIEDMAN J.H.和TUKEY J.W.(1974):探索性数据分析的投影寻踪算法。IEEE计算机汇刊。C、 23,881-889·Zbl 0284.68079号 ·doi:10.10109/T-C.19974.224051
[18] GILLI,M.和SCHUMANN,E.(2009):带优化启发式的稳健回归。Comisef工作文件系列,WPS-011。
[19] GILLI,M.和WINKER,P.(2008):《计量经济学中启发式优化方法综述》。综合工作文件系列WPS-OO1。
[20] HADI,A.S.、RAHMATULLAH IMON,A.H.M.和WERNER,M.(2009):异常值检测。威利跨学科评论:计算统计学,157-70·doi:10.1002/wics.6
[21] HALL,P.(1989):关于探索性投影追踪的基于多项式的投影指数。《统计年鉴》,第17589-605页·Zbl 0717.62051号 ·doi:10.1214/aos/1176347127
[22] HUBER,P.J.(1985):投影追求。《统计年鉴》,第13435-475页·Zbl 0595.62059号 ·doi:10.1214/aos/1176349519
[23] JOLLIFFE,I.T.(2002):主成分分析,第二版。斯普林格·Zbl 1011.62064号
[24] JONES,M.C.和SIBSON,R.(1987):什么是投影追踪?《皇家统计学会杂志》,150,1-37·Zbl 0632.62059号
[25] JUAN,J.和PRIETO,F.J.(2001):使用角度识别集中的多元异常值。技术计量学43,311-322·doi:10.1198/004017001316975907
[26] KENNEDY,J.和EBERHART,R.C.(与Yuhui Shi合著)(2001年):Swarm Intelligence。摩根·考夫曼。
[27] LARABI MARIE-SAINTE,S.、RUIZ-GAZEN,A.和BERRO,A.(2009):《部落:优化效率的方法》,pour révéler des optima locaux d'un indice de projection。预打印。
[28] LI,G.和CHEN,Z.(1985):稳健分散矩阵和主成分的投影寻踪方法:基本理论和蒙特卡罗。美国统计协会杂志,80759-766·Zbl 0595.62060号 ·doi:10.2307/2288497
[29] MALPIKA,J.A.、REJAS,J.G.和ALONSO,M.C.(2008):用于高光谱图像异常检测的投影追踪算法。模式识别,41,3313-3327·Zbl 1154.68325号 ·doi:10.1016/j.patcog.2008.04.014
[30] MARONNA,R.A.和YOHAI,V.J.(1995)。Stahel-Donoho稳健多元估计的行为。《美国统计协会杂志》,90(429),330-341·兹比尔0820.62050 ·doi:10.2307/2291158
[31] NASON,G.P.(1992):预测指数的设计和选择。巴斯大学博士论文。
[32] PEñA,D.和PRIETO,F.(2001):多元离群值检测和稳健协方差矩阵估计。技术计量学,43,286-310·doi:10.1198/004017001316975899
[33] ROUSSEUW,P.J.和VAN ZOMEREN,B.H.(1990):揭示多元异常值和杠杆点。美国统计协会杂志,85,633-639·doi:10.2307/2289995
[34] RUIZ-GAZEN,A.(1993):离散与投影矩阵估计。博士论文。保罗·萨巴蒂尔大学。图卢兹。
[35] SMETEK,T.E.和BAUER,K.W.(2008):用于发现高光谱异常的多变量异常检测方法的比较。军事行动研究,13,19-44。
[36] STAHEL,W.A.(1981):协方差估计的分解。研究报告31。Fachgruppe für Statistik,E.T.H.Zürich。
[37] SUN,J.(1991):探索性投影追求中的显著性水平。《生物特征》,78(4),759-769·Zbl 0753.62067号 ·doi:10.1093/biomet/78.4.759
[38] D.泰勒·Zbl 1250.62032号 ·文件编号:10.1111/j.1467-9868.2009.00706.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。