×

洪水算法——一种多变量、基于自组织地图的鲁棒位置和协方差估计器。 (英语) Zbl 1322.62002号

摘要:自组织映射(SOM)由引入T.Kohonen公司《生物与网络》第43、59–69页(1982年;Zbl 0466.9202号)]在人工神经网络领域是众所周知的。SOM的执行方式非常直观,因此非常受欢迎,并且有很多应用程序(与统计相关:分类、集群)。SOM执行的无监督学习过程的结果是高维输入数据的非线性低维投影,保留了基础数据的某些特征,例如拓扑和概率分布[J.A.李M.Verleysen先生,非线性降维。纽约州纽约市:Springer(2007;兹比尔1128.68024);T.Kohonen公司、自组织地图。第三版柏林:施普林格(2001;Zbl 0957.68097号)]. 使用U矩阵[A.乌尔奇,“用于可视化和分类的自组织神经网络”,载于:信息和分类:概念、方法和应用。柏林:斯普林格。307–313(1993)]引入了SOM结果的强大可视化表示。我们提出了一种利用U矩阵识别外围数据点的方法。然后使用修改后的子样本(即初始样本减去外围点)对位置和散布进行稳健估计。

MSC公司:

62-04 统计相关问题的软件、源代码等
68T05型 人工智能中的学习和自适应系统
65年第68季度 算法和问题复杂性分析

软件:

SOM_PAK公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Atkinson,A.C.:检测多个离群值的快速非常稳健的方法。《美国统计协会期刊》89(428),1329–1339(1994)·Zbl 0825.62429号 ·doi:10.1080/01621459.1994.10476872
[2] Barnett,V.,Lewis,T.:《统计数据中的异常值》,第3版。威利,纽约(2000年)·Zbl 0377.62001
[3] Bartkowiak,A.,Szustalewicz,A.:作为检测多元异常值的方法的大巡演。机器。图表。视觉。6, 487–505 (1997)
[4] Becker,C.,Gather,U.:多元异常值识别规则的掩蔽分解点。《美国统计协会期刊》94、947–955(1999)·Zbl 1072.62600号 ·doi:10.1080/016214519999.10474199
[5] Becker,C.,Gather,U.:最大的不可识别离群值:多元同时离群值识别规则的比较。计算。统计数据分析。36(1), 119–127 (2001) ·Zbl 1080.62519号 ·doi:10.1016/S0167-9473(00)00032-3
[6] Becker,C.、Paris Scholz,S.:MVE、MCD和MZE:比较凸体最小化器的模拟研究。全部。Stat.建筑。88(2), 155–162 (2004)
[7] Becker,C.,Paris Scholz,S.:最深点和最浅点:MZE的稳健性和异常值。摘自:Spiliopoulou,M.、Kruse,R.、Borgelt,C.、Nürnberger,A.、Gaul,W.(编辑)《从数据和信息分析到知识工程》,第254-261页。柏林施普林格出版社(2006)
[8] Cottrell,M.,Fort,J.C.,Pagès,G.:SOM算法的理论方面。神经计算21(1-3),119-138(1998)·兹比尔0917.68082 ·doi:10.1016/S0925-2312(98)00034-4
[9] Croux,C.,Haesbroeck,G.:基于协方差或相关矩阵稳健估计的主成分分析:影响函数和效率。《生物特征》87(3),603(2000)·Zbl 0956.62047号 ·doi:10.1093/biomet/87.3.603
[10] Davies,P.:多元位置参数和离散矩阵S估计的渐近行为。Ann.Stat.15(3),1269–1292(1987)·Zbl 0645.62057号 ·doi:10.1214/aos/1176350505
[11] Davies,P.:Rousseeuw最小体积椭球估计的渐近性。Ann.Stat.20(4),1828-1843(1992)·Zbl 0764.62046号 ·doi:10.1214/aos/1176348891
[12] Davies,P.,Gather,U.:分解和分组。Ann.Stat.33(3),977–988(2005)·Zbl 1077.62041号 ·doi:10.1214/009053604000001138
[13] Davies,P.,Gather,U.:关于“分解和分组”的讨论附录。Ann.Stat.34(3),1577–1579(2006)·Zbl 1113.62063号 ·doi:10.1214/0090536000000399
[14] Erwin,E.,Obermeyer,K.,Schulten,K.:自组织映射的收敛性质。Artif公司。神经网络。1, 409–414 (1991)
[15] Erwin,E.,Obermayer,K.,Schulten,K.:自组织映射:排序、收敛特性和能量函数。生物、网络。67(1),47–55(1992年a)·Zbl 0747.92006号 ·doi:10.1007/BF00201801
[16] Erwin,E.,Obermayer,K.,Schulten,K.:自组织映射:稳态,亚稳态和收敛速度。生物、网络。67(1),35-45(1992b)·Zbl 0747.92005号 ·doi:10.1007/BF00201800
[17] Fort,J.:SOM的数学。神经网络。19(6–7), 812–816 (2006). 自组织地图的进展——WSOM’05·Zbl 1100.68091号 ·doi:10.1016/j.neunet.2006.05.025
[18] Fung,W.-K.:揭示异常值和杠杆点:一个确认。《美国统计协会期刊》88(422),515–519(1993)·doi:10.1080/01621459.1993.10476302
[19] Gather,U.,Becker,C.:异常值识别和稳健方法。收录:Maddala,G.,Rao,C.(编辑)稳健推理。《统计手册》,第15卷,第123–143页(1997年)·Zbl 0908.62032号
[20] Hampel,F.,Ronchetti,E.,Rousseeuw,P.,Stahel,W.:稳健统计:基于影响函数的方法。威利,纽约(2005年)·Zbl 0593.62027号
[21] Hardin,J.,Roke,D.:稳健距离的分布。J.计算。图表。《统计》第14(4)卷,928–946页(2005年)·doi:10.1198/106186005X77685
[22] Haykin,S.:神经网络和学习机器,第三版。普伦蒂斯·霍尔,纽约(2009)
[23] Hertz,J.、Palmer,R.G.、Krogh,A.S.:神经计算理论导论。珀尔修斯出版社,纽约(1991)
[24] Hubert,M.、Rousseeuw,P.、Aelst,S.:高分解稳健多元方法。统计科学。23(1), 92–119 (2008) ·Zbl 1327.62328号 ·doi:10.1214/0883423070000087
[25] Kaski,S.、Kangas,J.、Kohonen,T.:自组织映射(SOM)论文书目:1981-1997。神经计算。Surv公司。1(3&4),1-176(1998)
[26] Kohonen,T.:拓扑正确特征地图的自组织形成。生物、网络。43(1),59–69(1982)·Zbl 0466.9202号 ·doi:10.1007/BF00337288
[27] Kohonen,T.:《自组织地图》,第三版。施普林格,柏林(2001)·Zbl 0957.68097号
[28] Kohonen,T.、Hynninen,J.、Kangas,J.和Laaksonen,J.:Som-pak:自组织地图程序包。报告A31,赫尔辛基理工大学计算机和信息科学实验室(1996年)
[29] Koshevoy,G.,Mosler,K.:多元分布的带状修剪。Ann.Stat.25(5),1998-2017(1997)·Zbl 0881.62059号 ·doi:10.1214/aos/1069362382
[30] Koshevoy,G.,Mosler,K.:升力分区、随机凸壳和随机向量的可变性。伯努利4(3),377–399(1998)·兹比尔0945.52006 ·doi:10.2307/3318721
[31] Koshevoy,G.,Möttönen,J.,Oja,H.:基于分区图的散布矩阵估计。Ann.Stat.31(5),1439-1459(2003)·Zbl 1046.62058号 ·doi:10.1214/aos/1065705114
[32] Lee,J.,Verleysen,M.:非线性降维。柏林施普林格出版社(2007)·Zbl 1128.68024号
[33] Lopuhaä,H.:多元位置和散布的加权估计量的渐近性。Ann.Stat.27(5),1638-1665(1999)·Zbl 0957.62017号 ·doi:10.1214/aos/1017939145
[34] Lopuhaä,H.,Rousseeuw,P.:多元位置和协方差矩阵的仿射等变估计的分解点。Ann.Stat.19(1),229-248(1991)·Zbl 0733.62058号 ·doi:10.1214/aos/1176347978
[35] Nag,A.,Mitra,A.,米特拉,S.:使用自组织映射标题检测多元数据中的多个离群值。计算。《统计》第20(2)卷,第245–264页(2005年)·Zbl 1092.62098号 ·doi:10.1007/BF02789702
[36] Oja,M.,Kaski,S.,Kohonen,T.:自组织映射(SOM)论文书目:1998-2001补遗。神经计算。Surv公司。1, 1–176 (2002)
[37] Paris Scholz,S.:凸体估计的稳健性概念和研究。博士论文(2002)
[38] Pison,G.、van Aelst,S.、Willems,G.:LTS和MCD的小样本修正。Metrika梅特里卡55、111–123(2002)·Zbl 1320.62060号 ·doi:10.1007/s001840200191
[39] Pöllä,M.,Honkela,T.,Kohonen,T.:自组织映射(som)论文参考书目:2002–2005年补遗。技术报告TKK-ICS-R23,赫尔辛基理工大学信息与计算机科学系,芬兰埃斯波(2009)
[40] Riani,M.,Atkinson,A.,Cerioli,A.:发现未知数量的多元异常值。J.R.Stat.Soc.,塞尔维亚。B、 统计方法。71(2), 447–466 (2009) ·Zbl 1248.62091号 ·文件编号:10.1111/j.1467-9868.2008.00692.x
[41] Roke,D.:高维多元位置和形状S-估计的稳健性。Ann.Stat.24(3),1327-1345(1996)·Zbl 0862.62049号 ·doi:10.1214/aos/1032526972
[42] Roke,D.M.,Woodruff,D.L.:多元数据中异常值的识别。《美国统计协会期刊》91(435),1047-1061(1996)·Zbl 0882.62049号 ·doi:10.1080/01621459.1996.10476975
[43] 罗哈斯,R.:神经网络理论:系统化。柏林施普林格(1993)·Zbl 0900.68374号
[44] Rousseeuw,P.:高崩溃点的多元估计。数学。统计应用程序。8, 283–297 (1985) ·兹比尔0609.62054 ·文件编号:10.1007/978-94-009-5438-0_20
[45] Rousseeuw,P.,Leroy,A.:稳健回归和异常检测。威利,纽约(1987)·Zbl 0711.62030号
[46] Rousseeuw,P.,van Driessen,K.:最小协方差行列式估计的快速算法。《技术计量学》41、212–223(1999)·doi:10.1080/00401706.1999.10485670
[47] Rousseeuw,P.,van Zomeren,B.:揭示多元异常值和杠杆点。《美国统计协会期刊》85(411),633–639(1990)·网址:10.1080/01621459.1990.10474920
[48] Ultsch,A.:用于可视化和分类的自组织神经网络。收录于:Opitz,O.,Lausen,B.,Klar,R.(编辑)《信息和分类:概念、方法和应用》,第307-313页。柏林施普林格(1993)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。