×

监测的力量:如何充分利用受污染的多元样本。 (英语) 兹比尔1427.62047

小结:诊断工具必须依赖可靠的高故障方法,以避免异常值污染时的失真。然而,对数据进行单一汇总(即使是稳健的)的缺点是,必须在分析之前做出关于稳健方法的参数(例如分解点)的重要选择。这种选择的效果可能难以评估。我们认为,一个有效的解决方案是看几个可用数据的图片,可能是整部电影。这可以通过在一系列参数值上监测通过稳健的选择方法计算的结果来实现。通过使用不同的高分解技术对多元数据集进行分析,我们展示了监控在复杂数据结构研究中提供的信息增益。我们的研究结果支持这样一种说法,即监测原则非常灵活,它可以产生尽可能有效的稳健估计。我们还通过模拟解决了监控中出现的一些棘手的推断问题。

MSC公司:

62甲12 多元分析中的估计
62J20型 诊断、线性推理和回归
62G35型 非参数稳健性
62H30型 分类和区分;聚类分析(统计方面)
62G32型 极值统计;尾部推断
62-02 与统计有关的研究展览(专著、调查文章)

软件:

质量(R);
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Agostinelli C,Marazzi A,Yohai V(2014)广义对数伽马分布的稳健估计。技术计量学56:92-101·Zbl 1466.62014年 ·doi:10.1080/00401706.2013.818578
[2] Alfons A、Croux C、Gelper S(2013)用于分析高维大数据集的稀疏最小二乘回归。应用统计年鉴7:226-248·Zbl 1454.62123号 ·doi:10.1214/12-AOAS575
[3] Amiguet M,Marazzi A,Valdora M,Yohai V(2017)带分散参数的广义线性模型的稳健估计。技术报告1703.09626v1,arXiv·兹比尔1420.62099
[4] Atkinson AC、Corbellini A、Riani M(2017a)《带前向搜索的稳健贝叶斯回归:理论和数据分析》。测试,在压力下,https://doi.org/10.1007/s11749-017-0542-6 ·Zbl 1382.62036号
[5] Atkinson AC,Riani M(2000)稳健诊断回归分析。纽约州施普林格·Zbl 0964.62063号 ·doi:10.1007/978-1-4612-1160-0
[6] Atkinson AC,Riani M(2007),多元数据聚类探索工具。计算统计数据分析52:272-285·Zbl 1452.62028号 ·doi:10.1016/j.csda.2006.12.034
[7] Atkinson AC,Riani M,Cerioli A(2004)用正向搜索探索多元数据。纽约州施普林格·Zbl 1049.62057号 ·数字对象标识代码:10.1007/978-0-387-21840-3
[8] Atkinson AC、Riani M、Cerioli A(2010)《正向搜索:理论和数据分析》(含讨论)。J Korean Stat Soc韩国统计学会39:117-134·Zbl 1294.62149号 ·doi:10.1016/j.jkss.2010.02.007
[9] Atkinson AC、Riani M、Cerioli A(2017),随机开始正向搜索的聚类检测和聚类。J Appl Stat,出版中,https://doi.org/10.1080/02664763.2017.1310806 ·Zbl 1516.62129号
[10] Avella-Medina M,Ronchetti E(2015)《稳健统计:选择性概述和新方向》。电线计算统计7:372-393·doi:10.1002/wics.1363
[11] Azzalini A,Bowman A(1990)旧忠实间歇泉的一些数据。应用统计39:357-365·Zbl 0707.62186号 ·doi:10.2307/2347385
[12] Boudt K,Rousseeuw P,Vanduffel S,Verdonck T(2017)最小正则协方差行列式估计。技术报告1701.07086v1,arXiv·Zbl 1436.62197号
[13] Cerioli A(2010)使用高分解估值器进行多变量异常值检测。美国统计学会杂志105:147-156·Zbl 1397.62167号 ·doi:10.1198/jasa.2009.tm09147
[14] Cerioli A,Farcomeni A(2011)多元异常值检测的错误率。计算统计数据分析55:544-553·Zbl 1247.62192号 ·doi:10.1016/j.csda.2010.05.021
[15] Cerioli A,Riani M(1999)空间数据的排序和多个离群值的检测。计算机组统计8:239-258
[16] Cerioli A,Riani M,Atkinson AC(2009)使用MCD分散估计值控制多元异常值检验的大小。统计计算19:341-353·doi:10.1007/s11222-008-9096-5
[17] Cerioli A,Farcomeni A,Riani M(2014)多元位置和散布的前向搜索估计的强一致性和鲁棒性。多变量分析杂志126:167-183·兹比尔1281.62135 ·doi:10.1016/j.jmva.2013.12.010
[18] Cerioli,A。;阿特金森,AC;Riani,M。;巴蒂斯塔,T.(编辑);Moreno,E.(编辑);Racugno,W.(编辑),《如何结合稳健性和应用统计》,51-64(2016),海德堡·Zbl 1357.62236号
[19] Cerioli A、Farcomeni A、Riani M(2017)《稳健估计和聚类分析的野生自适应修剪》。已提交·Zbl 1417.62169号
[20] Clarke BR,Schubert DD(2006)识别多元异常值的自适应修剪似然算法。澳大利亚N Z J Stat 48:353-371·Zbl 1108.62030号 ·doi:10.1111/j.1467-842X.2006.00445.x
[21] Croux H,Haesbroeck G(1999)最小协方差行列式散布矩阵估计器的影响函数和效率。多变量分析杂志71:161-190·Zbl 0946.62055号 ·doi:10.1006/jmva.1999.1839
[22] Davies PL(1987)多元位置参数S-估计和色散矩阵椭球估计的渐近行为。安统计15:1269-1292·Zbl 0645.62057号 ·doi:10.1214/aos/1176350505
[23] Dotto F、Farcomeni A、GarcíA-Escudero LA、Mayo-Iscar A(2017)稳健聚类的重加权方法。统计计算,出版,https://doi.org/10.1007/s11222-017-9742-x网址 ·Zbl 1384.62193号
[24] Farcomeni A,Greco L(2015)《稳健的数据缩减方法》。查普曼和霍尔/CRC,博卡拉顿·Zbl 1311.62006年 ·doi:10.1201/b18358
[25] García-Escudero LA,Gordaliza a(2005)椭圆轮廓分布的广义半径过程。美国统计学会杂志100:1036-1045·Zbl 1117.62339号 ·doi:10.1198/0162145000002023年
[26] Green CG,Martin D(2014)Hardin和Roke方法的扩展,通过Cerioli的IRMCD方法应用于多元异常值检测。技术报告可在http://christophergreen.github.io/papers华盛顿大学统计系
[27] Hardin J,Rocke DM(2005)鲁棒距离的分布。J计算组统计14:910-927·doi:10.1198/106186005X78585
[28] Huber PJ,Ronchetti EM(2009)稳健统计,第2版。霍博肯·威利·Zbl 1276.62022号 ·doi:10.1002/9780470434697
[29] Hubert M、Rousseeuw PJ、Van Aelst S(2008)《高分解稳健多元方法》。统计科学23:92-119·Zbl 1327.62328号 ·doi:10.1214/0883423070000087
[30] Hubert M,Rousseeuw PJ,Siegaert P(2015)多元函数异常值检测(含讨论)。统计方法应用24:177-202·Zbl 1441.62124号 ·doi:10.1007/s10260-015-0297-8
[31] Johansen S,Nielsen B(2016a)使用鞅和经验过程的一些新结果进行的前向搜索分析。伯努利22:1131-1183·Zbl 1388.62206号 ·doi:10.3150/14-BEJ689
[32] Johansen S,Nielsen B(2016b)线性时间序列回归模型离群值检测算法的渐近理论(含讨论)。扫描J统计43:321-348·Zbl 1419.62234号 ·doi:10.1111/sjos.12174
[33] LopuhaäHP,Rousseeuw PJ(1991)多元位置和协方差矩阵的仿射等变估计的分解点。安统计19:229-248·Zbl 0733.62058号 ·doi:10.1214/aos/1176347978
[34] Maronna RA、Martin RD、Yohai VJ(2006)稳健统计。奇切斯特·威利·邮编1094.62040 ·doi:10.1002/0470010940
[35] Pison G、Van Aelst S、Willems G(2002)LTS和MCD的小样本修正。梅特里卡55:111-123·Zbl 1320.62060号 ·doi:10.1007/s001840200191
[36] Riani M,Atkinson AC(2001),前向搜索二项式数据的回归诊断。J R Stat Soc系列D 50:63-78
[37] Riani M,Atkinson AC(2007)《在回归中测试多个离群值的前向搜索的快速校准》。高级数据分析等级1:123-141·Zbl 1301.62069号 ·doi:10.1007/s11634-007-0007-y
[38] Riani M,Atkinson AC,Cerioli A(2009)发现未知数量的多元异常值。J R Stat Soc系列B 71:447-466·Zbl 1248.62091号 ·文件编号:10.1111/j.1467-9868.2008.00692.x
[39] Riani M、Cerioli A、Atkinson AC、Perrotta D(2014a)监测稳健回归。电子J Stat 8:646-677·Zbl 1348.62200号 ·doi:10.1214/14-EJS897
[40] Riani M,Cerioli A,Torti F(2014b)关于稳健S估计量的一致性因子和效率。测试23:356-387·兹比尔1308.62106 ·doi:10.1007/s11749-014-0357-7
[41] Riani M、Atkinson AC、Perrotta D(2014c)非常稳健回归方法比较的参数框架。《科学统计》29:128-143·Zbl 1332.62245号 ·doi:10.1214/13-STS437
[42] Riani M、Perrotta D、Cerioli A(2015)超大数据集的正向搜索。J Stat Softw统计软件67:1·doi:10.18637/jss.v067.c01
[43] Rousseeuw PJ,Leroy AM(1987)稳健回归和异常值检测。纽约威利·Zbl 0711.62030号 ·doi:10.1002/0471725382
[44] Salini S、Cerioli A、Laurini F、Riani M(2016)《可靠稳健回归诊断》。国际统计版次84:99-127·Zbl 07763474号 ·doi:10.1111/insr.12103
[45] Tallis GM(1963)正常样本中的椭圆和径向截断。数学统计年鉴34:940-944·Zbl 0142.16104号 ·doi:10.1214/aoms/1177704016
[46] Venables WN,Ripley BD(2002)《现代应用统计学》,第4版。纽约州施普林格·Zbl 1006.62003号 ·doi:10.1007/978-0-387-21706-2
[47] Yohai VJ(1987)回归的高分解点和高效估计。安统计15:642-656·Zbl 0624.62037号 ·doi:10.1214/aos/1176350366
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。