×

存在离群值时单峰连续分布的密度估计。 (英语) Zbl 1397.62138号

摘要:“前向搜索”(FS)是一种识别异常值及其对拟合模型的影响的强大通用方法。本研究调查了FS方法在非参数单变量密度估计框架中识别异常值的实现,其中训练样本来自单峰连续分布。一些仿真研究和实际数据示例说明了该程序的性能。结果表明,离群值可能导致密度函数的估计不合适。当离群值相对于所有观测值的数量较少时,确定和消除离群值可以为数据集拟合一个合理的密度函数。最后,本文提出的简单排序系统可以在其他一些框架中使用。

MSC公司:

62G07年 密度估算
62G10型 非参数假设检验
62J20型 诊断、线性推理和回归
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 分析方法委员会,稳健统计——如何不拒绝离群值。第1部分。基本概念,分析家,1141693-1697,(1989)·doi:10.1039/AN9891401693
[2] Atkinson,AC,《检测多个离群值的快速非常稳健方法》,美国统计协会,89,1329-1339,(1994)·Zbl 0825.62429号 ·doi:10.1080/01621459.1994.10476872
[3] Atkinson AC,Riani M(2000)稳健诊断回归分析。纽约州施普林格·Zbl 0964.62063号 ·doi:10.1007/978-1-4612-1160-0
[4] Atkinson AC,Riani M,Cerioli A(2004)用正向搜索探索多元数据。纽约州施普林格·Zbl 1049.62057号 ·数字对象标识代码:10.1007/978-0-387-21840-3
[5] 阿特金森,AC;Riani,M;Cerioli,A,《正向搜索:理论和数据分析》,《韩国统计学会杂志》,39,117-134,(2010)·Zbl 1294.62149号 ·doi:10.1016/j.jkss.2010.02.007
[6] Cerioli,A,用高分解估计量进行多变量异常值检测,美国统计协会杂志,105,147-156,(2010)·Zbl 1397.62167号 ·doi:10.198/jasa.2009.tm09147
[7] Cerioli,A;法科梅尼,A;Riani,M,《无离群值良好性测试的稳健距离》,《计算统计数据分析》,65,29-45,(2012)·Zbl 1471.62036号 ·doi:10.1016/j.csda.2012.03.008
[8] Chernoff,H,《模式估计》,《Ann Inst Stat Math》,第16期,第31-41页,(1964年)·兹伯利0212.21802 ·doi:10.1007/BF02868560
[9] Coin,D,在存在异常值的情况下测试正态性,统计方法应用,17,3-12,(2008)·Zbl 1367.62140号 ·doi:10.1007/s10260-007-0046-8
[10] 巴蒂斯蒂,F;Salini,S,《文献计量数据的稳健分析》,《统计方法应用》,22,269-283,(2013)·Zbl 1333.62012年 ·doi:10.1007/s10260-012-0217-0
[11] 德布鲁恩,M;Verdonck,T,稳健核主成分分析和分类,高级数据分析分类,4151-167,(2010)·兹比尔1284.62370 ·doi:10.1007/s11634-010-0068-1
[12] Dharmadhikari SW,Joag-Dev K(1988)《单峰性、凸性和应用》。纽约学术出版社·Zbl 0646.62008号
[13] 油炸,R;Dehling,H,双样本位置问题的稳健非参数检验,Stat Methods Appl,20,409-422,(2011)·Zbl 1337.62093号 ·doi:10.1007/s10260-011-0164-1
[14] Hadi,AS,识别多元数据中的多个离群值,J Roy Stat Soc:Ser B(Methodol),54,761-771,(1992)
[15] 哈迪,AS;Simonoff,JS,《线性模型中多个异常值的识别程序》,美国统计协会杂志,88,1264-1272,(1993)·doi:10.1080/01621459.1993.10476407
[16] Hettich S,Bay SD(1999)UCI KDD档案。加利福尼亚大学。欧文信息与计算机科学系。http://kdd.ics.uci.edu
[17] 胡贝尔,M;罗素,PJ;Segaert,P,多变量函数异常值检测(含讨论),统计方法应用,24,177-277,(2015)·Zbl 1441.62124号 ·doi:10.1007/s10260-015-0297-8
[18] Jann B(2005)单变量核密度估计。波士顿学院经济系,统计软件组件编号S,456410
[19] 马哈达维,A;Towhidi,M,《检验正常人群参数的稳健检验》,《伊朗伊斯兰共和国科学杂志》,25,273-280,(2014)
[20] 公园,BU;Marron,JS,《数据驱动带宽选择器的比较》,J Am Stat Assoc,85,66-72,(1990)·网址:10.1080/01621459.1990.10475307
[21] Parzen,E,关于概率密度函数和模式的估计,Ann Math Stat,331065-1076,(1962)·Zbl 0116.11302号 ·doi:10.1214/aoms/1177704472
[22] Riani,M;AC Atkinson,《在回归中测试多个离群值的正向搜索的快速校准》,Adv Data Anal Classif,1123-141,(2007)·Zbl 1301.62069号 ·doi:10.1007/s11634-007-0007-y
[23] Riani,M;阿特金森,AC;Cerioli,A,《发现未知数量的多元异常值》,J R Stat Soc Ser B(Stat Methodol),71,447-466,(2009)·Zbl 1248.62091号 ·doi:10.1111/j.1467-9868.2008.00692.x
[24] Rosenblatt,M,关于密度函数的一些非参数估计的评论,Ann Math Stat,27832-837,(1956)·Zbl 0073.14602号 ·doi:10.1214/aoms/1177728190
[25] Rousseeuw,PJ,最小二乘回归中值,美国统计协会杂志,79,871-880,(1984)·Zbl 0547.62046号 ·doi:10.1080/01621459.1984.10477105
[26] Rousseeuw PJ,Leroy AM(1987)稳健回归和异常值检测。纽约威利·Zbl 0711.62030号 ·doi:10.1002/0471725382
[27] 夏皮罗,SS;Wilk,MB,正态性方差检验分析(完整样本),Biometrika,52,591-611,(1965)·Zbl 0134.36501号 ·doi:10.2307/2333709
[28] 护套,SJ;Jones,MC,用于核密度估计的可靠的基于数据的带宽选择方法,J R Stat Soc Ser B(Methodol),53683-690,(1991)·Zbl 0800.62219
[29] Silverman BW(1986)统计和数据分析密度估计。查普曼和霍尔/CRC,伦敦·兹比尔0617.62042 ·doi:10.1007/978-1-4899-3324-9
[30] Zambom AZ,Dias R(2012年)。核密度估计及其在计量经济学中的应用综述。arXiv预打印arXiv:1212.2812
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。