×

多变量函数异常值检测。 (英语) Zbl 1441.62124号

摘要:功能数据在实践中越来越频繁地出现,并且已经开发了各种统计技术来分析它们。在本文中,我们考虑多元函数数据,其中对于每条曲线和每个时间点,观测到一个(p)维测量向量。对于功能数据,离群值检测的研究最近才开始,并且大多局限于单变量曲线(p=1)。本文建立了函数异常值的分类,并构造了新的数值和图形技术来检测多元函数数据中的异常值,其中一元曲线是一种特例。我们的工具包括统计深度函数和从中导出的距离度量。我们研究的方法是(p)维空间中的仿射不变量,并且不假设椭圆或任何其他对称性。

MSC公司:

62小时05 多元概率分布的表征与结构理论;连接线
62甲12 多元分析中的估计
62G35型 非参数稳健性
62兰特 功能数据分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Arribas-Gil A,Romo J(2014),功能数据的形状异常检测和可视化:异常图。生物统计学15(4):603-619·doi:10.1093/biostatistics/kxu006
[2] Bache K,Lichman M(2013)UCI机器学习库。http://archive.ics.uci.edu/ml ·Zbl 1452.62074号
[3] Bai ZD,He X(1999)回归和多元位置最大深度估计的渐近分布。Ann Stat 27(5):1616-1637·兹比尔1007.62009 ·doi:10.1214/aos/1017939144
[4] Berrendero J,Justel A,Svarc M(2011),多元函数数据的主成分。计算统计数据分析55(9):2619-2634·Zbl 1464.62025号 ·doi:10.1016/j.csda.2011.03.011
[5] Brys G、Hubert M、Struyf A(2004)《偏度的稳健度量》。计算机图形统计杂志13:996-2017·doi:10.1198/106186004X12632
[6] Brys G,Hubert M,Rousseeuw PJ(2005)《独立成分分析的稳健化》。化学杂志19:364-375·doi:10.1002/cem.940
[7] Claeskens G、Hubert M、Slaets L、Vakili K(2014)《多元函数半空间深度》。美国统计协会期刊109(505):411-423·Zbl 1367.62162号 ·doi:10.1080/01621459.2013.856795
[8] Cuevas A,Febrero M,Fraiman R(2006)关于使用bootstrap估计函数数据。计算统计数据分析51(2):1063-1074·兹比尔1157.62390 ·doi:10.1016/j.csda.2005.10.012
[9] Cuevas A,Febrero M,Fraiman R(2007)通过基于投影的深度概念对函数数据进行稳健估计和分类。计算统计22:481-496·Zbl 1195.62032号 ·doi:10.1007/s00180-007-0053-0
[10] Dang X,Serfling R(2010)非参数基于深度的多元离群值标识符和掩蔽稳健性特性。J Stat Plan推断140(1):198-213·Zbl 1191.62084号 ·doi:10.1016/j.jspi.2009.07.004
[11] Donoho D(1982)多元位置估计的分解性质。博士资格论文。波士顿哈佛大学统计系·Zbl 0900.62337号
[12] Donoho D,Gasko M(1992)基于半空间深度和投影边距的位置估计的分解特性。Ann Stat 20(4):1803-1827年·Zbl 0776.62031号 ·doi:10.1214/aos/1176348890
[13] Dyrby M、Engelsen S、Nörgaard L、Bruhn M、Lundsberg-Nielsen L(2002)使用近红外(NIR)透射率和NIR FT-Raman光谱对药片中的活性物质进行化学计量量化。应用光谱学56(5):579-585·doi:10.1366/0003702021955358
[14] Esbensen K(2001)《实践中的多元数据分析》,第5版。挪威特隆赫姆Camo Software
[15] Febrero Bande M,Galeano P,González Manteiga W(2008)通过深度测量在功能数据中进行异常值检测,并应用于识别异常的NOx水平。环境计量19(4):331-345·doi:10.1002/env.878
[16] Ferraty F,Vieu P(2006),非参数函数数据分析:理论与实践。纽约州施普林格·Zbl 1119.62046号
[17] Fraiman R,Muniz G(2001)功能数据的修剪方法。测试10:419-440·Zbl 1016.62026号 ·doi:10.1007/BF02595706
[18] Hallin M,Paindaveine D,Šiman M(2010)多元分位数和多输出回归分位数:从L1优化到半空间深度。安统计38(2):635-669·Zbl 1183.62088号 ·doi:10.1214/09-AOS723
[19] He X,Wang G(1997)多元数据集深度等值线的收敛性。Ann Stat 25(2):495-504·Zbl 0873.62053号 ·doi:10.1214操作系统/1031833661
[20] Hubert M,Vandervieren E(2008):倾斜分布的调整箱线图。计算统计数据分析52(12):5186-5201·兹比尔1452.62074 ·doi:10.1016/j.csda.2007.11.008
[21] Hubert M,Van der Veeken S(2008),偏态数据的离群检测。化学杂志22:235-246·doi:10.1002/cem.1123
[22] Hubert M,Van der Veeken S(2010)《偏斜数据的稳健分类》。高级数据分析类4:239-254·Zbl 1284.62378号 ·doi:10.1007/s11634-010-0066-3
[23] Hubert M,Claeskens G,De Ketelaere B,Vakili K(2012)检测离群曲线的新深度方法。收件人:Colubi A、Fokianos K、Gonzalez-Rodriguez G、Kontoghiorghes E(eds)《2012年COMPSTAT会议记录》,第329-340页·Zbl 1028.62042号
[24] Hyndman R(1996)计算和绘制最高密度区域。美国统计局50:120-126
[25] Hyndman R,Shang H(2010)功能数据的彩虹图、bagplot和箱线图。J计算图形统计19(1):29-45·doi:10.1198/jcgs.2009.08158
[26] Ieva F,Paganoni AM(2013)多元功能数据的深度测量。公共统计理论方法42(7):1265-1276·Zbl 1347.62093号 ·doi:10.1080/03610926.2012.746368
[27] Larsen F、van den Berg F、Engelsen S(2006年)《餐酒核磁共振波谱的探索性化学计量学研究》。化学杂志20(5):198-208·doi:10.1002/cem.991
[28] Liu R(1990)关于基于随机单形的数据深度概念。Ann Stat 18(1):405-414·Zbl 0701.62063号 ·doi:10.1214/aos/1176347507
[29] Liu X,Zuo Y(2014)计算半空间深度和回归深度。公共统计模拟计算43(5):969-985·Zbl 1291.62059号 ·doi:10.1080/03610918.2012.720744
[30] López-Pintado S,Romo J(2009)《关于功能数据深度的概念》。美国统计协会杂志104:718-734·Zbl 1388.62139号 ·doi:10.1198/jasa.2009.0108
[31] López-Pintado S,Romo J(2011)功能数据的半区域深度。计算机统计数据分析55:1679-1695·Zbl 1328.62029号 ·doi:10.1016/j.csda.2010.10.024
[32] López-Pintado S,Sun Y,Lin J,Genton M(2014)多元函数数据的简单带深度。高级数据分析类8:321-338·Zbl 1414.62066号 ·doi:10.1007/s11634-014-0166-6
[33] Maronna R、Martin D、Yohai V(2006)《稳健统计:理论和方法》。纽约威利·邮编1094.62040 ·doi:10.1002/0470010940
[34] MasséJC(2004)Tukey深度过程的渐近性,以及对多元修剪平均值的应用。伯努利10(3):397-419·Zbl 1053.62021号 ·doi:10.3150/bj/1089206404
[35] MasséJC,Theodorescu R(1994),二元分布的半平面修剪。多变量分析杂志48(2):188-202·Zbl 0790.60024号 ·doi:10.1006/jmva.1994.1002
[36] Mizera I,Volauf M(2002)《半空间深度轮廓和最大深度估计器的连续性:深度相关方法的诊断》。多变量分析杂志83(2):365-388·Zbl 1028.62042号 ·doi:10.1006/jmva.2001.2053
[37] 莫斯勒,K。;Becker,C.(编辑);Fried,R.(编辑);Kuhnt,S.(编辑),深度统计,17-34(2013),柏林·doi:10.1007/978-3-642-35494-62
[38] Paindavane D,Šiman M(2012)计算多输出回归分位数区域。计算统计数据分析56:840-853·Zbl 1244.62060号 ·doi:10.1016/j.csda.2010.11.014
[39] Pigoli D,Sangalli L(2012)《函数数据分析中的小波:多维曲线及其导数的估计》。计算统计数据分析56(6):1482-1498·Zbl 1243.62077号 ·doi:10.1016/j.csda.2011.12.016
[40] Ramsay J,Silverman BW(2002)应用功能数据分析。统计学中的斯普林格系列。柏林施普林格·Zbl 1011.62002号
[41] Ramsay J,Silverman BW(2006),功能数据分析,第2版。纽约州施普林格
[42] Ramsay JO,Li X(1998)曲线注册。J R Stat Soc系列B 60(2):351-363·Zbl 0909.62033号 ·doi:10.111/1467-9868.00129
[43] Romanazzi M(2001)半空间深度的影响函数。多变量分析杂志77:138-161·兹比尔1033.62047 ·doi:10.1006/jmva.2000.1929
[44] Rousseeuw PJ,Leroy A(1987)稳健回归和异常值检测。Wiley-Interscience,纽约·兹比尔0711.62030 ·doi:10.1002/0471725382
[45] Rousseeuw PJ,Ruts I(1996),双变量位置深度。应用统计45:516-526·Zbl 0905.62002号 ·数字对象标识代码:10.2307/2986073
[46] Rousseeuw PJ,Ruts I(1998)构建双变量Tukey中值。统计Sin 8:827-839·Zbl 0905.62029号
[47] Rousseeuw PJ,Ruts I(1999)人口分布的深度函数。梅特里卡49:213-244·Zbl 1093.62540号
[48] Rousseeuw PJ,Struyf A(1998)计算高维中的位置深度和回归深度。统计计算8:193-203·doi:10.1023/A:1008945009397
[49] Rousseeuw PJ,Ruts I,Tukey J(1999)《bagplot:一个双变量箱线图》。美国统计局53:382-387
[50] Rousseeuw PJ,Debruyne M,Engelen S,Hubert M(2006)化学计量学中的稳健性和异常值检测。分析化学评论36:221-242·doi:10.1080/10408340600969403
[51] Ruts I,Rousseeuw PJ(1996)计算二元点云的深度轮廓。计算统计数据分析23:153-168·Zbl 0900.62337号 ·doi:10.1016/S0167-9473(96)00027-8
[52] Stahel W(1981)《稳健的Schätzungen:无穷小的最优解》。苏黎世理工学院博士论文·Zbl 0531.62036号
[53] Struyf A、Rousseeuw PJ(1999)半空间深度和回归深度描述了经验分布。多变量分析杂志69(1):135-153·Zbl 1070.62509号 ·doi:10.1006/jmva.1998.1804
[54] Struyf A,Rousseeuw PJ(2000),最深处的高维计算。计算统计数据分析34(4):415-426·Zbl 1046.62055号 ·doi:10.1016/S0167-9473(99)00112-7
[55] Sun Y,Genton M(2011)功能箱线图。J计算图形统计20(2):316-334·文件编号:10.1198/jcgs.2011.09224
[56] Tukey J(1977)探索性数据分析。马萨诸塞州雷丁市Addison-Wesley·Zbl 0409.62003号
[57] Wang K,Gasser T(1997)动态时间扭曲曲线对齐。Ann Stat 25(3):1251-1276·Zbl 0898.62051号 ·doi:10.1214/aos/1069362747
[58] Zuo Y(2003)基于投影的深度函数和相关中位数。Ann Stat 31(5):1460-1490·Zbl 1046.62056号 ·doi:10.1214/aos/1065705115
[59] Zuo Y,Serfling R(2000a)统计深度函数的一般概念。安统计28:461-482·Zbl 1106.62334号 ·doi:10.1214/aos/1016218226
[60] Zuo Y,Serfling R(2000b)关于相对于多元对称的一般概念的一些鲁棒非参数位置度量的性能。J Stat Plan推断84:55-79·Zbl 1131.62305号 ·doi:10.1016/S0378-3758(99)00142-1
[61] Zuo Y,Serfling R(2000c)样本统计深度函数等高线的结构特性和收敛结果。Ann统计28(2):483-499·Zbl 1105.62343号 ·doi:10.1214/aos/1016218227
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。