×

快速计算Tukey修剪区域和维数中值(p>2)。 (英语) Zbl 07499086号

摘要:给定\(\mathbb{R}^p\)中的数据,Tukey\(\kappa\)修剪区域是所有点的集合,这些点在数据中至少具有Tukey深度\(\kappa\)。由于Tukey区域具有直观性、仿射等变性和鲁棒性,因此在非参数多变量分析中是有用的工具。虽然这些区域很容易定义和解释,但由于缺乏有效的维数计算程序(p>2),它们在应用中的实际应用受到了阻碍。我们构造了两种新的算法来计算Tukey(kappa)修剪区域,一种是原始算法,另一种是比已知算法快得多的复杂算法。此外,还导出了Tukey区域的面数的严格界。在一个大型仿真研究中,将新的快速算法与天真算法进行了比较,后者速度较慢,而且构造精确,在任何情况下都会得到相同的正确结果。最后,将该方法扩展到计算最内层Tukey区域及其重心Tukey中值的算法。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Adler,D.、Murdoch,D.、Nenadic,O.、Urbanek,S.、Chen,M.、Gebhardt,A.、Bolker,B.、Csardi,G.、Strzelecki,A.、Senger,A.、R核心团队和Eddelbuettel,D.(2018),rgl:使用OpenGL的3D可视化,R包版本0.99.16。
[2] 阿扎里尼,A。;Capitanio,A.,“多元偏正态分布的统计应用”,《皇家统计学会杂志》,B辑,6579-602(1999)·Zbl 0924.62050号 ·doi:10.1111/1467-9868.00194
[3] 巴伯,C.B。;Dobkin,D.P。;Huhdanpaa,H.,“凸壳的Quickhull算法”,ACM数学软件汇刊,22469-483(1996)·Zbl 0884.65145号 ·doi:10.1145/235815.235821
[4] Barber,C.B.和Mozharovskyi,P.(2018),TukeyRegion:Tukey Region and Median,R包版本0.1.2。内政部:。
[5] 卡斯科斯,I。;Molchanov,I.,“多元风险与深度限制区域”,《金融与随机》,第11期,第373-397页(2007年)·Zbl 1164.91027号 ·doi:10.1007/s00780-007-0043-7
[6] Donoho,D.,多元位置估计的分解特性(1982)
[7] Dua,D.和Karra Taniskidou,E.(2017),“UCI机器学习库”
[8] Dyckerhoff,R.,“满足投影特性的数据深度,澳大利亚统计分析协会:统计分析进展,88163-190(2004)·Zbl 1294.62112号 ·doi:10.1007/s101820400167
[9] Dyckerhoff,R。;Mozharovskyi,P.,“半空间深度的精确计算”,计算统计与数据分析,98,19-30(2016)·Zbl 1468.62048号 ·doi:10.1016/j.csda.2015.12.011
[10] Hallin,M。;Paindaveine,D。;Šiman,M.,“多变量量化器和多输出回归量化器:从l_1优化到半空间深度”,《统计学年鉴》,38635-669(2010)·Zbl 1183.62088号 ·doi:10.1214/09-AOS723
[11] 休伯特,M。;Rousseeuw,P.J。;Segaert,P.,“多元函数异常值检测”,统计方法与应用,24177-202(2015)·Zbl 1441.62124号 ·doi:10.1007/s10260-015-0297-8
[12] Kong,L。;Mizera,I.,“分位数层析成像:使用分位数与多元数据”,《统计中国》,第22期,第1589-1610页(2012年)·Zbl 1359.62175号
[13] 李,J。;Cuesta-Albertos,J.A。;Liu,R.Y.,“DD-分类器:基于DD-Plot的非参数分类方法”,美国统计协会杂志,107,737-753(2012)·Zbl 1261.62058号 ·doi:10.1080/01621459.2012.688462
[14] Liu,R.Y。;Parelius,J.M。;Singh,K.,《基于数据深度的多元分析:描述性统计、图形和推断》(Liu和Singh讨论并重编),《统计年鉴》,27783-858(1999)·Zbl 0984.62037号
[15] Liu,X.,“快速实现Tukey深度”,计算统计学,321395-1410(2017)·Zbl 1417.65048号 ·doi:10.1007/s00180-016-0697-8
[16] 刘,X。;Zuo,Y.,“计算投影深度及其相关估计”,《统计与计算》,24,51-63(2014)·Zbl 1325.62014号 ·doi:10.1007/s11222-012-9352-6
[17] 刘,X。;罗,S。;Zuo,Y.,“Tukey半空间中值计算的一些结果”,统计论文(2017)·Zbl 1437.62100号 ·doi:10.1007/s00362-017-0941-5
[18] Loader,C.(2013),locfit:局部回归、可能性和密度估计,R包版本1.5-9.1。
[19] Miller,K。;Ramaswami,S。;卢梭,P。;Sellarès,J.A。;Souvaine,D。;斯特里努,I。;Struyf,A.,《利用计算几何、统计和计算方法有效计算位置深度等高线》,第13期,第153-162页(2003年)
[20] 莫斯勒,K。;Bazovkin,P.,“具有失真风险约束的随机线性规划”,OR Spectrum,36949-969(2014)·Zbl 1305.90321号 ·doi:10.1007/s00291-0114-0372-9
[21] 莫斯勒,K。;兰格,T。;Bazovkin,P.,“计算维数d>2的带状修剪区域”,《计算统计与数据分析》,第53期,第2500-2510页(2009年)·兹比尔1453.62159 ·doi:10.1016/j.csda.2009.01.017
[22] Paindaveine,D。;Šiman,M.,“关于定向多输出分位数回归”,《多元分析杂志》,102193-212(2011)·Zbl 1328.62311号 ·doi:10.1016/j.jmva.2010.08.004
[23] Paindaveine,D。;Šiman,M.,“计算多输出回归分位数区域,计算统计学和数据分析,56840-853(2012)·Zbl 1244.62060号
[24] Paindaveine,D。;Šiman,M.,“从投影分位数计算多重输出回归分位数区域,计算统计,27,29-49(2012)·Zbl 1304.65060号
[25] Pokotylo,O.、Mozharovskyi,P.、Dyckerhoff,R.和Nagy,S.(2018),ddalpha:基于深度的分类和数据深度计算,R包版本1.3.4。
[26] R核心团队,R:A Language and Environment for Statistical Computing(2018),奥地利维也纳:R统计计算基金会,奥地利维也纳
[27] 雷文,G.M。;Miller,R.G.,“利用多维分析确定化学性糖尿病本质的尝试”,《糖尿病》,第16期,第17-24页(1979年)·doi:10.1007/BF00423145
[28] Rousseeuw,P.J。;Leroy,A.M.,《稳健回归和异常值检测》(1987),纽约:威利出版社,纽约·Zbl 0711.62030号
[29] Rousseeuw,P.J。;Ruts,I.,“构建二元Tukey中值”,《中国统计》,第8827-839页(1998年)·Zbl 0905.62029号
[30] Rousseeuw,P.J。;车辙,I。;Tukey,J.W.,“Bagplot:二元箱线图”,《美国统计学家》,53382-387(1999)·doi:10.2307/2686061
[31] Rousseeuw,P.J。;Struyf,A.,《在高维中计算位置深度和回归深度》,统计与计算,8193-203(1998)·doi:10.1023/A:1008945009397
[32] 车辙,I。;Rousseeuw,P.J.,“计算二元点云的深度等值线”,计算统计和数据分析,23,153-168(1996)·Zbl 0900.62337号 ·doi:10.1016/S0167-9473(96)00027-8
[33] Serfling,R。;Liu,R.Y。;Serfling,R。;Souvaine,D.L.,《数据深度:稳健多元分析、计算几何与应用》,非参数多元推理中的深度函数,1-16(2006),普罗维登斯,RI:美国数学学会,普罗维登斯,RI
[34] Struyf,A.J。;Rousseeuw,P.J.,“半空间深度和回归深度表征经验分布”,《多元分析杂志》,69,135-153(1999)·Zbl 1070.62509号 ·doi:10.1006/jmva.1998.1804
[35] Theussl,S.和Hornik,K.(2017),Rglpk:R/GNU线性编程工具包接口,R包版本0.6-3。
[36] Tukey,J.W。;James,R.,《国际数学家大会论文集》,2,《数学与数据图像》,523-531(1975),蒙特利尔:加拿大数学大会,蒙特利尔·兹伯利0347.62002
[37] Šiman,M.和Boček,P.(2016),modQR:多输出定向分位数回归,R包版本0.1.1·兹比尔1374.62002
[38] Yeh,A.B。;Singh,K.,《基于Tukey深度和Bootstrap的平衡置信区间》,《皇家统计学会杂志》,B辑,59,639-652(1997)·Zbl 1090.62539号 ·doi:10.1111/1467-9868.00088
[39] 是的,I.-C。;Yang,K.-J。;Ting,T.-M,“使用伯努利序列的RFM模型知识发现”,专家系统与应用,3685866-5871(2009)·doi:10.1016/j.eswa.2008.07.018
[40] Zuo,Y。;Serfling,R.,“统计深度函数的一般概念”,《统计年鉴》,28,461-482(2000)·Zbl 1106.62334号 ·doi:10.1214/aos/1016218226
[41] Zuo,Y。;Serfling,R.,样本统计深度函数等高线的结构性质和收敛结果,《统计年鉴》,28,483-499(2000)·Zbl 1105.62343号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。