×

Hill估计值的数据自适应调整和重尾数据极值中异常值的检测。 (英语) Zbl 1418.62215号

摘要:我们介绍了重尾分布指数的Hill估计量的一个修正版本,它对极端顺序统计中的扰动具有鲁棒性。在理想的Pareto设置下,在给定严格上分解点的所有无偏估计量中,估计量本质上是有限样本有效的。对于一般重尾模型,我们在二阶正则变分条件下建立了估计量的渐近正态性,并证明了它在Hall分布类中是最小最大速率最优的。我们还开发了一种自动的、数据驱动的方法来选择修剪参数,该方法产生了一种新型的稳健估计器,可以适应极端情况下未知的污染水平。这种自适应稳健性使得我们的估计器特别有吸引力,并且在数据的极值受到污染的情况下优于其他稳健性估计器。作为数据驱动的修剪参数选择的一个重要应用,我们获得了一种原则性识别重尾数据中极端异常值的方法。事实上,该方法已被证明能够正确识别先前探索的Condroz数据集中的异常值数量。

MSC公司:

62G32型 极值统计;尾部推断
62G35型 非参数稳健性
62G30型 订单统计;经验分布函数
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] M.Kallitsis、S.A.Stoev、S.Bhattacharya和G.Michailidis。Amon:一种开源架构,用于在线监测、统计分析和取证多千兆比特流。,IEEE通讯选定领域杂志,34(6):1834-18482016年6月。
[2] I.B.Aban、M.M.Meerschaert和A.K.Panorska。截断Pareto分布的参数估计。,《美国统计协会杂志》,101:270-2772006年·Zbl 1118.62312号 ·doi:10.1198/01621450050000411
[3] M.Ahsanullah、V.Nevzorov和M.Shakil。《顺序统计导论》,《亚特兰蒂斯概率统计研究》第3卷。亚特兰蒂斯出版社,巴黎,2013年·Zbl 1276.62029号
[4] J.Beirlant、Ch.Bouquiaux和B.Werker。尾部指数估计的半参数下界。,统计规划与推断杂志,136(3):705-7292006·Zbl 1077.62039号 ·doi:10.1016/j.jspi.2004.08.018
[5] J.Beirlant、P.Vynckier和J.L.Teugels。尾指数估计、帕累托分位数图和回归诊断。,美国统计协会杂志,436(91):1659-16671996·Zbl 0881.62077号
[6] J.Beirlant、I.Fraga Alves和I.Gomes。截断和非截断Pareto型分布的尾部拟合。,极端,19(3):429-4622016·Zbl 1360.62244号 ·doi:10.1007/s10687-016-0247-3
[7] J.Beirlant、Y.Goegebeur、J.Teugels和J.Segers。极值统计:理论与应用。,概率统计威利级数。约翰·威利父子公司,奇切斯特,2004年·Zbl 1070.62036号
[8] J.Beirlant、A.Guillou、G.Dierckx和A.Fils Villetard。随机截尾下极值指数和极值分位数的估计,极值,10(3):151-1742007·兹比尔1157.62027 ·数字对象标识代码:10.1007/s10687-007-0039-x
[9] CASdatasets包。,频率集合,http://cas.uqam.ca/pub/R/web/CASdatasets-manual.pdf第42页。
[10] N.H.Bingham、C.M.Goldie和J.L.Teugels。,定期变更。数学及其应用百科全书排名第一。剑桥大学出版社,1989年·Zbl 0667.26003号
[11] 圣布歇伦和M.托马斯。尾部指数估计、集中度和自适应性。,《电子统计杂志》,9(2):2751-27922015·Zbl 1352.60025号 ·doi:10.1214/15-EJS1088
[12] V.Brazauskas和R.Serfling。基于广义分位数统计的双参数Pareto和指数模型尾部参数的稳健估计。,极端,3(3):231-2492001年,2000年·Zbl 0979.62016年 ·doi:10.1023/A:1011455027066
[13] 布热津斯基(M.Brzezinski)。帕累托尾部指数的稳健估计:蒙特卡罗分析。,实证经济学,51(1):1-30,2016。
[14] J.Danielsson、L.de Haan、L.Peng和C.G.de Vries。用bootstrap方法选择尾部指数估计中的样本分数。,《多元分析杂志》。,76(2):226-248, 2001. ·Zbl 0976.62044号 ·doi:10.1006/jmva.2000.1903
[15] L.de Haan和A.Ferreira。极值理论简介。,《Springer运筹学和金融工程系列》,Springer,纽约,2006年·Zbl 1101.62002号
[16] H.Drees和E.Kaufmann。一元极值估计中最佳样本分数的选择。,随机过程及其应用,75(2):149-1721998·Zbl 0926.62013号 ·doi:10.1016/S0304-4149(98)00017-9
[17] D.Dupuis和M.-P.Victoria-Feser。上尾翼Pareto建模的稳健预测误差准则。,加拿大统计杂志,34(4):639-3582006·兹比尔1115.62056 ·doi:10.1002/cjs.5550340406
[18] Ch.Dutang、Y.Goegebeur和A.Guillou。尾部相关系数的稳健和偏差修正估计。,保险数学。经济。,57:46-57, 2014. ·兹比尔1304.62073 ·doi:10.1016/j.insmateco.2014.05.003
[19] P.Embrechts、C.Klüppelberg和T.Mikosch。,极端事件建模。Springer-Verlag,纽约,1997年·Zbl 0873.62116号
[20] M.Finkelstein、H.G.Tucker和J.A.Veeh。重新评估帕累托尾部指数估计。,北美精算杂志,10(1):1-102006·Zbl 1478.62073号
[21] Y.Goegebeur、A.Guillou和A.Verster。重尾分布极值分位数的稳健渐近无偏估计。,统计师。普罗巴伯。莱特。,87:108-114, 2014. ·Zbl 1288.62077号 ·doi:10.1016/j.spl.2014.01.010
[22] F.R.Hampel、E.M.Ronchetti、P.J.Rousseeuw、W.A.Stahel。稳健统计:基于影响函数的方法。,概率和数理统计中的威利级数。概率与数理统计,2005年·Zbl 0593.62027号
[23] P.霍尔。关于正则变化指数的一些简单估计。,J.罗伊。美国统计协会,44:37-421982年。B系列·Zbl 0521.62024号 ·doi:10.1111/j.2517-6161.1982.tb01183.x
[24] P.霍尔和A.H.威尔士。正则变分参数估计的最佳可达收敛速度。,《统计年鉴》,12(3):1079-10841984·Zbl 0539.62048号 ·doi:10.1214/aos/1176346723
[25] P.霍尔和A.H.威尔士。规则变化参数的自适应估计。,安.统计师。,13,《统计年鉴》,12(3):331-3411985年·Zbl 0605.62033号 ·doi:10.1214/aos/1176346596
[26] B.M.希尔。推断分布尾部的简单通用方法。,《统计年鉴》,3:1163-11741975年·Zbl 0323.62033号 ·doi:10.1214/aos/1176343247
[27] P.J.Huber。位置参数的鲁棒估计。,数理统计年鉴;35:73-101964年·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[28] K.奈特。Hill估计器的一个简单修改,应用于鲁棒性和偏差减少。,技术报告。http://www.utstat.utoronto.ca/keith/papers/robusthill.pdf。
[29] Trimmed Hill估计器:稳健自适应尾部推断。,闪亮应用程序。https://shrijita-apps.shinyapps.io/adaptive-trimmed-hill/。
[30] trHill:上截断数据的Hill估计量。,https://rdrr.io/cran/ReIns/man/trHill.html。
[31] E.L.Lehmann和G.Casella。,点估计理论。斯普林格·Zbl 0916.62017号
[32] L.Peng和A.H.Welsh。广义Pareto分布的稳健估计。,极端,4(1):53-652001·Zbl 1008.62024号 ·doi:10.1023/A:1012233423407
[33] J.Pickands。使用极值顺序统计的统计推断。,安.统计师。,3:119-131, 1975. ·Zbl 0312.62038号 ·doi:10.1214/aos/1176343003
[34] S.I.Resnick。重尾现象:概率和统计建模。,《Springer运筹学和金融工程系列》,Springer,纽约,2007年·Zbl 1152.62029号
[35] G.Yuri、V.Planchon、J.Beirlant和O.Robert。使用极值方法对土壤化学数据进行质量评估。,《应用科学杂志》,2005年5月。
[36] B.Vandewalle、J.Beirlant、A.Christmann和M.Hubert。Pareto型分布尾部指数的稳健估计。,计算。统计数据分析。,51(12):6252-62682007年8月·Zbl 1445.62102号 ·doi:10.1016/j.csda.2007.01.003
[37] B.Vandewalle、J.Beirlant、A.Christmann和M.Hubert。基于指数回归模型的尾指数稳健估计。,最近稳健方法的理论与应用,367-3762004年1月·Zbl 1088.62064号
[38] M.-P.Victoria-Feser和E.Ronchetti。个人收入分配模型的稳健方法。,《加拿大统计杂志》,22(2):247-2581994·Zbl 0801.62099号 ·doi:10.2307/315587
[39] J.Zou、R.Davis和G.Samorodnitsky。没有最大值的极值分析:可以做什么?,技术报告。https://people.orgie.cornell.edu/gennady/techpreports/StrangeHill.pdf。 ·Zbl 1440.62174号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。