×

使用核方法进行探索性数据分析的尾密度估计。 (英语) Zbl 1412.62192号

在探索性数据分析的背景下,本文针对重尾和有界数据提出了一种变换核密度估计方法,该方法对与此类估计相关的阈值问题具有鲁棒性。首先讨论了系统的设计、特点和最优带宽估计。该研究进一步评估了尾部密度估计在直方图和模型选择方面的应用。理论框架最初伴随着对模拟的单变量和多变量数据的数值实验,最终在模拟澳大利亚极端温度值的全球气候模型上进行了实际验证。

MSC公司:

62页第12页 统计在环境和相关主题中的应用
62G32型 极值统计;尾部推断
62G35型 非参数稳健性
62小时12分 多元分析中的估计
62G07年 密度估算

关键词:

稳健性
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abramson,I.S.,《核估计中的带宽变化——平方根定律》,《统计年鉴》,1217-1223(1982)·Zbl 0507.62040号 ·doi:10.1214/aos/1176345986
[2] Balkema,A.A。;De Haan,L.,《大年龄剩余寿命》,《概率年鉴》,2792-804(1974)·Zbl 0295.60014号 ·doi:10.1214/aop/1176996548
[3] 贝兰特,J。;Goegebeur,Y。;Teugels,J。;Segers,J.,《极值统计:理论与应用》(2004),奇切斯特:约翰·威利父子公司
[4] Beranger,B.和Padoan,S.(2015),“极端依赖模型”,摘自极值建模与风险分析,编辑:Dipak K.Dey和Jun Yan,纽约:查普曼和霍尔/CRC,第325-352页·Zbl 1365.62173号
[5] 博兰塞,C。;M.Guillén。;古斯塔夫森,J。;Nielson,J.P.,《定量运营风险模型》(2012),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿·兹比尔1233.91003
[6] 博兰塞,C。;M.Guillen。;尼尔森,J.P.,精算损失函数的核密度估计,《保险:数学与经济学》,32,19-36(2003)·Zbl 1024.62041号
[7] 博兰塞,C。;M.Guillen。;Pelican,E。;Vernic,R.,《CTE风险度量的倾斜双变量模型和非参数估计》,《保险:数学和经济学》,43,386-393(2008)·Zbl 1156.91023号
[8] 鲍曼,A.W。;霍尔,P。;Titterington,D.M.,概率和概率密度非参数估计中的交叉验证,生物统计学,71,341-351(1984)·Zbl 0567.62031号 ·doi:10.1093/biomet/71.2.341
[9] Buch-Kroman,T。;吉伦,M。;林惇,O。;Nielsen,J.P.,《使用降维信息和尾部平坦变换的多元密度估计》,《保险:数学与经济学》,48,99-110(2011)·Zbl 1232.62055号
[10] Buch-Larsen,T。;尼尔森,J.P。;M.Guillén。;Bolancé,C.,使用Champernowne变换对重尾分布的核密度估计,统计学,39,503-516(2005)·Zbl 1095.62040号 ·doi:10.1080/02331880500439782
[11] Chacón,J.E。;Duong,T.,《无约束带宽矩阵的多变量插入式带宽选择》,Test,19375-398(2010)·Zbl 1203.62054号 ·文件编号:10.1007/s11749-009-0168-4
[12] Charpentier,A。;Flachaire,E.,收入分配的对数变换核密度估计,《经济实况》,91,141-159(2015)·doi:10.7202/1036917年
[13] Chen,S.X.,密度函数的贝塔核估计,计算统计与数据分析,31131-145(1999)·Zbl 0935.62042号 ·doi:10.1016/S0167-9473(99)00010-9
[14] Cheng,R.C.H。;Amin,N.A.K.,《来源转移的连续单变量分布中的参数估计》,英国皇家统计学会杂志。B系列,45,394-403(1983)·Zbl 0528.62017号
[15] Christopeit,N.,用矩方法估计极值分布的参数,统计规划与推断杂志,41,173-186(1994)·Zbl 0798.62033号 ·doi:10.1016/0378-3758(94)90162-7
[16] 克莱门茨,A。;休恩,S。;Lindsay,K.,Mobius-like映射及其在核密度估计中的应用,美国统计协会杂志,98,993-1000(2003)·Zbl 1045.62023号 ·doi:10.198/01621450300000945
[17] Coles,S.,《极值统计建模导论》(2001),伦敦:Springer-Verlag出版社,伦敦·Zbl 0980.62043号
[18] 科尔斯,S.G。;Tawn,J.A.,《多元极值的统计方法:在结构设计中的应用》,英国皇家统计学会杂志。C系列,43,1-48(1994)·Zbl 0825.62717号
[19] 科恩,T。;Purich,A。;Perkins,S。;Pezza,A。;Boschat,G。;Sadler,K.,《二十一世纪澳大利亚更频繁、更长和更热的热浪》,《气候杂志》,27,5851-5871(2014)·doi:10.1175/JCLI-D-14-00092.1
[20] 德卡瓦略,M。;Oumow,B。;Segers,J。;Warchoł,M.,二元尾部相关性的欧几里德似然估计,统计学中的通信——理论和方法,42,1176-1192(2013)·Zbl 1347.62075号 ·doi:10.1080/03610926.2012.709905
[21] De Haan,L。;费雷拉,A.,《极值理论:导论》(2006),纽约:施普林格出版社,纽约·Zbl 1101.62002号
[22] Drees,H。;黄,X.,稳定尾相关函数估计的最佳可达到收敛速度,多元分析杂志,64,25-46(1998)·Zbl 0953.62046号 ·doi:10.1006/jmva.1997.1708
[23] Duong,T。;Hazelton,M.L.,用于二元核密度估计的插入式带宽矩阵,非参数统计杂志,15,17-30(2003)·Zbl 1019.62032号 ·doi:10.1080/10485250306039
[24] Duong,T。;Hazelton,M.L.,用于多变量核密度估计的交叉验证带宽矩阵,斯堪的纳维亚统计杂志,32485-506(2005)·Zbl 1089.62035号 ·doi:10.1111/j.1467-9469.2005.00445.x
[25] Einmahl,J.H.J。;De Haan,L。;Piterbarg,V.I.,极值分布谱测度的非参数估计,统计年鉴,291401-1423(2001)·Zbl 1043.62046号 ·doi:10.1214/aos/1013203459
[26] Einmahl,J.H.J。;Krajina,A。;Segers,J.,尾部相关性的矩估计方法,Bernoulli,14,1003-1026(2008)·Zbl 1155.62017号 ·doi:10.3150/08-BEJ130
[27] Einmahl,J.H.J。;Krajina,A。;Segers,J.和AnM(M)-任意维尾部相关性的估计,《统计年鉴》,第40期,1764-1793页(2012年)·Zbl 1257.62058号 ·doi:10.1214/12-AOS1023
[28] Einmahl,J.H.J。;Segers,J.,极值分布谱测度的最大经验似然估计,《统计年鉴》,372953-2989(2009)·Zbl 1173.62042号 ·doi:10.1214/08-AOS677
[29] 福克,M。;Hüsler,J。;Reiss,R.-D.,《小数字定律:极端和罕见事件》(2011),巴塞尔:Birkhäuser/Springer Basel AG,巴塞尔·Zbl 1213.62082号
[30] Fischer,E.M。;美国拜尔。;Knutti,R.,《气候极端的稳健空间聚合预测》,《自然气候变化》,1033-1038(2013)·doi:10.1038/nclimate2051
[31] Flato,G.、Marotzke,J.、Abiodun,B.、Braconnot,P.、Chou,S.、Collins,W.、Cox,P.和Driouech,F.、Emori,S..、Eyring,V.、Forest,C.、Gleckler,P.,Guilyardi,E.、Jakob,C.、Kattsov,V.,Reason,C.和Rummukainen,M.(2013),《气候模型评估》,in2013年气候变化:物理科学基础。第一工作组对政府间气候变化专门委员会第五次评估报告的贡献编辑:T.Stocker、D.Qin、G.-K.Plattner、M.Tignor、S.Allen、J.Boschung、A.Nauels、Y.Xia、V.Bex和P.Midgley,英国剑桥和美国纽约:剑桥大学出版社,第741-866页。
[32] Gasser,T.和Müller,H.-G.(1979),“回归函数的核估计”,in曲线估计的平滑技术,编辑T.Gasser和M.Rosenblatt,柏林:施普林格出版社,第23-68页。
[33] Geenens,G.,单位区间核密度估计的Probit变换,美国统计协会杂志,109346-358(2014)·Zbl 1367.62107号 ·doi:10.1080/01621459.2013.842173
[34] 霍尔,P。;Marron,J.S。;Park,B.U.,平滑交叉验证,概率论及相关领域,92,1-20(1992)·Zbl 0742.62042号 ·doi:10.1007/BF01205233
[35] 霍尔,P。;Tajvidi,N.,二元极值分布的分布和依赖函数估计,伯努利,6835-844(2000)·Zbl 1067.62540号 ·doi:10.2307/3318758
[36] Hill,B.M.,《关于分布尾部推断的简单通用方法》,《统计年鉴》,第3期,第1163-1174页(1975年)·Zbl 0323.62033号 ·doi:10.1214/aos/1176343247
[37] Hosking,J.R.M.,算法AS 215:广义极值分布参数的最大似然估计,英国皇家统计学会杂志。C系列,34301-310(1985)
[38] 霍斯金,J.R.M。;Wallis,J.R。;Wood,E.F.,用概率加权矩法估计广义极值分布,技术计量学,27251-261(1985)·doi:10.1080/00401706.1985.10488049
[39] Huang,X.(1992),“二元极值统计”,伊拉斯谟大学博士论文。
[40] Hüsler,J。;Reiss,R.-D.,《正态随机向量的最大值:独立与完全依赖之间》,《统计学与概率论快报》,第7期,第283-286页(1989年)·Zbl 0679.62038号 ·doi:10.1016/0167-7152(89)90106-5
[41] Z.Jin。;Shao,Y.,关于多元分布函数的核估计,统计与概率信件,41163-168(1999)·Zbl 0909.62032号 ·doi:10.1016/S0167-7152(98)00138-2
[42] Joe,H.,最小多元指数和多元极值分布族,统计与概率信件,975-81(1990)·Zbl 0686.62035号 ·doi:10.1016/0167-7152(90)90098-R
[43] Jones,D.A。;Wang,W。;Fawcett,R.,《澳大利亚高质量空间气候数据集》,《澳大利亚气象和海洋学杂志》,58233-248(2009)·数字对象标识代码:10.22499/2.5804.003
[44] 科茨,S。;Nadarajah,S.,《极值分布:理论与应用》(2000),伦敦:帝国学院出版社,伦敦·Zbl 0960.62051号
[45] Loftsgaarden,D.O。;Quesenberry,C.P.,多元密度函数的非参数估计,数理统计年鉴,361049-1051(1965)·Zbl 0132.38905号 ·doi:10.1214/aoms/1177700079
[46] 碱液,L。;Hapurachchi,K。;Ryan,S.,极值可靠性函数的Bayes估计,IEEE可靠性事务,42641-644(1993)·Zbl 0797.62093号 ·数字对象标识代码:10.1109/24.273598
[47] Macleod,A.J.,备注AS R76:关于算法AS 215的备注:广义极值分布参数的最大似然估计,英国皇家统计学会杂志。C系列,38,198-199(1989)
[48] 马格努斯,J.R。;Neudecker,H.,《矩阵微分学及其在统计学和计量经济学中的应用》(1999),奇切斯特:约翰·威利父子出版社·Zbl 0912.15003号
[49] Marcon,G.、Padoan,S.A.、Naveau,P.和Muliere,P.(2014),“使用伯恩斯坦多项式对Pickands依赖函数的多元非参数估计”,arXiv:1405.5228. ·Zbl 1359.62191号
[50] 马里茨,J.S。;Munro,A.H.,《广义极值分布在估计极端百分位数中的应用》,生物统计学,23,79-103(1967)·doi:10.2307/2528283
[51] Markovich,N.,《单变量重尾数据的非参数分析:研究与实践》(2007),奇切斯特:约翰·威利父子公司·Zbl 1156.62027号
[52] Perkins,S.E。;莫伊斯,A。;惠顿,P。;Katzfey,J.,《澳大利亚气候极值的区域变化——区域动力降尺度与全球气候模型模拟的比较》,《国际气候学杂志》,34,3456-3478(2014)·doi:10.1002/joc.3927
[53] Perkins,S.E。;Pitman,A.J。;新泽西州霍尔布鲁克。;Mcaneney,J.,使用概率密度函数评估AR4气候模型模拟的澳大利亚日最高温度、最低温度和降雨量,气候杂志,204356-4376(2007)·doi:10.1175/JCLI4253.1
[54] Perkins,S.E。;Pitman,A.J。;Sisson,S.A.,《澳大利亚AR4模式预测中未来20年温度极值的系统差异与模式技巧的关系》,《国际气候学杂志》,33,1153-1167(2013)·doi:10.1002/joc.3500
[55] Pickands Iii,J.,《使用极端顺序统计的统计推断》,《统计年鉴》,3119-131(1975)·Zbl 0312.62038号 ·doi:10.1214/aos/1176343003
[56] Pitt,D.和Guillen,M.(2010),“二元正保险索赔严重性分布的参数和非参数模型简介”,技术代表。
[57] 普雷斯科特,P。;Walden,A.T.,广义极值分布参数的最大似然估计,生物统计学,67723-724(1980)·doi:10.1093/biomet/67.3.723
[58] 鲁岑,H。;Segers,J。;Wadsworth,J.L.,阈值模型的多元峰值,极值,21115-145(2017)·Zbl 1390.62083号 ·doi:10.1007/s10687-017-0294-4
[59] 鲁特泽恩,H。;Tajvidi,N.,多元广义帕累托分布,伯努利,12917-930(2006)·Zbl 1134.62028号 ·doi:10.3150/bj/1161614952
[60] Rudemo,M.,直方图和核密度估计的经验选择,斯堪的纳维亚统计杂志,9,65-78(1982)·Zbl 0501.62028号
[61] Sain,S.R。;巴格利,K.A。;Scott,D.W.,多元密度的交叉验证,美国统计协会杂志,89807-817(1994)·Zbl 0805.62059号 ·doi:10.1080/01621459.1994.10476814
[62] Scott,D.W.,《多变量密度估计:理论、实践和可视化》(2015),新泽西州霍博肯:John Wiley&Sons,新泽西州霍博肯·Zbl 1311.62004号
[63] Seneviratne,S.、Nicholls,N.、Easterling,D.、Goodess,C.、Kanae,S.,Kossin,J.、Luo,Y.、Marengo,J.,Mcinnes,K.、Rahimi,M.、Reichstein,M.,Sorteberg,A.、Vera,C.和Zhang,X.(2012年),《气候极端变化及其对自然物理环境的影响》IPCC WGI/WGII关于管理极端事件和灾害风险以促进气候变化适应的特别报告编辑:C.Field、V.Barros、T.Stocker、D.Qin、D.Dokken、K.Ebi、M.Mastrandrea、K.Mach、G.-K.Plattner、S.Allen、M.Tignor和P.Midgley,英国剑桥和美国纽约:剑桥大学出版社,第190-230页。
[64] Sheather,S.J。;Jones,M.C.,《用于核密度估计的可靠的基于数据的带宽选择方法》,英国皇家统计学会杂志。B系列,53,683-690(1991)·Zbl 0800.62219
[65] 希尔曼,J。;哈林,V.V。;张,X。;Zwiers,F.W。;Bronaugh,D.,CMIP5多模型集成中的气候极值指数:第1部分。《当前气候中的模式评估》,《地球物理研究杂志:大气》,1181716-1733(2013)
[66] 希尔曼,J。;哈林,V.V。;Zwiers,F.W。;张,X。;Bronaugh,D.,CMIP5多模型集成中的气候极值指数:第2部分。未来气候预测,《地球物理研究杂志:大气》,1182473-2493(2013)
[67] Silverman,B.W.,《统计和数据分析密度估计》(1986),伦敦:查普曼和霍尔出版社,伦敦·Zbl 0617.62042号
[68] Smith,R.L.,一类非规则案例中的最大似然估计,生物统计学,72,67-90(1985)·Zbl 0583.62026号 ·doi:10.1093/biomet/72.1.67
[69] 史密斯,R.L。;Tawn,J.A。;袁,香港,多元极值统计,国际统计评论,58,47-58(1990)·Zbl 0715.62095号 ·doi:10.2307/1403473
[70] 泰勒,K.E。;斯托弗·R·J。;Meehl,G.A.,《CMIP5和实验设计概述》,美国气象学会公报,93,485-498(2012)·doi:10.1175/BAMS-D-11-00094.1
[71] 瓦塔德,R。;Gobiet,A。;雅各布·D·。;贝尔达,M。;科莱特,A。;Déqué,M。;Fernández,J。;García-Díez,M。;Goergen,K。;Güttler,I。;Halenka,T。;卡拉科斯塔斯,T。;Katraggou,E。;Keuler,K。;科特拉斯基,S。;迈耶,S。;Van Meijgaard,E。;Nikulin,G。;Patarcić,M。;Scinocca,J。;Sobolowski,S。;Suklitsch,M。;Teichmann,C。;Warrach-Sagi,K。;Wulfmeyer,V.公司。;Yiou,P.,《从EURO-CORDEX项目内的区域气候模型集合模拟欧洲热浪》,气候动力学,412555-2575(2013)·数字对象标识代码:10.1007/s00382-013-1714-z
[72] Wand,M.P.,一般多元核估计的误差分析,非参数统计杂志,2,1-15(1992)·Zbl 1360.62141号 ·doi:10.1080/10485259208832538
[73] Wand,M.P。;Jones,M.C.,多变量插入带宽选择,计算统计,9,97-116(1994)·Zbl 0937.62055号
[74] Wand,M.P。;Jones,M.C.,Kernel Smoothing(1995),伦敦:查普曼和霍尔出版社,伦敦·Zbl 0854.62043号
[75] Wand,M。;Marron,J。;Ruppert,D.,《密度估算中的转换》,J.Amer。统计师。协会,86,343-353(1991)·兹比尔07426/2046 ·doi:10.1080/01621459.1991.10475041
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。