×

稳健估计的新视角:有限样本理论及其在相关性调整多重检验中的应用。 (英语) Zbl 1409.62154号

考虑一个具有回归系数向量的普通线性回归模型,以及具有平均零和有限方差的随机噪声变量。当违反正态性假设时,迫切需要一种稳健的方法来替代以Huber估计为代表的最小二乘法。
本文考虑了具有调谐参数的Huber估计器,其调谐参数与噪声的样本大小、维数和方差相适应。Berry-Essen不等式和Crámer型适度偏差也得到了发展。
作为一个特例,建立了噪声变量只有二阶矩时的亚高斯型偏差不等式和非渐近Bahadur表示。

MSC公司:

62J15型 配对和多重比较;多次测试
62H15型 多元分析中的假设检验
62层35 鲁棒性和自适应程序(参数推断)
62年5月 线性回归;混合模型
62E20型 统计学中的渐近分布理论

软件:

FAMT公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ahn,S.C.和Horenstein,A.R.(2013)。因子数的特征值比检验。计量经济学81 1203–1227·Zbl 1274.62403号 ·doi:10.3982/ECTA8968
[2] Barbe,P.和Bertail,P.(1995年)。加权引导。统计学课堂讲稿98。纽约州施普林格·Zbl 0826.62030号
[3] Barras,L.、Scaillet,O.和Wermers,R.(2010年)。共同基金业绩中的错误发现:衡量阿尔法估值中的运气。《财务杂志》65 179–216。
[4] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用而强大的多重测试方法。J.R.统计社会服务。B.统计方法57 289–300·Zbl 0809.62014号
[5] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。统计年鉴29 1165–1188·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[6] Carhart,M.M.(1997)。关于共同基金业绩的持续性。J.财务52 57–82。
[7] Catoni,O.(2012)。挑战经验均值和经验方差:偏差研究。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。统计数据48 1148–1185·Zbl 1282.62070号 ·doi:10.1214/11-AIHP454
[8] Chang,J.,Shao,Q.-M.和Zhou,W.-X.(2016)。带应用程序的学生化双样本(U)统计的Cramér型中度偏差。Ann.Statist.44 1931-1956年·Zbl 1357.60030号 ·doi:10.1214/15-AOS1375
[9] Clarke,S.和Hall,P.(2009年)。针对依赖性的多个测试程序的稳健性。《统计年鉴》37 332–358·Zbl 1155.62031号 ·doi:10.1214/07-AOS557
[10] Cont,R.(2001)。资产收益的经验特性:典型事实和统计问题。数量。财务1 223–236。
[11] Delaigle,A.、Hall,P.和Jin,J.(2011年)。基于Student统计的高维数据分析方法的稳健性和准确性。J.R.统计社会服务。B.统计方法73 283–301。
[12] Desai,K.H.和Storey,J.D.(2012年)。依赖高维数据的跨维推理。J.Amer。统计师。协会107 135–151·Zbl 1261.62048号 ·doi:10.1080/01621459.2011.645777
[13] Efron,B.(2004)。大规模同时假设检验:选择一个无效假设。J.Amer。统计师。协会99 96–104·Zbl 1089.62502号 ·doi:10.1198/0162145000000089
[14] Efron,B.(2007)。相关性和大规模同时显著性检验。J.Amer。统计师。协会102 93–103·Zbl 1284.62340号 ·doi:10.1198/0162145000001211
[15] Efron,B.、Tibshirani,R.、Storey,J.D.和Tusher,V.(2001年)。微阵列实验的经验贝叶斯分析。J.Amer。统计师。协会96 1151–1160·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[16] Fama,E.F.(1963年)。曼德尔布罗特和稳定帕累斯假说。J.Bus.36 420–429。
[17] Fan,J.、Hall,P.和Yao,Q.(2007)。对多少同时进行的假设检验可以正常、学生(t)或引导校准?J.Amer。统计师。协会102 1282–1288·Zbl 1332.62063号 ·doi:10.1198/0162145000000969
[18] Fan,J.和Han,X.(2017)。具有未知相关性的错误发现比例的估计。J.R.统计社会服务。B.统计方法79 1143–1164·Zbl 1373.62272号 ·doi:10.1111/rssb.12204
[19] Fan,J.、Han,X.和Gu,W.(2012)。估计任意协方差依赖下的错误发现比例。J.Amer。统计师。协会107 1019–1035·Zbl 1395.62219号 ·doi:10.1080/01621459.2012.713878
[20] Fan,J.,Li,Q.和Wang,Y.(2017)。在缺乏对称性和轻尾假设的情况下估计高维平均回归。J.R.统计社会服务。B.统计方法79 247–265。
[21] Finkenstadt,B.和Rootzeén,H.(2003)。金融、电信和环境的极端价值。查普曼和霍尔,纽约。
[22] Friguet,C.、Kloareg,M.和Causeur,D.(2009年)。依赖性下多重测试的因子模型方法。J.Amer。统计师。协会104 1406–1415·Zbl 1205.62071号 ·doi:10.1198/jasa.2009.tm08332
[23] Genovese,C.和Wasserman,L.(2004年)。错误发现控制的随机过程方法。统计年鉴32 1035–1061·Zbl 1092.62065号 ·doi:10.1214/009053604000000283
[24] 何旭、邵庆明(1996)。M估计量的一般Bahadur表示及其在非随机设计线性回归中的应用。统计年鉴24 2608–2630·Zbl 0867.62012年 ·doi:10.1214操作系统/1032181172
[25] 何旭、邵庆明(2000)。关于增加维度的参数。《多变量分析杂志》73 120–135·Zbl 0948.62013.中 ·doi:10.1006/jmva.1999.1873
[26] Huber,P.J.(1964年)。位置参数的稳健估计。安。数学。统计数字35 73–101·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[27] Huber,P.J.(1973)。稳健回归:渐近、猜想和蒙特卡罗。安。统计师。1799–821·兹标0289.62033 ·doi:10.1214/aos/1176342503
[28] Joly,E.和Lugosi,G.(2016)。(U)统计量的稳健估计。随机过程。申请号:126 3760–3773·Zbl 1386.60074号 ·doi:10.1016/j.spa.2016.04.021
[29] Kosorok,M.R.和Ma,S.(2007年)。“大(p),小(n)”范式的边缘渐近性:应用于微阵列数据。《统计年鉴》35 1456–1486·Zbl 1123.62005年 ·doi:10.1214/009053606000001433
[30] Langaas,M.、Lindqvist,B.H.和Ferkingstad,E.(2005)。估计真零假设的比例,并应用于DNA微阵列数据。J.R.统计社会服务。B.统计方法67 555–572·Zbl 1095.62037号 ·数字对象标识代码:10.1111/j.1467-9868.2005.00515.x
[31] Leek,J.T.和Storey,J.D.(2008)。多重测试依赖性的通用框架。程序。国家。阿卡德。科学。美国105 18718–18723·Zbl 1359.62202号 ·doi:10.1073/pnas.0808709105
[32] Lehmann,E.L.和Romano,J.P.(2005)。全系列错误率的推广。统计年鉴33 1138–1154·Zbl 1072.62060号 ·doi:10.1214/009053605000000084
[33] 朱·林尼克。V.(1961)。关于自变量和的大偏差概率。程序中。第四届伯克利交响乐团。数学。统计师。以及Probe。,第二卷289-306。加利福尼亚大学出版社,加利福尼亚州伯克利。
[34] Liu,W.和Shao,Q.-M.(2010)。周期图最大值的Cramér型中度偏差,用于基因表达时间序列的同步测试。《统计年鉴》(Ann.Statist.38),1913-1935年·Zbl 1202.62127号 ·doi:10.1214/09-AOS774
[35] Liu,W.和Shao,Q.-M.(2014)。具有错误发现率控制的大规模(t)测试中的相变和正则引导。统计年鉴42 2003-2025年·Zbl 1305.62213号 ·doi:10.1214/14-AOS1249
[36] Mammen,E.(1989)。稳健回归的递增维渐近性及其在引导中的应用。统计年鉴17 382-400·Zbl 0674.62017年 ·doi:10.1214/aos/1176347023
[37] Mandelbrot,B.(1963年)。某些投机价格的变化。J.Bus.36 394–419。
[38] Meinshausen,N.和Rice,J.(2006年)。在大量独立测试的假设中估计假零假设的比例。统计年鉴34 373–393·兹比尔1091.62059 ·doi:10.1214/09053605000000741
[39] Nemirovsky,A.S.和Yudin,D.B.(1983年)。优化中的问题复杂性和方法效率。纽约威利。
[40] Oberthuer,A.、Berthold,F.、Warnat,P.、Hero,B.、Kahlert,Y.、Spitz,R.、Ernestus,K.、König,R.,Haas,S.、Eils,R.和Schwab,M.、Brors,B.、Westermann,F.和Fischer,M.(2006年)。神经母细胞瘤患者基于定制寡核苷酸微阵列基因表达的分类优于当前的临床风险分层。临床杂志。Oncol.24 5070–5078。
[41] Portnoy,S.(1985)。(p^{2}/n)大时回归参数的(M)估计的渐近性。法线近似。美国国家统计局13 1403–1417·Zbl 0601.62026号 ·doi:10.1214/aos/1176349744
[42] Schwartzman,A.和Lin,X.(2011年)。相关性对错误发现率估计的影响。生物特征98 199–214·Zbl 1215.62071号 ·doi:10.1093/biomet/asq075
[43] Shi,L.等人(MAQC财团)(2010年)。微阵列质量控制(MAQC)-II基于微阵列预测模型开发和验证的通用实践研究。《自然生物技术》28 827–841。
[44] Spokoiny,V.和Zhilova,M.(2015)。模型错误指定下的引导置信集。统计年鉴43 2653–2675·Zbl 1327.62179号 ·doi:10.1214/15-AOS1355
[45] Storey,J.D.(2002)。错误发现率的直接方法。J.R.统计社会服务。B.Stat.方法64 479–498·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[46] Storey,J.D.、Taylor,J.E.和Siegmund,D.(2004)。强控制、保守点估计和错误发现率的同时保守一致性:统一方法。J.R.统计社会服务。B.统计方法66 187–205·Zbl 1061.62110号 ·文件编号:10.1111/j.1467-9868.2004.00439.x
[47] Sun,W.和Cai,T.T.(2009)。依赖性下的大规模多重测试。J.R.统计社会服务。B.统计方法71 393–424·Zbl 1248.62005号 ·doi:10.1111/j.1467-9868.2008.00694.x
[48] Vershynin,R.(2012)。介绍随机矩阵的非渐近分析。在压缩传感210–268中。剑桥大学出版社,剑桥。
[49] 尤海(Yohai,V.J.)和玛丽娜(Maronna,R.A.)(1979年)。线性模型的(M)-估计的渐近行为。《统计年鉴》第7卷第258-268页·Zbl 0408.62027号 ·doi:10.1214/aos/1176344610
[50] Zhilova,M.(2016)。非经典Berry-Esseen不等式和加权bootstrap的精度。可从arXiv:1611.02686获取。
[51] W·周。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。