×

高维线性模型测试的自动偏差校正。 (英语) Zbl 07778706号

摘要:假设检验是具有挑战性的,因为当它基于高维正则估计时,检验统计量的渐近分布很复杂。我们使用稳健的近似消息传递算法,为(ell_1)正则化M估计量提出了一个稳健的测试框架,以处理非高斯分布回归误差。该框架具有自动内置偏差校正功能,适用于一般凸不可微损失函数,当焦点为条件分位数而非响应平均值时,该框架还允许进行推断。在使用最小二乘损失函数的情况下,该估计器与衰减和去噪方法进行了数值比较。Huber损失函数的使用表明,所提出的构造在不同的回归误差分布下提供了稳定的置信区间。
{©2022荷兰统计与运营研究学会}

MSC公司:

62Jxx型 线性推断、回归
62Fxx公司 参数化推理
62Gxx公司 非参数推理
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alfons,A.、Croux,C.和Gelper,S.(2013年)。用于分析高维大数据集的稀疏最小二乘回归。应用统计年鉴,7226-248·Zbl 1454.62123号
[2] Barbier,J.、Krzakala,F.、Macris,N.、Miolane,L.和Zdeborová,L.(2019年)。高维广义线性模型中的最佳误差和相变。《美国国家科学院院刊》,116,5451-5460·Zbl 1416.62421号
[3] Bayati,M.和Montanari,A.(2011年A)。消息在密集图形上传递的动力学,以及压缩感知的应用。IEEE信息理论汇刊,57764-785·Zbl 1366.94079号
[4] Bayati,M.和Montanari,A.(2011年b)。高斯矩阵的LASSO风险。IEEE信息理论汇刊,581997-2017·兹比尔1365.62196
[5] Belloni,A.和Chernozhukov,V.(2011)。高维稀疏模型中的L_1惩罚分位数回归。统计年鉴,39,82-130·Zbl 1209.62064号
[6] Bradic,J.(2016)。稀疏高维线性模型中的稳健性:相对效率和稳健性近似消息传递。电子统计杂志,103894-3944·Zbl 1357.62215号
[7] Bradic,J.、Fan,J.和Wang,W.(2011)。超高维变量选择的惩罚复合拟似然。英国皇家统计学会杂志:B辑(统计方法),73325-349·Zbl 1411.62181号
[8] Bradic,J.和Kolar,M.(2017年)。高维分位数回归的统一推断:线性泛函和回归秩分数。0.32预印本。arXiv:1702.06209。
[9] Bühlmann,P.和van deGeer,S.(2011)。高维数据统计:方法、理论和应用。德国柏林/海德堡:施普林格科技与商业媒体·Zbl 1273.62015年
[10] Candès,E.J.和Sur,P.(2020年)。高维logistic回归中最大似然估计存在的相变。《统计年鉴》,48,27-42·Zbl 1439.62171号
[11] Caner,M.和Kock,A.B.(2018年)。高维参数的渐近诚实置信区域(通过消泡保守套索)。《计量经济学杂志》,203,143-168·Zbl 1386.62020年
[12] Dezeure,R.、Bühlmann,P.和Zhang,C.‐H。(2017). 使用引导程序进行高维同步推理。测试,26,685-719·Zbl 06833591号
[13] Donoho,D.、Maleki,A.和Montanari,A.(2009年)。压缩感知的消息传递算法。国家科学院院刊,10618914-18919。
[14] Donoho,D.和Montanari,A.(2016)。高维稳健M‐估计:通过近似消息传递的渐近方差。概率论及相关领域,166935-969·兹比尔1357.62220
[15] Donoho,D.L.(1995)。通过软阈值消除噪音。IEEE信息理论汇刊,41,613-627·Zbl 0820.62002号
[16] Donoho,D.L.和Johnstone,J.M.(1994)。通过小波收缩实现理想的空间自适应。《生物特征》,81,425-455·Zbl 0815.62019号
[17] El Karoui,N.(2013年)。非正则和岭正则高维稳健回归估计量的渐近行为:严格结果。arXiv预印本。arXiv:1311.2445。
[18] El Karoui,N.、Bean,D.、Bickel,P.J.、Lim,C.和Yu,B.(2013)。基于高维预测因子的稳健回归。美国国家科学院院刊,110,14557-14562·兹比尔1359.62184
[19] Emami,M.、Sahraee‐Ardakan,M.,Pandit,P.、Rangan,S.和Fletcher,A.(2020年)。高维广义线性模型的推广误差。机器学习国际会议记录(第2892-2901页)。PMLR公司。
[20] Fan,J.,&Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。美国统计协会杂志,96,1348-1360·Zbl 1073.62547号
[21] Gordon,Y.(1985)。高斯过程和应用的一些不等式。以色列数学杂志,50265-289·Zbl 0663.60034号
[22] Gordon,Y.(1988)。关于Milman不等式和通过网格逃逸的随机子空间ℝ^n.在功能分析的几何方面(第84-106页)。瑞士:施普林格国际出版公司·Zbl 0651.46021号
[23] Gueuning,T.和Claeskens,G.(2018年)。高维聚焦信息标准。斯堪的纳维亚统计杂志,45,34-61·Zbl 1421.62068号
[24] Hampel,F.R.、Ronchetti,E.M.、Rousseeuw,P.J.和Stahel,W.A.(2011年)。稳健统计:基于影响函数的方法(第196卷)。纽约,纽约:约翰·威利父子公司。
[25] Hochberg,Y.(1988)。用于多个重要测试的更清晰的Bonferroni程序。生物特征,75800-802·Zbl 0661.62067号
[26] Holm,S.(1979年)。一个简单的顺序拒绝多重测试程序。斯堪的纳维亚统计杂志,6,65-70·Zbl 0402.62058号
[27] Huang,H.(2020)。渐近风险和相变
[( {l} _1个\]\)-惩罚稳健估计量。《统计年鉴》,483090-3111·兹比尔1460.62109
[28] Huber,P.J.(2004)。稳健统计(第523卷)。新泽西州霍博肯:John Wiley&Sons。
[29] Javanmard,A.和Montanari,A.(2014)。高维回归的置信区间和假设检验。机器学习研究杂志,152869-2909·Zbl 1319.62145号
[30] Khan,J.A.、Van Aelst,S.和Zamar,R.H.(2007年)。基于最小角度回归的稳健线性模型选择。美国统计协会杂志,1021289-1299·Zbl 1332.62240号
[31] Koenker,R.(2005)。分位数回归计量经济学社会专著。纽约:剑桥大学出版社·Zbl 1111.62037号
[32] Koenker,R.和Bassett,J.G.(1978年)。回归分位数。《计量经济学:计量经济学社会杂志》,46,33-50·Zbl 0373.62038号
[33] Lee,J.、Sun,D.、Sun,Y.和Taylor,J.(2016)。精确的选择后推断,并应用于套索。《统计年鉴》,44907-927·Zbl 1341.62061号
[34] Lei,L.、Bickel,P.J.和El Karoui,N.(2018)。高维回归M估计的渐近性:固定的设计结果。概率论及相关领域,172983-1079·Zbl 1406.62084号
[35] Maechler,M.、Rousseeuw,P.、Croux,C.、Todorov,V.、Ruckstuhl,A.、Salibian‐Barrera,M.和Verbeke,T.、Koller,M.,Conceicao,E.L.T.和Anna di Palma,M..(2022年)。robustbase:基本稳健统计。R包版本0.95‐0。http://robustbase.r‐forge.r-project.org/。
[36] Meinshausen,N.、Meier,L.和Bühlmann,P.(2009年)。高维回归的p值。美国统计协会杂志,1041671-1681·Zbl 1205.62089号
[37] R核心团队。(2022). R: 用于统计计算的语言和环境。奥地利维也纳:R统计公司基金会ting网址:https://www.R‐项目.org
[38] 什伊达克(1967)。多元正态分布均值的矩形置信区。美国统计协会杂志,62626-633·Zbl 0158.17705号
[39] 信号开发商。(2014). 信号:信号处理。http://r‐forge.r‐project.org/projects/signal/。
[40] Sun,Q.,Zhou,W.,&Fan,J.(2020年)。自适应Huber回归。美国统计协会杂志,115,254-265·Zbl 1437.62250号
[41] Sur,P.和Candès,E.J.(2019年)。高维逻辑回归的现代最大似然理论。《美国国家科学院院刊》,11614516-14525·Zbl 1431.62084号
[42] Sur,P.、Chen,Y.和Candès,E.J.(2019年)。高维logistic回归中的似然比检验是一个渐近重标卡方。概率论及相关领域,175487-558·Zbl 1431.62319号
[43] Thrampoulidis,C.、Abbasi,E.和Hassibi,B.(2018年)。高维正则化M估计量的精确误差分析。IEEE信息理论汇刊,645592-5628·Zbl 1401.94051号
[44] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志:B辑(方法学),58267-288·Zbl 0850.62538号
[45] van deGeer,S.、Bühlmann,P.、Ritov,Y.和Dezeure,R.(2014)。关于高维模型的渐近最优置信域和检验。《统计年鉴》,第42期,第1166-1202页·Zbl 1305.62259号
[46] Wang,H.,Li,G.,&Jiang,G..(2007)。通过LAD套索进行稳健回归收缩和一致变量选择。《商业与经济统计杂志》,25447-355。
[47] Wang,X.,Dunson,D.&Leng,C.(2016)。分布式稀疏回归的去相关特征空间划分。第30届神经信息处理系统国际会议记录(第802-810页)。
[48] Wasserman,L.和Roeder,K.(2009年)。高维变量选择。《统计年鉴》,372178·Zbl 1173.62054号
[49] Zhang,X.,&Cheng,G.(2017)。高维线性模型的同步推断。美国统计协会杂志,112757-768。
[50] Zhao,Q.,Sur,P.&Candes,E.J.(2020年)。高维logistic模型中MLE的渐近分布:任意协方差。arXiv预印本。arXiv:2001.09351。
[51] Zhao,T.、Kolar,M.和Liu,H.(2014)。高维分位数回归中稳健测试和置信区的一般框架。arXiv预印本。arXiv:0401062。
[52] Zhao,W.、Zhang,F.和Lian,H.(2019)。高维分位数回归的去噪和分布式估计。IEEE神经网络和学习系统汇刊,31,2569-2577。
[53] Zhou,J.、Claeskens,G.和Bradic,J.(2020年)。在高维中消除稳健性:综合与模型平均估计。《电子统计杂志》,142551-2599·Zbl 1450.62087号
[54] 邹华(2006)。自适应套索及其oracle属性。美国统计协会杂志,1011418-1429·Zbl 1171.62326号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。