×

具有重尾和方差异质性的超高维期望回归的稳健估计和收缩。 (英语) Zbl 07504782号

摘要:在各种科学领域中,高维数据普遍存在重尾现象和异质性,给经典统计方法带来了新的挑战。本文将非对称平方损失和Huber型稳健技术相结合,建立了超高维重尾异质数据的稳健期望回归模型。与经典的Huber方法不同,我们在两侧引入了两个不同的调谐参数,以解释可能的不对称性,并允许它们发散,以减少鲁棒近似引起的偏差。在正则化框架下,我们采用一般折叠的凹罚函数,如SCAD或MCP罚函数来寻求偏差减少。我们研究了相应估计量的有限样本性质,并指出我们的方法如何在权衡估计精度与重尾分布之间发挥作用。此外,基于我们的理论研究,我们在对非凸问题进行局部线性逼近后,提出了一种有效的一阶优化算法。不同分布下的仿真研究和实际数据示例表明,该方法在系数估计、模型选择和异质性检测方面具有令人满意的性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿加瓦尔,A。;内加班,S。;MJ Wainwright,高维统计恢复梯度方法的快速全球收敛,《统计年鉴》,40,5,2452-2482(2012)·Zbl 1373.62244号 ·doi:10.1214/12-AOS1032
[2] DJ艾格纳;Amemiya,T。;Poirier,DJ,《关于生产边界的估计:不连续密度函数参数的最大似然估计》,《国际经济评论》,17,2,377-396(1976)·Zbl 0339.62083号 ·doi:10.307/2525708
[3] Aitkin,M.,使用GLIM建模正态回归中的方差异质性,《皇家统计学会杂志:C辑(应用统计学)》,36,3,332-339(1987)
[4] PJ Bickel,《基于无限小邻里的稳健回归》,《统计年鉴》,121349-1368(1984)·Zbl 0567.62051号
[5] 德罗西,G。;Harvey,A.,分位数、期望值和样条曲线,《计量经济学杂志》,152,2,179-185(2009)·Zbl 1431.62153号 ·doi:10.1016/j.jeconom.2009.01.01
[6] Efron B(1991)使用非对称平方误差损失的回归百分位数。中国统计局93-125·Zbl 0822.62054号
[7] 范,J。;李,Q。;Wang,Y.,在缺乏对称性和轻尾假设的情况下估计高维平均回归,英国皇家统计学会杂志,79,1,247-265(2017)·Zbl 1414.62178号 ·doi:10.1111/rssb.12166
[8] 范,J。;Li,R.,通过非一致惩罚似然进行变量选择及其预言性质,美国统计协会杂志,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[9] 范,J。;薛,L。;Zou,H.,折叠凹惩罚估计的强预言优化,《统计年鉴》,42,3,819(2014)·Zbl 1305.62252号
[10] Fu A,Narasimhan B,Boyd S(2017)CVXR:规范凸优化的R包。https://web.stanford.edu/boyd/papers/cvxr_paper.html
[11] 顾毅。;Zou,H.,非对称最小二乘回归的高维推广及其应用,《统计年鉴》,44,6,2661-2694(2016)·Zbl 1364.62185号 ·doi:10.1214/15-AOS1431
[12] 郭,C。;Yang,H。;Lv,J.,基于加权复合分位数回归的高维变系数模型中的稳健变量选择,统计论文,58,4,1009-1033(2017)·Zbl 1393.62015年 ·doi:10.1007/s00362-015-0736-5
[13] Grant MC,Boyd SP(2013)CVX:规范凸编程的Matlab软件,2.0 beta版。http://cvxr.com/cvx
[14] Grant MC,Boyd SP(2008)非光滑凸程序的图形实现。学习和控制的最新进展95-110·Zbl 1205.90223号
[15] Huang CC,Liu K,Pope RM,Du P,Lin S,Rajamannan NM等人(2011年),framingham风险评分较低女性动脉粥样硬化中激活的tlr信号:动脉粥样硬化的多民族研究。普洛斯一号6(6):e21067
[16] Huber,PJ,位置参数的稳健估计,《数理统计年鉴》,3573-101(1964)·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[17] Huber,PJ,有界影响回归的Minimax方面,美国统计协会杂志,78,381,66-72(1983)·Zbl 0514.62073号 ·doi:10.1080/016214519983.10477928
[18] Kim,M。;Lee,S.,非线性预期回归及其在价值-风险和预期短缺估计中的应用,计算统计与数据分析,94,1-19(2016)·Zbl 1468.62101号 ·doi:10.1016/j.csda.2015.07.011
[19] Liu Y,Zeng P,Lin L(2020)带Huber损失和线性约束的正则回归的自由度。统计论文1-23
[20] 卢,波兰;Wainwright,MJ,《带非凸性的正则M-估计量:局部最优的统计和算法理论》,《机器学习研究杂志》,16,559-616(2015)·Zbl 1360.62276号
[21] Maronna RA、Martin RD、Yohai VJ(2019)《稳健统计:理论和方法》(带R)。约翰·威利父子公司·Zbl 1409.62009号
[22] Massart,P.,《集中度不平等和模型选择》(2007年),柏林:施普林格出版社,柏林·Zbl 1170.60006号
[23] Newey WK,Powell JL(1987)非对称最小二乘估计和检验。计量经济学:《计量经济学学会杂志》819-847·Zbl 0625.62047号
[24] 北卡罗来纳州帕里赫。;Boyd,S.,Proximal algorithms,Foundations and Trends in Optimization,1、3、127-239(2014年)·数字对象标识代码:10.1561/24000003
[25] 里格比,RA;Stasinopoulos,DM,方差异质性的半参数加性模型,统计与计算,6,1,57-65(1996)·doi:10.1007/BF00161574
[26] Rivasplata,O.,《亚高斯随机变量:解释性说明》(2012),PDF:互联网出版物,PDF
[27] Smucler,E。;Yohai,VJ,线性回归模型的稳健和稀疏估计,计算统计与数据分析,111,116-130(2017)·Zbl 1464.62164号 ·doi:10.1016/j.csda.2017.02.002
[28] Sobotka,F。;Kneib,T.,地质添加剂预期回归,计算统计与数据分析,56,4,755-767(2012)·Zbl 1241.62058号 ·doi:10.1016/j.csda.2010.11.015
[29] Tibshirani R(1996)通过套索回归收缩和选择。英国皇家统计学会杂志。B系列(方法学)58(1):267-288·Zbl 0850.62538号
[30] 沃尔特鲁普,LS;Sobotka,F。;Kneib,T。;Kauermann,G.,期望和分位数回归——David和Goliath?,统计建模,15433-456(2015)·Zbl 07258997号 ·doi:10.1177/1471082X14561155
[31] Wang,L。;Wu,Y。;Li,R.,用于分析超高维异质性的分位数回归,《美国统计协会杂志》,107,497,214-222(2012)·兹比尔1328.62468 ·doi:10.1080/01621459.2012.656014
[32] Wang L,Zheng C,Zhou W,Zhow W(2020)无调谐Huber回归的新原理。中国统计学·Zbl 1524.62136号
[33] 姚,Q。;Tong,H.,《非对称最小二乘回归估计:非参数方法》,《非参数统计杂志》,6,2-3,273-292(1996)·Zbl 0879.62038号 ·doi:10.1080/10485259608832675
[34] 张,CH,最小最大凹惩罚下的几乎无偏变量选择,统计年鉴,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[35] Zhao J,Chen Y,Zhang Y(2018)用于分析高维异方差的期望回归。统计与概率快报137:304-311·Zbl 1414.62324号
[36] 邹,H。;Li,R.,非冲突惩罚似然模型中的一步稀疏估计,统计年鉴,36,4,1509-1533(2008)·Zbl 1142.62027号
[37] Ziegel,JF,《一致性和可诱导性》,《数学金融》,26,4,901-918(2016)·Zbl 1390.91336号 ·doi:10.1111/mafi.2080
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。