×

删失分位数回归过程的可缩放估计和推理。 (英语) Zbl 07628845号

摘要:删失分位数回归(CQR)已成为研究可能删失结果和一组协变量之间异质关联的有用工具,但CQR的计算和统计推断对于具有许多协变量的大规模数据仍然是一个挑战。本文主要研究一种基于平滑鞅的序列估计方程方法,该方法可以应用基于梯度的可伸缩算法。理论上,我们对光滑序列估计量及其在增加维上的惩罚对应项进行了统一分析。当协变量维数随样本大小以次线性速度增长时,我们建立了一致的收敛速度(在一系列分位数指标上),并为乘数引导过程的有效性提供了严格的证明。在高维稀疏设置中,我们的结果通过放宽稀疏性的指数项,大大改进了现有的CQR研究。我们还通过模拟实验和数据应用证明了平滑CQR相对于现有方法的优势。

MSC公司:

62F40型 引导、折刀和其他重采样方法
62J05型 线性回归;混合模型
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andersen,P.K.,Borgan,Ø。,Gill,R.D.和Keiding,N.(1993年)。基于计数过程的统计模型.统计学中的斯普林格系列纽约州施普林格·Zbl 0769.62061号 ·doi:10.1007/978-1-4612-4348-9
[2] Barbe,P.和Bertail,P.(1995年)。加权引导.统计学课堂讲稿98.纽约斯普林格·Zbl 0826.62030号 ·doi:10.1007/978-14612-2532-4
[3] BARRODALE,I.和ROBERTS,F.(1974年)。范数中超定方程组的解。Commun公司。ACM公司17 319-320。
[4] BELLONI,A.和CHERNOZHUKOV,V.(2011)\高维稀疏模型中的[{\ell1}\]-惩罚分位数回归。安。统计师。39 82-130. ·Zbl 1209.62064号 ·doi:10.1214/10-AOS827
[5] BRADIC,J.、FAN,J.和JIANG,J.(2011)。具有NP维的Cox比例风险模型的正则化。安。统计师。39 3092-3120. ·Zbl 1246.62202号 ·doi:10.1214/11-AOS911
[6] BUCHINSKY,M.和HAHN,J.(1998)。截尾分位数回归模型的另一种估计。计量经济学66 653-671. ·doi:10.2307/2998578
[7] CAI,T.、HUANG,J.和TIAN,L.(2009)。加速失效时间模型的正则化估计。生物计量学65 394-404. ·Zbl 1274.62736号 ·doi:10.1111/j.1541-0420.2008.01074.x
[8] CHATTERJEE,S.和BOSE,A.(2005年)。估计方程的广义引导。安。统计师。33 414-436. ·Zbl 1065.62073号 ·doi:10.1214/009053604000000904
[9] CHERNOZHUKOV,V.和HONG,H.(2002)。三步审查分位数回归和婚外情。J.Amer。统计师。协会。97 872-882. ·Zbl 1048.62112号 ·doi:10.19198/0162114502388618663
[10] DE BACKER,M.、EL GHOUCH,A.和VAN KEILEGOM,I.(2019年)。删失分位数回归的自适应损失函数。J.Amer。统计师。协会。114 1126-1137·Zbl 1428.62151号 ·doi:10.1080/01621459.2018.1469996
[11] DE BACKER,M.、EL GHOUCH,A.和VAN KEILEGOM,I.(2020年)。线性删失分位数回归:一种新的最小距离方法。扫描。J.统计。47 1275-1306. ·Zbl 1467.62061号 ·doi:10.1111/sjos.12475
[12] DE CASTRO,L.、GALVAO,A.F.、KAPLAN,D.M.和LIU,X.(2019)。分位数模型的平滑GMM。J.计量经济学213 121-144中·Zbl 1456.62281号 ·doi:10.1016/j.jeconom.2019.04.008
[13] DICKSON,E.R.、GRAMBSCH,P.M.、FLEMING,T.R.、FISHER,L.D.和LANGWORTHY,A.(1989)。原发性胆汁性肝硬化的预后:决策模型。肝病学10 1-7. ·doi:10.1002/hep.184010102
[14] EFRON,B.(1967)。截尾数据的两个样本问题。第五届伯克利数理统计与概率研讨会论文集,卷4:生物学与健康问题831-853.
[15] Fan,J.和Li,R.(2001)。通过非洞穴惩罚似然的变量选择及其预言性质。J.Amer。统计师。协会。96 1348-1360. ·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[16] FAN,J.和LI,R.(2002)。考克斯比例风险模型和脆弱性模型的变量选择。安。统计师。30 74-99. ·doi:10.1214/aos/1015362185
[17] FEI,Z.、ZHENG,Q.、HONG,H.G.和LI,Y.(2021)。高维删失分位数回归的推论。J.Amer。统计师。协会。·Zbl 07707210号 ·doi:10.1080/01621459.2021.1957900
[18] FERNANDES,M.、GUERRE,E.和HORTA,E.(2021)。平滑分位数回归。J.总线。经济。统计师。39 338-357. ·doi:10.1080/07350015.2016.1660177
[19] FLEMING,T.R.和HARRINGTON,D.P.(1991)。计数过程与生存分析.概率与数理统计中的威利级数:应用概率论与统计学.威利,纽约·Zbl 0727.62096号
[20] FYGENSON,M.和RITOV,Y.(1994)。截尾数据的单调估计方程。安。统计师。22 732-746. ·Zbl 0807.62032号 ·doi:10.1214/aos/1176325493
[21] GILL,R.D.和JOHANSEN,S.(1990年)。产品整合调查,以期在生存分析中应用。安。统计师。18 1501-1555. ·doi:10.1214/aos/1176347865
[22] Gu,Y.、Fan,J.、Kong,L.、Ma,S.和Zou,H.(2018)。ADMM用于高维稀疏惩罚分位数回归。技术计量学60 319-331·doi:10.1080/00401706.2017.1345703
[23] 何旭、潘旭、谭国美和周维旭(2021)。具有大规模推理的平滑分位数回归。J.计量经济学·Zbl 07648718号 ·doi:10.1016/j.jeconom.2021.07.010
[24] 何晓霞、潘晓霞、谭国美和周伟霞(2022)。补充“删失分位数回归过程的可缩放估计和推断”https://doi.org/10.1214/22-AOS2214SUPP网站 ·Zbl 07628845号
[25] HONOR E.,B.,KHAN,S.和POWELL,J.L.(2002)。随机删失下的分位数回归。J.计量经济学109 67-105. ·doi:10.1016/S0304-4076(01)00142-7
[26] HU,F.和KALBFLEISCH,J.D.(2000)。估计函数引导。加拿大。J.统计。28 449-499. ·Zbl 0977.62045号 ·doi:10.2307/3315958
[27] Huang,J.,Ma,S.和Xie,H.(2006)。高维协变量加速失效时间模型中的正则化估计。生物计量学62 813-820. ·Zbl 1111.62090号 ·文件编号:10.1111/j.1541-0420.2006.00562.x
[28] 黄毅(2010)。分位数演算和删失回归。安。统计师。38 1607-1637年·Zbl 1189.62071号 ·doi:10.1214/09-AOS771
[29] JIN,Z.、YING,Z.和WEI,L.J.(2001)。通过扰动极小带的简单重采样方法。生物特征88 381-390. ·Zbl 0984.62033号 ·doi:10.1093/biomet/88.2.381
[30] KAPLAN,D.M.和SUN,Y.(2017年)。工具变量分位数回归的平滑估计方程。计量经济学理论33 105-157. ·Zbl 1441.62768号 ·doi:10.1017/S0266466615000407
[31] KLEINBAUM,D.G.和KLEIN,M.(2012年)。生存分析:自学课文,第3版。生物与健康统计纽约州施普林格·Zbl 1228.62122号 ·doi:10.1007/978-1-4419-6646-9
[32] Koenker,R.(2005)。分位数回归.计量经济学社会专题38.剑桥大学出版社,剑桥。 ·doi:10.1017/CBO9780511754098
[33] KOENKER,R.(2008)。删失分位数回归。J.统计软件。38 1-25.
[34] KOENKER,R.、CHERNOZHUKOV,V.、HE,X.和PENG,L.(2017)。分位数回归手册CRC出版社,纽约。
[35] KOENKER,R.和GELING,O.(2001)。重新评估medfly寿命:分位数回归生存分析。J.Amer。统计师。协会。96 458-468. ·Zbl 1019.62100号 ·doi:10.1198/016214501753168172
[36] KOENKER,R.和MIZERA,I.(2014)。R中的凸优化。J.统计软件。60. ·Zbl 1367.62020号
[37] KOENKER,R.和NG,P.(2005)。稀疏分位数回归的Frisch-Newton算法。数学学报。申请。罪恶。英语。序列号。21 225-236. ·Zbl 1097.62028号 ·doi:10.1007/s10255-005-0231-1
[38] LENG,C.和TONG,X.(2013)。截尾数据的分位数回归估计。伯努利19 344-361·Zbl 1259.62019号 ·doi:10.3150/11-BEJ388
[39] MA,S.和KOSOROK,M.R.(2005)。稳健半参数M估计和加权自举。《多元分析杂志》。96 190-217. ·Zbl 1073.62030 ·doi:10.1016/j.jmva.2004.09.008
[40] NEOCLEOUS,T.、VANDEN BRANDEN,K.和PORTNOY,S.(2006年)。更正:Portnoy的“截尾回归分位数”[J.Amer.Statist.Assoc.98(464)(2003),1001-1012;MR2041488]。J.Amer。统计师。协会。101 860-861. ·doi:10.1198/0162145000000087
[41] PARZEN,M.I.、WEI,L.J.和YING,Z.(1994)。基于关键估计函数的重采样方法。生物特征81 341-350. ·兹比尔0807.62038 ·doi:10.1093/biomet/81.2.341
[42] PENG,L.(2012)。删失分位数回归的自洽估计。《多元分析杂志》。105 368-379. ·Zbl 1236.62034号 ·doi:10.1016/j.jmva.2011.10.005
[43] 彭·L(2021)。生存数据的分位数回归。年。Rev.Stat.应用。8 413-437. ·doi:10.1146/annurev-statistics-042720-020233
[44] PENG,L.和HUANG,Y.(2008)。分位数回归模型的生存分析。J.Amer。统计师。协会。103 637-649. ·Zbl 1408.62159号 ·doi:10.1198/0162145000000355
[45] 波特诺,S.(2003)。删失回归分位数。J.Amer。统计师。协会。98 1001-1012. ·Zbl 1045.62099号 ·doi:10.1198/0162145000000954
[46] PORTNOY,S.和KOENKER,R.(1997)。高斯兔和拉普拉斯乌龟:平方误差与绝对误差估计量的可计算性。统计师。科学。12 279-300. ·兹比尔0955.62608 ·doi:10.1214/ss/1030037960
[47] PORTNOY,S.和LIN,G.(2010年)。删失回归分位数的渐近性。J.非参数。统计。22 115-130. ·Zbl 1184.62168号 ·网址:10.1080/10485250903105009
[48] POWELL,J.L.(1984)。删失回归模型的最小绝对偏差估计。J.计量经济学25 303-325. ·Zbl 0571.62100号 ·doi:10.1016/0304-4076(84)90004-6
[49] POWELL,J.L.(1986年)。截尾回归分位数。J.计量经济学32 143-155. ·Zbl 0605.62139号 ·doi:10.1016/0304-4076(86)90016-3
[50] SHEDDEN,K.、TAYLOR,J.M.、ENKEMANN,S.A.(2008)。基于基因表达的肺腺癌生存预测:一项多地点、盲法验证研究。自然医学。14 822-827.
[51] SHERWOOD,B.和MAIDMAN,A.(2020年)。软件包“rqPen”,版本2.2.2。参考手册。https://cran.r-project.org/web/packages/rqPen/rqPen.pdf。
[52] SHOWS,J.H.,LU,W.和ZHANG,H.H.(2010)。删失中值回归的稀疏估计和推断。J.统计。计划。推断140 1903-1917. ·Zbl 1184.62172号 ·doi:10.1016/j.jspi.2010.01.043
[53] SUN,X.、PENG,L.、HUANG,Y.和LAI,H.J.(2016)。将分位数回归用于计数过程,并应用于重复事件。J.Amer。统计师。协会。111 145-156. ·doi:10.1080/01621459.2014.995795
[54] TAN,K.M.,WANG,L.和ZHOU,W.-X.(2022)。高维分位数回归:卷积平滑和凹正则化。J.R.统计社会服务。B.统计方法。84 205-233. ·Zbl 07593409号 ·doi:10.1111/rssb.12485
[55] THERNEAU,T.M.、GRAMBSCH,P.M.和FLEMING,T.R.(1990)。生存模型的基于鞅的残差。生物特征77 147至160·Zbl 0692.62082号 ·doi:10.1093/biomet/77.1.147
[56] TIAN,L.、ZUCKER,D.和WEI,L.J.(2005年)。关于具有时变回归系数的Cox模型。J.Amer。统计师。协会。100 172-183. ·Zbl 1117.62435号 ·doi:10.1198/016214500000845
[57] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B58 267-288. ·Zbl 0850.62538号
[58] VOLGUSHEV,S.、WAGENER,J.和DETTE,H.(2014)。相关性和惩罚下的删失分位数回归过程。电子。J.统计。8 2405-2447. ·Zbl 1349.62488号 ·doi:10.1214/14-EJS54
[59] WANG,H.J.和WANG,L.(2009)。局部加权截尾分位数回归。J.Amer。统计师。协会。104 1117-1128. ·Zbl 1388.62289号 ·doi:10.1198/jasa.2009.tm08230
[60] 王宏杰、周杰和李毅(2013)。删失分位数回归的变量选择。统计师。西尼卡23 145-167. ·Zbl 1257.62046号
[61] WHANG,Y.-J.(2006)。分位数回归模型的平滑经验似然方法。计量经济学理论22 173-205. ·Zbl 1138.62017号 ·doi:10.1017/S0266466606060087
[62] WU,Y.、MA,Y.和YIN,G.(2015)。具有测量误差的删失分位数回归的平滑和修正分数方法。J.Amer。统计师。协会。110 1670-1683. ·Zbl 1373.62164号 ·doi:10.1080/01621459.2014.989323
[63] YANG,X.,NARISETTY,N.N.和HE,X.(2018)。一种新的删失分位数回归估计方法。J.计算。图表。统计师。27 417-425. ·Zbl 07498958号 ·doi:10.1080/10618600.2017.1385469
[64] YING,Z.、JUNG,S.H.和WEI,L.J.(1995)。使用中值回归模型进行生存分析。J.Amer。统计师。协会。90 178-184·Zbl 0818.62103号
[65] YU,L.、LIN,N.和WANG,L.(2017)。大规模非凸惩罚分位数回归的并行算法。J.计算。图表。统计人员。26 935-939. ·doi:10.1080/10618600.2017.1328366
[66] Zhang,C.-H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[67] 郑琦、彭磊、何旭(2018)。高维删失分位数回归。安。统计师。46 308-343. ·Zbl 1416.62236号 ·doi:10.1214/17-AOS1551
[68] 邹华(2006)。自适应套索及其oracle属性。J.Amer。统计师。协会。101 1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[69] 邹浩和李若明(2008)。非凹陷惩罚似然模型中的一步稀疏估计。安。统计师。36 1509-1533 ·Zbl 1142.62027号 ·doi:10.1214/0090536007000000802
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。