×

截尾生存数据的无偏增压估计。 (英语) Zbl 07796637号

摘要:对于各种设置,Boosting方法已经进行了广泛讨论,大多数方法处理的数据都是完整的观察结果。尽管一些方法可用于具有删失响应的生存数据,但它们倾向于为生存过程假设一个特定模型,并且大多数方法提供数值实现程序,而没有严格的理论依据。在本文中,我们在不假设显式模型的情况下,针对删失生存数据提出了一种无偏增压估计方法,并探索了三种调整损失函数的策略,同时考虑了删失效应。我们使用函数梯度下降算法实现了该方法,并严格建立了理论结果,包括一致性和优化收敛性。我们的数值研究表明,该方法在有限样本环境下表现出令人满意的性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bellot,A.和van der Schaar,M.(2018a)。用于风险预测的增强树。机器学习研究论文集85,1-15。
[2] Bellot,A.和van der Schaar,M.(2018b)。多任务助推,用于具有竞争风险的生存分析。第32届神经信息处理系统会议(NeurIPS 2018),1-10。加拿大蒙特利尔。
[3] Benner,A.(2002年)。“聚合分类器”在生存时间研究中的应用。《计算统计学报:COMPSTAT 2002》(W.Härdle和B.Rönz编辑),171-176。海德堡Physica-Verlag·Zbl 1439.62008号
[4] Binder,H.和Schumacher,M.(2008)。考虑强制协变量,以提高稀疏高维生存模型的估计。BMC生物信息学9,1-10。
[5] Boyd,S.和Vandenberghe,L.(2004)。凸优化。剑桥大学出版社Buckley,J.和James,I.(1979)删失数据的线性回归。生物特征66,429-436·Zbl 0425.62051号
[6] Bühlmann,P.和Hothorn,T.(2007)。推进算法:正则化、预测和模型拟合。统计科学22,477-505·Zbl 1246.62163号
[7] Bühlmann,P.和Yu,B.(2003)。L2损失促进:回归和分类。《美国统计协会杂志》98,324-339·Zbl 1041.62029号
[8] Chen,Y.、Jia,Z.、Mercola,D.和Xie,X.(2013)。通过直接优化一致性指数进行生存分析的梯度增强算法。医学中的计算和数学方法2013,873595·Zbl 1307.92016年9月
[9] Cui,Y.,Zhu,R.,Zhou,M.和Kosorok,M.(2022)存活树和森林模型的一致性:分裂偏差和校正。中国统计局32,1245-1267·Zbl 1524.62475号
[10] Dabrowska,D.M.(1989)。核条件Kaplan-Meier估计的一致一致性。《统计年鉴》17,1157-1167·Zbl 0687.62035号
[11] Freund,Y.(1995)。将弱学习算法提升到大多数。信息与计算121,256-285·兹比尔083368109
[12] 弗里德曼,J.H.(2001)。贪婪函数近似:梯度增强机。《统计年鉴》29,1189-1232·兹比尔1043.62034
[13] Geenens,G.(2011)。非参数函数回归中的维数诅咒及相关问题。统计调查5,30-43·Zbl 1274.62283号
[14] Graf,E.、Schmoor,C.、Sauerbrei,W.和Schumacher,M.(1999)。生存数据预后分类方案的评估和比较。医学统计18,2529-2545。
[15] Hastie,T.、Tibshirani,R.和Friedman,J.(2008)。统计学习的要素。纽约州施普林格。
[16] He,K.,Li,Y.,Zhu,J.,Liu,H.,Lee,J.E.,Amos,C.I.等人(2016)。高维协变量生存分析中的成分梯度提升和错误发现控制。生物信息学32,50-57。
[17] Hothorn,T.、Bühlmann,P.、Dudoit,S.、Molinaro,A.和Van Der Laan,M.J.(2006)。生存合奏。生物统计学7,355-373·Zbl 1170.62385号
[18] Ishwaran,H.和Kogalur,U.B.(2010)随机存活森林的一致性。《统计学与概率快报》80,1056-1064·Zbl 1190.62177号
[19] 姜伟(2004)。AdaBoost的过程一致性。《统计年鉴》32,13-29·兹比尔1105.62316
[20] Lawless,J.F.(2003)。终身数据的统计模型和方法。纽约威利·Zbl 1015.62093号
[21] Lee,D.K.K.,Chen,N.和Ishwaran,H.(2021)。具有时间相关协变量的非参数风险增加。《统计年鉴》49,2101-2128·Zbl 1483.62161号
[22] Li,H.和Luan,Y.(2005)。使用平滑样条函数增强比例风险模型,并应用于高维微阵列数据。生物信息学21,2403-2409。
[23] Lu,W.和Li,L.(2008)。截尾生存数据非线性变换模型的Boosting方法。生物统计学9,658-667·兹比尔1437.62546
[24] Lugosi,G.和Vayatis,N.(2004年)。正则化boosting方法的Bayes-risk一致性。《统计年鉴》32,30-55·Zbl 1105.62319号
[25] Mayr,A.、Hofner,B.和Schmid,M.(2016)。通过协调指数和稳定性选择的优化提高稀疏生存模型的判别能力。BMC生物信息学17,1-12。
[26] Ridgeway,G.(1999)。增压状态。计算科学与统计31,172-181。
[27] Rubin,D.和van der Laan,M.J.(2007年)。一种双重稳健的审查无偏变换。国际生物统计学杂志3,1-21·Zbl 1133.62325号
[28] Schapire,R.E.(1990)。弱可学性的力量。机器学习5197-227。
[29] Schapire,R.E.和Freund,Y.(2014)。推进:基础和算法。麻省理工学院出版社,剑桥。
[30] Schmid,M.和Hothorn,T.(2008)。加速失效时间模型的灵活推进。BMC生物信息学9,1-13。
[31] Steingrimsson,J.A.、Diao,L.、Molinaro,A.M.和Strawderman,R.L.(2016)。加倍健壮的存活树木。医学统计35,3595-3612。
[32] van de Vijver,M.J.、He,Y.D.、van t Veer,L.J.、Dai,H.、Hart,A.A.M.、Voskuil,D.W.等人(2002年)。基因表达特征作为乳腺癌生存预测因子。《新英格兰医学杂志》第347期,1999-2009年。
[33] Wang,J.G.(1987)关于Kaplan-Meier估计一致一致性的注记。《统计年鉴》第15期,1313-1316页·Zbl 0631.62043号
[34] Wang,Z.和Wang,C.Y.(2010)。Buckley-James利用高维生物标记物数据进行生存分析。遗传学和分子生物学中的统计应用9,1-31·Zbl 1304.92101号
[35] Zhang,T.和Yu,B.(2005)。提前停止推进:收敛性和一致性。《统计年鉴》331538-1579·兹比尔1078.62038
[36] Zhu,R.和Kosorok,M.R.(2012年)。递归插补生存树。美国统计协会杂志107,331-340·Zbl 1261.62009年
[37] 国立成池大学统计系,台湾台北市11605。电子邮件:lchen723@nccu.edu.tw
[38] Grace Y.Yi,加拿大安大略省N6A 3K7,伦敦,西安大略大学统计与精算科学系和计算机科学系。
[39] 电子邮件:gyi5@uwo.ca(2021年2月收到;2022年6月接受)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。