×

包括异质性的离散生存模型中的变量选择。 (英语) Zbl 1383.62212号

摘要:对于连续时间到事件数据,有几个变量选择过程可用。然而,如果时间是以离散的方式测量的,因此出现了许多联系,那么连续时间的模型是不够的。我们提出了惩罚似然方法,该方法在离散生存模型中对种群异质性进行显式建模,从而进行有效的变量选择。该方法基于针对离散生存情况量身定制的脊型和套索型惩罚的组合。在模拟研究和第一个孩子出生时的应用中对性能进行了研究。

MSC公司:

62N01号 审查数据模型
62J07型 岭回归;收缩估计器(拉索)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Baker M,Melino A(2000),持续时间依赖性和非参数异质性:蒙特卡罗研究。《经济学杂志》96:357-393·兹比尔0956.62119 ·doi:10.1016/S0304-4076(99)00064-0
[2] Bradic J,Fan J,Jiang J(2011)考克斯比例风险模型的np维正则化。安统计39(6):3092·Zbl 1246.62202号 ·doi:10.1214/11-AOS911
[3] Broström G(2009)glmmML:带聚类的广义线性模型。http://CRAN.R-project.org/package=glmmML,R包版本0.81-6
[4] Brown C(1975)关于使用指示变量研究响应时间模型中参数的时滞依赖性。生物计量学31:863-872·Zbl 0342.62070号 ·doi:10.2307/2529811
[5] Bühlmann P,Van De Geer S(2011)高维数据统计:方法、理论和应用。纽约州施普林格·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[6] Cox DR(1972)回归模型和寿命表(含讨论)。J R统计社会学B 34:187-220·Zbl 0243.62041号
[7] Dezeure R,Bühlmann P,Meier L,Meinshausen N(2014)高维推断:置信区间,P值和R-Software hdi。arXiv预打印arXiv:14084026·Zbl 1426.62183号
[8] Dierckx P(1993)用样条曲线和曲面拟合。牛津科学出版社·Zbl 0782.41016号
[9] Do Ha I,Noh M,Lee Y(2012)《脆弱性:用h-似然拟合脆弱模型的包》。R J 4(2):28-36
[10] Efron B(1988)Logistic回归、生存分析和Kaplan-Meier曲线。美国统计协会杂志83:414-425·兹比尔0644.62100 ·doi:10.1080/01621459.1988.10478612
[11] Eilers PHC,Marx BD(1996),使用B样条和惩罚的灵活平滑。统计科学11:89-121·兹比尔0955.62562 ·doi:10.1214/ss/1038425655
[12] Fahrmeir L(1994)离散时间生存数据的动态建模和惩罚似然估计。生物特征81:317-330·Zbl 0807.62085号 ·doi:10.1093/biomet/81.2317
[13] Fahrmeir L,Kneib T(2011),纵向、空间和事件历史数据的贝叶斯平滑和回归。剑桥大学出版社·Zbl 1249.62003号 ·doi:10.1093/acprof:oso/9780199533022.001.0001
[14] Fahrmeir L,Knorr-Held L(1997)动态离散时间持续时间模型:通过马尔可夫链蒙特卡罗估计。社会学方法27(1):417-452·doi:10.111/1467-9531.271033
[15] Fahrmeir L,Tutz G(2001)基于广义线性模型的多元统计建模。纽约州施普林格·Zbl 0980.62052号 ·doi:10.1007/978-1-4757-3454-6
[16] Fan J,Li R(2002)Cox比例风险模型和脆弱性模型的变量选择。Ann Stat.第74-99页·Zbl 1012.62106号
[17] Friedman JH,Hastie T,Tibshirani R(2010),广义线性模型通过坐标下降的正则化路径。J Stat Softw统计软件33(1):1-22·doi:10.18637/jss.v033.i01
[18] Gamst A,Donohue M,Xu R(2009)比例风险混合效应模型中npmle的渐近性质和经验评估。统计Sin 19(3):997·Zbl 1166.62305号
[19] Gelman A、Hill J、Su Y、Yajima M、Pittau MG(2013)mi:缺失数据插补和模型检验。http://CRAN.R-project.org/package=mi,R包版本0.09-18.03
[20] 戈曼JJ\[(2010)\rm{五十} _1个\]Cox比例风险模型中的L1惩罚估计。生物杂志52:70-84·Zbl 1207.62185号
[21] Goeman JJ(2011)被处罚。R包版本0.9-42·Zbl 0813.65053号
[22] Groll A(2011)glmmLasso:[\text{L}_1]L1 enalized estimation广义线性混合模型的变量选择。http://CRAN.R-project.org/package=glmmLasso,R包版本1.2.3·兹比尔1235.62090
[23] Groll A,Tutz G(2014)基于L1-泛化估计的广义线性混合模型变量选择。统计计算24(2):137-154·Zbl 1325.62139号 ·数字对象标识代码:10.1007/s11222-012-9359-z
[24] Ham JC,Rea Jr SA(1987)《加拿大失业保险和男性失业持续时间》。《劳动经济学杂志》。第325-353页·Zbl 0956.62119号
[25] Hartzel J,Liu I,Agresti A(2001)描述分层有序列联表中的异质效应,并应用于多中心临床试验。计算统计数据分析。35(4):429-449 ·Zbl 1080.62523号 ·doi:10.1016/S0167-9473(00)00020-7
[26] Heckman JJ,Singer B(1984),计量经济学持续时间分析。经济学杂志24(1):63-132·Zbl 0531.62099号 ·doi:10.1016/0304-4076(84)90075-7
[27] 辛德,J。;Gilchrist,R.(编辑),复合泊松回归模型,109-121(1982),纽约·Zbl 0505.62050号
[28] Huinink J、Brüderl J、Nauck B、Walper S、Castiglioni L、Feldhaus M(2011)亲密关系和家庭动力学的小组分析(pairfam):概念框架和设计。《家庭研究杂志》23:77-101
[29] Kalbfleisch J,Prentice R(2002)《失效时间数据的统计分析》,第2版。纽约威利·Zbl 1012.62104号 ·doi:10.1002/9781118032985
[30] Kauermann G,Tutz G,Brüderl J(2005)《新成立公司的生存:变系数模型的案例研究》。J R Stat Soc A期刊168:145-158·Zbl 1100.62102号 ·doi:10.1111/j.1467-985X.2004.00341.x
[31] Laird N,Olivier D(1981)使用对数线性分析技术对截尾生存数据进行协方差分析。美国统计协会杂志76(374):231-240·Zbl 0473.62045号 ·网址:10.1080/01621459.1981.10477634
[32] Lancaster T(1990)转型数据的经济计量分析。剑桥大学出版社·Zbl 0717.62106号
[33] Land KC,Nagin DS,McCall PL(2001)具有隐藏异质性的离散时间风险回归模型——半参数混合泊松回归方法。社会方法研究29(3):342-373·doi:10.1177/0049124101029003004
[34] Leeb H,Pötscher BM(2005)模型选择与推理:事实与虚构。经济理论21(01):21-59·Zbl 1085.62004号 ·doi:10.1017/S0266466605050036
[35] Lin X,Breslow NE(1996)具有多个离散分量的广义线性混合模型中的偏差校正。美国统计协会杂志91:1007-2016·Zbl 0882.62059号 ·doi:10.1080/01621459.1996.10476971
[36] Littell R、Milliken G、Stroup W、Wolfinger R(1996)混合模型SAS系统。SAS Institute Inc.,卡里
[37] Liu Q,Pierce DA(1994)关于高斯-埃尔米特求积的一个注记。生物特征81:624-629·Zbl 0813.65053号
[38] Lockhart R、Taylor J、Tibshirani RJ和Tibshilani R(2014)《拉索的显著性检验》。安统计42(2):413·兹比尔1305.62254 ·doi:10.1214/13-AOS1175
[39] Möst S,Pößnecker W,Tutz G(2015)离散竞争风险模型的变量选择。合格数量。第1-22页
[40] Nauck B、Brüderl J、Huinink J、Walper S(2013)德国家庭小组(pairfam)。GESIS数据档案,科隆ZA5678数据文件版本4.0.0
[41] Nicoletti C,Rondinelli C(2010)具有未观察到的异质性的离散持续时间模型的(mis)规范:蒙特卡罗研究。经济学杂志159(1):1-13·Zbl 1431.62656号 ·doi:10.1016/j.jeconom.2010.04.003
[42] Park MY,Hastie T(2007)广义线性模型的l1正则路径算法。J R Stat Soc B公司69:659-677·Zbl 07555370号 ·文件编号:10.1111/j.1467-9868.2007.00607.x
[43] Pinheiro JC,Bates DM(1995)非线性混合效应模型中对数似然函数的近似。J计算图形统计4:12-35
[44] Pinheiro JC,Bates DM(2000),S和S-plus中的混合效应模型。纽约州施普林格·Zbl 0953.62065号 ·doi:10.1007/978-1-4419-0318-1
[45] Pötscher BM,Leeb H(2009)关于惩罚最大似然估计量的分布:套索、scad和阈值。多变量分析杂志100(9):2065-2082·Zbl 1170.62046号 ·doi:10.1016/j.jmva.2009.06.010
[46] Prentice RL,Gloeckler LA(1978)分组生存数据的回归分析与乳腺癌数据的应用。生物统计学34:57-67·Zbl 0405.62083号 ·doi:10.2307/2529588
[47] Rondeau V,Mazroui Y,Gonzalez JR(2012)脆弱包:使用惩罚似然估计或参数估计分析脆弱模型相关生存数据的R包。J统计软件47(4):1-28·doi:10.18637/jss.v047.i04
[48] Scheike T,Jensen T(1997):具有随机效应的离散生存模型:怀孕时间的应用。生物计量学。第318-329页·Zbl 0874.62135号
[49] Schwarz G(1978)估算模型的维数。安统计6:461-464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[50] Simon N,Friedman J,Hastie T,Tibshirani R(2011)Cox比例风险模型通过坐标下降的正则化路径。J Stat Softw统计软件39(5):1-13·doi:10.18637/jss.v039.i05
[51] Therneau T,Grambsch P(2000)生存数据建模:扩展Cox模型。纽约州施普林格·Zbl 0958.62094号 ·doi:10.1007/978-1-4757-3294-8
[52] Therneau TM(2013)S.R软件包版本2.37-4中的生存分析软件包
[53] Thompson WA(1977)关于生命研究中分组观察的处理。生物识别33:463-470·Zbl 0371.62149号 ·doi:10.2307/2529360
[54] Tibshirani R(1996)通过套索回归收缩和选择。J R Stat Soc B期刊58:267-288·Zbl 0850.62538号
[55] Tutz G,Pritscher L(1996)离散风险函数的非参数估计。终身数据分析2:291-308·Zbl 0862.62039号 ·doi:10.1007/BF00128979
[56] van Buuren S,Groothuis-Oudshoorn K(2011)《小鼠:通过R.JStat Softw中的连锁方程进行多元插补》45(3):1-67。http://www.jstatsoft.org/v45/i03/ ·Zbl 0342.62070号
[57] van Buuren S,Groothuis-Oudshoorn K(2013)《小鼠:通过R中的连锁方程进行多元插补》。http://CRAN.R-project.org/package=mice,R包版本2.18
[58] Van den Berg GJ(2001)持续时间模型:规范、标识和多重持续时间。经济手册5:3381-3460·doi:10.1016/S1573-4412(01)05008-5
[59] Venables WN,Ripley BD(2002)《现代应用统计学》,第4版。纽约州施普林格·Zbl 1006.62003号 ·doi:10.1007/978-0-387-21706-2
[60] Vermunt JK(1996)《对数线性事件历史分析:缺失数据、潜在变量和未观察到的异质性的一般方法》,第8卷。蒂尔堡大学出版社·Zbl 0878.62051号
[61] Vonesh EF(1996)关于拉普拉斯近似用于非线性混合效应模型的注释。生物计量学83:447-452·Zbl 0878.62019号 ·doi:10.1093/biomet/83.2.447
[62] Wolfinger R,O’Connell M(1993)广义线性混合模型;伪似然方法。J统计计算模拟48:233-243·Zbl 0833.62067号 ·doi:10.1080/0949659308811554
[63] Wood S,Scheip F(2013)Gamm4:使用mgcv和lme4的广义加性混合模型。http://CRAN.R-project.org/package=gamm4,R包版本0.2-2·Zbl 0243.62041号
[64] Wood SN(2006)《广义加性模型:R.Chapman和Hall/CRC简介》,伦敦·Zbl 1087.62082号
[65] Zou H(2006)自适应套索及其oracle属性。美国统计协会杂志101(476):1418-1429·Zbl 1171.62326号 ·doi:10.19198/016214506000000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。