×

基于惩罚广义拟似然的纵向数据变量选择。 (英语) Zbl 1407.62110号

Sutradhar,Brajendra C.(编辑),相关数据参数和半参数分析的进展和挑战。2015年国际统计研讨会论文集,ISS 2015,加拿大圣约翰,2015年7月6日至8日。查姆:斯普林格。莱克特。《票据统计》第218233-250页(2016年)。
摘要:具有大量协变量的高维纵向数据在许多生物医药应用中越来越普遍。为了便于解释,有必要识别充分代表数据的子模型。此外,包含冗余变量可能会妨碍估计和推断的准确性和效率。纵向数据的联合似然函数具有挑战性,尤其是在相关离散数据中。为了克服这个问题,L·王等【生物统计学68,第2期,353–360(2012;兹比尔1251.62051)]引入了惩罚GEE(PGEE),它具有一个非凸罚函数,只需要前两个边缘矩和一个工作相关矩阵;然而,存在模型误定的风险,如方差函数和相关结构,在这种情况下,我们提出了基于惩罚广义拟似然(PGQL)的变量选择。仿真研究表明,当模型假设成立时,PGQL方法的性能与PGEE相当。然而,当模型被错误地指定时,PGQL方法比PGEEs方法具有明显的优势。我们已经在一个实际例子中实现了该方法。
关于整个系列,请参见[Zbl 1347.62015年].

MSC公司:

62G05型 非参数估计
92C40型 生物化学、分子生物学
62H20个 关联度量(相关性、典型相关性等)
65二氧化碳 蒙特卡罗方法
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H:信息论是最大似然原理的延伸。参见:Petrove,B.N.,Csaki,F.(eds.)第二届信息理论研讨会,第267-282页。布达佩斯Akademiai Kiado(1973)
[2] Akaike,H:统计模型识别的新视角。IEEE传输。自动。控制19,716-723(1974)·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[3] Antoniadis,A.:《统计学中的小波:综述》(含讨论)。J.意大利统计协会6,97-144(1997)·Zbl 1454.62113号 ·doi:10.1007/BF03178905
[4] Antoniadis,A.,Fan,J.:小波近似的正则化。《美国统计协会期刊》96,939-967(2001)·Zbl 1072.62561号 ·doi:10.19198/0162114501753208942
[5] Cantoni,E.,Flemming,J.M.,Ronchetti,E.:边际纵向广义线性模型的变量选择。《生物特征》61,507-514(2005)·Zbl 1077.62056号 ·文件编号:10.1111/j.1541-0420.2005.00331.x
[6] Craven,P.,Wahba,G.:用样条函数平滑噪声数据:通过广义交叉验证方法估计平滑的正确程度。数字。数学。31, 377-403 (1979) ·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[7] 克劳德,M.J.:关于使用广义线性模型进行重复测量时工作相关矩阵的使用。《生物特征》82,407-410(1995)·Zbl 0823.62060号 ·doi:10.1093/biomet/82.2.407
[8] Donoho,D.L.,Johnstone,I.M.:小波收缩的理想空间自适应。《生物特征》81,425-455(1994)·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[9] Dziak,J.J.,Li,R.,Qu,A.:纵向数据二次推理函数方法概述。《统计学前沿》第1卷:生物统计和生物信息学的新发展,J.Fan、J.S.Liu和X.Lin(编辑),第3章,49-72。5 Toh Tuch Link,新加坡:世界科学出版社,(2009年)
[10] Fan,J.:评论A.Antoniadis的《统计学中的小波:评论》。《意大利统计协会杂志》,第6期,第131-138页(1997年)·Zbl 1454.62116号 ·doi:10.1007/BF03178906
[11] Fan,J.,Li,R.:基于非凹惩罚似然的变量选择及其预言性质。《美国统计协会期刊》96,1348-1360(2001)·兹比尔1073.62547 ·doi:10.1198/016214501753382273
[12] Fan,J.,Li,R.:纵向数据分析中半参数建模的新估计和模型选择程序。《美国统计协会期刊》第99卷,第710-723页(2004年)·Zbl 1117.62329号 ·doi:10.1198/016214500000060
[13] Liang,K.Y.,Zeger,S.L.:使用广义线性模型的纵向数据分析。《生物特征》73,13-22(1986)·Zbl 0595.62110号 ·doi:10.1093/biomet/73.1.13
[14] Lv,J.,Fan,Y.:使用正则化最小二乘进行模型选择和稀疏恢复的统一方法。Ann.Stat.37,3498-3528(2009年)·Zbl 1369.62156号 ·doi:10.1214/09-AOS683
[15] McKenzie,E.:泊松计数相关序列的一些ARMA模型。高级申请。普罗巴伯。20, 822-835 (1988) ·Zbl 0664.62089号 ·doi:10.2307/1427362
[16] Nadarajah,T.:基于惩罚经验似然的变量选择。纽芬兰纪念大学圣约翰分校硕士论文(2011年)
[17] Pan,W.:广义估计方程中的Akaike信息准则。生物统计学57,120-125(2001)·Zbl 1210.62099号 ·doi:10.1111/j.0006-341X.2001.00120.x
[18] Schwarz,G.:估算模型的维数。Ann.Stat.6,461-464(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[19] 不列颠哥伦比亚省Sutradhar:离散纵向响应回归模型概述。统计科学。18, 377-393 (2003) ·Zbl 1067.62072号 ·doi:10.1214/ss/1076102426
[20] Sutradhar,B.C.家族纵向数据的动态混合模型。纽约:施普林格出版社(2011)·Zbl 1277.62026号 ·doi:10.1007/978-1-4419-8342-8
[21] Sutradhar,B.C.,Das,K.:关于纵向数据广义线性模型中回归估计的效率。《生物特征》86,459-465(1999)·Zbl 0956.62053号 ·doi:10.1093/biomet/86.2.459
[22] Sutradhar,B.C.,Kovacevic,M.:分析有序纵向调查数据:广义估计方程方法。《生物特征》87,837-848(2000)·Zbl 1028.62009号 ·doi:10.1093/biomet/87.4.837
[23] Tibshirani,R.:通过套索进行回归收缩和选择。J.R.Stat.Soc.B 58,267-288(1996)·Zbl 0850.62538号
[24] Variyath,A.M.:通过经验似然在广义线性模型中选择变量。滑铁卢大学博士论文(2006年)
[25] Variyath,A.M.,Chen,J.,Abraham,B.:基于经验似然的变量选择。J.统计计划。推断。140, 971-981 (2010) ·Zbl 1179.62047号 ·doi:10.1016/j.jspi.2009.09.025
[26] Wang,H.,Leng,C.:通过最小二乘近似进行统一LASSO估计。《美国统计协会期刊》102,1039-1048(2007)·Zbl 1306.62167号 ·doi:10.1198/0162145000000509
[27] Wang,L.,Qu,A.:估计方程法中纵向数据的一致模型选择和数据驱动平滑测试。J.R.统计社会服务。B 71,177-190(2009)·Zbl 1231.62074号 ·doi:10.1111/j.1467-9868.2008.00679.x
[28] Wang,L.,Li,H.,Huang,J.:用于重复测量分析的非参数变系数模型中的变量选择。《美国统计协会期刊》103,1556-1569(2008)·Zbl 1286.62034号 ·doi:10.1198/0162145000000788
[29] Wang,L.,Zhou,J.,Qu,A.:高维纵向数据分析的惩罚广义估计方程。生物统计学68,353-360(2012)·Zbl 1251.62051号 ·doi:10.1111/j.1541-0420.2011.01678.x
[30] Wedderburn,R.W.M.:拟似然函数、广义线性模型和Gauss-Newton方法。生物特征61(3),439-444(1974)·Zbl 0292.62050号
[31] Xu,P.,Wu,P..,Wang,Y.,Zhu,L.X.:纵向数据分析中基于GEE的广义线性模型收缩估计。香港浸会大学数学系技术报告(2010年)
[32] 薛,L.,瞿,A.,周,J.:相关数据边际广义可加模型的一致模型选择。《美国统计协会期刊》105,1518-1530(2010)·兹比尔1388.62223 ·doi:10.1198/jasa.2010.tm10128
[33] 肖,N.,张,D.,张,H.H.:纵向研究中半参数混合模型的变量选择。生物统计学66,79-88(2009)·兹比尔1187.62075
[34] Zhang,H.H.,Lu,W.:考克斯比例风险模型的自适应拉索。《生物特征》94,691-703(2007)·Zbl 1135.62083号 ·doi:10.1093/biomet/asm037
[35] Zou,H.:自适应拉索及其预言属性。《美国统计协会期刊》101(476),1418-1429(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。