×

一种用于高维回归和测试的带有广义岭估计的贝叶斯方法。 (英语) Zbl 1388.62214号

摘要:本文采用贝叶斯策略对高维回归进行广义岭估计。我们还考虑了基于所提出估计量的显著性检验,这对于选择回归变量很有用。理论和仿真研究都表明,所提出的估计量在均方误差(MSE)准则方面可以同时优于普通岭估计量和LSE。仿真研究还证明了我们的方案在稀疏模型下与Lasso的竞争MSE性能。我们使用涉及高维微阵列的肺癌数据演示了该方法。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
2015年1月62日 贝叶斯推断
62C05型 统计决策理论的一般考虑
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Allen,D.M.(1974)。变量选择和数据增强之间的关系以及预测方法。技术计量16:125-127·Zbl 0286.62044号
[2] Araki,Y.,Hattori,S.(2013年)。通过信息准则有效地选择正则化参数。统计通信-模拟和计算42(2):280-293·Zbl 1327.62417号
[3] Beer,D.G.、Kardia,S.L.R.、Huang,C.C.、Giordano,T.J.、Levin,A.M.等人(2002年)。基因表达谱预测肺腺癌患者的生存率。《自然医学》8:816-824。
[4] Bühlmann,P.(2013)。高维线性模型的统计显著性。伯努利19:1212-1242·Zbl 1273.62173号
[5] Candes,E.,Tao,T.(2007年)。Dantzig选择器:当p远大于n时的统计估计。统计年鉴35:2313-2351·Zbl 1139.62019号
[6] Chen,A.C.,Emura,T.(2016)。混合实验下带截距项的改进Liu型估计量。统计学中的传播——理论与方法。内政部:10.1080/03610926.2015.1132327·Zbl 1391.62138号
[7] Chen,H.Y.、Yu,S.L.、Chen,C.H.、Chang,G.C.、Chen、C.Y.等人(2007年)。非小细胞肺癌的五基因特征和临床结果。《新英格兰医学杂志》356:11-20。
[8] Cule,E.,De Iorio,M.(2013)。预测问题中的岭回归:岭参数的自动选择。遗传流行病学37:704-714。
[9] Cule,E.,Vineis,P.,De Iorio,M.(2011年)。遗传数据岭回归的显著性检验。BMC生物信息学12:372。
[10] Dicker,A.P.,Rodeck,U.(2005年)。从过去的试验预测未来:表皮生长因子受体的表达和分次放射治疗试验的结果。临床肿瘤学杂志23:5437-5439。
[11] Emura,T.,Chen,Y.H.(2016)。依赖性审查下生存数据的基因选择:一种基于交配的方法。医学研究中的统计方法25(6):2840-2857。
[12] Emura,T.、Chen,H.Y.、Chen、Y.H.(2017a)。R化合物。Cox:Cox比例风险模型3.1版CRAN下基于复合协变量方法的估计、基因选择和生存预测。
[13] Emura,T.,Chen,Y.H.,Chen,H.Y.(2012)。Cox比例风险模型下基于复合协变量的生存预测。公共科学图书馆·综合7:e47627。
[14] Emura,T.、Nakatochi,M.、Matsui,S.、Michimae,H.、Rondeau,V.(2017b)。根据肿瘤进展和高维遗传因素对死亡进行个性化动态预测:联合模型的荟萃分析,医学研究中的统计方法。内政部:10.1177/0962280216688032。
[15] Fan,J.,Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。美国统计协会杂志96:1348-1360·Zbl 1073.62547号
[16] Fan,J.、Lv,J.(2008)。确保超高维特征空间的独立筛选。(经过讨论)。英国皇家统计学会杂志B 70:849-911·Zbl 1411.62187号
[17] Fan,T.H.(2001)。单因素二次响应模型中最优解的非信息贝叶斯估计。试验10(2):225-240·Zbl 1014.62032号
[18] Friedman,J.、Hastie,T.、Simon,N.、Tibshirani,R.(2015)。Glmnet:Lasso和Elastic-Net正则化广义线性模型,2.0-2版。起重机。
[19] Golub,G.H.、Heath,M.、Wahba,G.(1979年)。广义交叉验证是一种选择良好脊线参数的方法。技术计量学21:215-223·Zbl 0461.62059号
[20] Hansen,B.E.(2016)。James-Stein和Lasso收缩的风险。计量经济学评论35(8-10):1456-1470·Zbl 1491.62067号
[21] Hastie,T.、Tibshirani,R.、Friedman,J.(2009)。统计学习的要素。纽约:Springer-Verlag·Zbl 1273.62005年
[22] Hoerl,A.E.,Kennard,R.W.(1970年)。岭回归:非正交问题的有偏估计。技术指标12:55-67·Zbl 0202.17205号
[23] Jang,D.-H.,Anderson-Cook,C.M.(2015)。混合和混合过程实验中评估岭回归估计量的可视化方法。国际质量与可靠性工程31(8):1483-1494。
[24] Jenssen,T.K.,Kuo,W.P.,Stokke,T.,Hovig,E.(2002年)。乳腺癌基因表达与患者生存率的关系。人类遗传学111:411-420。
[25] Jimichi,M.(2008)。可行广义岭回归估计的精确矩和数值计算。日本计算统计学会杂志21:1-20·兹比尔1261.62066
[26] Kibria,B.M.G.,Banik,S.(2016)。几种岭回归估计及其性能。现代应用统计方法杂志15(1):206-238。
[27] Kim,S.-Y.,Lee,J.-W.(2007)。基于基因表达数据重采样相似性度量的集成聚类方法。医学研究中的统计方法16:539-564。
[28] Loesgen,K.-H.(1990年)。具有良好先验均值的脊型估计的推广和贝叶斯解释。统计论文31:147-154·Zbl 0709.62057号
[29] Mallows,C.L.(1973)。关于Cp.Technometrics 15:661-675的一些评论·Zbl 0269.62061号
[30] 松井,S.(2006)。在使用微阵列的预后标记研究中使用重要基因子集预测生存结果。BMC生物信息学7:156。
[31] Theobald,C.M.(1974)。均方误差的推广应用于岭回归。英国皇家统计学会学报B 36:103-106·兹比尔0282.62055
[32] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志B 58:267-288·Zbl 0850.62538号
[33] Trenkler,G.(1985)。线性回归中估计量的均方误差矩阵比较。统计通讯A 14:2495-2509·Zbl 0594.62075号
[34] Trenkler,G.,Tourenburg,H.(1990年)。有偏估计量之间的均方误差矩阵比较——最新结果概述。统计论文31:165-179·Zbl 0703.62066号
[35] Wain,J.M.、Bruford,E.A.、Lovering,R.C.等人(2002年)。人类基因命名指南。基因组学79:464-470。
[36] Whittaker,J.C.、Thompson,R.、Denham,M.C.(2000)。使用岭回归的标记辅助选择。遗传学研究75:249-252。
[37] Wong,K.Y.,Chiu,S.N.(2015)。岭回归中最小化均方误差的迭代方法。计算统计学30(2):625-639·Zbl 1317.65047号
[38] Yang,S.P.(2014)。高维线性回归的一类广义岭估计。中央大学电子论文。台湾,1-41。
[39] Zhang,C.H.、Zhang和S.S.(2014)。高维线性模型中低维参数的置信区间。英国皇家统计学会杂志B 76(1):217-242·Zbl 1411.62196号
[40] Zhao,X.、Rödland,E.A.、Sörlie,T.等人(2011年)。结合基因特征可以提高乳腺癌生存率的预测。公共科学图书馆ONE 6:e17845。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。