×

基于稀疏限制伪核估计的超高维稀疏加性危险模型联合特征筛选。 (英语) Zbl 1432.62327号

摘要:由于超高维和右删失共存,开发超高维生存数据的特征筛选程序非常具有挑战性。本文针对具有超高维特征的稀疏加性危险模型,提出了一种联合筛选方法。我们提出的筛选基于稀疏限制的伪核估计,该估计可以通过迭代硬阈值算法有效获得。我们在相当温和的假设下,从理论上建立了所建议程序的可靠筛选特性。广泛的模拟研究验证了其相对于现有超高维生存数据主要筛选方法的改进。最后,通过一项乳腺癌研究的数据集说明了所提出的筛选方法。

MSC公司:

62N01号 审查数据模型
第62页第10页 统计学在生物学和医学中的应用;元分析

软件:

插补
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Annest,A.、Bumgarner,R.、Raftery,A.、Yeung,K.(2009年)。迭代贝叶斯模型平均:一种将生存分析应用于高维微阵列数据的方法。BMC生物信息学,10,72。
[2] Bertsekas,D.(2016)。非线性规划(第三版)。纳舒亚:雅典娜科技·兹比尔1360.90236
[3] Bickel,P.、Ritov,Y.、Tsybakov,A.(2009年)。同时分析套索和dantzig选择器。《统计年鉴》,第37期,1705-1732页·Zbl 1173.62022号
[4] Bradic,J.、Fan,J.和Jiang,J.(2011)。具有NP维的Cox比例风险模型的正则化。《统计年鉴》,39,3092-3120·Zbl 1246.62202号
[5] Cai,J.,Fan,J.、Li,R.、Zhou,H.(2005)。多元故障时间数据的变量选择。生物特征,92,303-316·Zbl 1094.62123号
[6] Chang,J.,Tang,C.,Wu,Y.(2013)。边际经验似然和确定独立性特征筛选。《统计年鉴》,41,2123-2148·Zbl 1277.62109号
[7] Chen,X.(2018)。超高维右删失数据的无模型条件特征筛选。统计计算与模拟杂志。https://doi.org/101080/00949655.2018.1466142。 ·Zbl 07192666号
[8] Chen,X.,Chen,X,Liu,Y.(2017)。关于通过距离相关进行分位数特征筛选的说明。统计文件。https://doi.org/10.1007/s00362-017-0894-8。 ·Zbl 1432.62092号
[9] Chen,X.,Chen,X,Wang,H.(2018)。通过距离相关性对超高维右删失数据进行稳健的特征筛选。计算统计与数据分析,119118-138·Zbl 1469.62043号
[10] Fan,J.,Li,R.(2002)。考克斯比例风险模型和脆弱性模型的变量选择。统计年鉴,3074-99·Zbl 1012.62106号
[11] Fan,J.、Lv,J.(2008)。超高维特征空间的确定独立筛选(讨论)。英国皇家统计学会期刊,B辑,70849-911·Zbl 1411.62187号
[12] Fan,J.,Song,R.(2010年)。具有NP-维数的广义线性模型中的确定独立筛选。《统计年鉴》,38,3567-3604·Zbl 1206.68157号
[13] Fan,J.、Feng,Y.、Wu,Y.(2010)。Cox比例风险模型的超高维变量选择。数理统计收藏研究所,6,70-86。
[14] Fan,J.、Samworth,R.、Wu,Y.(2009年)。超高维变量选择:超越线性模型。机器学习研究杂志,101829-1853·Zbl 1235.62089号
[15] Fan,J.、Ma,Y.、Dai,W.(2014)。稀疏超高维变系数模型中的非参数独立筛选。美国统计协会杂志,1091270-1284·Zbl 1368.62095号
[16] Gorst-Rasmussen,A.,Scheike,T.(2013)。具有超高维特征的单指标风险率模型的独立筛选。英国皇家统计学会杂志,B辑,75,217-245·Zbl 07555446号
[17] 何旭、王磊、洪浩(2013)。高维异质数据的分位数自适应无模型变量筛选。《统计年鉴》,41,342-369·Zbl 1295.62053号
[18] Huang,J.,Sun,T.,Ying,Z.,Yu,Y.,Zhang,C.(2013)。考克斯模型中套索的Oracle不等式。《统计年鉴》,第41期,第1142-1165页·Zbl 1292.62135号
[19] Leng,C.,Ma,S.(2007年)。加性风险模型中基于套索的路径一致性模型选择。医学统计,263753-3770。
[20] Li,G.,Peng,H.,Zhang,J.,Zhu,L.(2012a)。基于稳健秩相关的筛选。《统计年鉴》,第40期,1846-1877年·Zbl 1257.62067号
[21] Li,R.、Zhong,W.、Zhu,L.(2012b)。通过距离相关学习进行特征筛选。美国统计协会杂志,1071129-1139·Zbl 1443.62184号
[22] Lin,D.,Ying,Z.(1994)。加性风险模型的半参数分析。生物特征,81,61-71·Zbl 0796.62099号
[23] Lin,W.,Lv,J.(2013)。高维稀疏加性危险回归。美国统计协会杂志,108,247-264·Zbl 06158340号
[24] Liu,Y.,Chen,X.(2018)。基于某些变量的超高维异质数据分位数筛选。统计计算与模拟杂志,88,329-342·Zbl 07192555号
[25] Martinussen,T.,Scheike,T.(2009年)。具有高维回归的加性危险模型。《统计年鉴》,第15330-342页·Zbl 1282.62183号
[26] Song,R.、Lu,W.、Ma,S.、Jessie Jeng,X.(2014)。高维生存数据的删失秩独立筛选。生物特征,101799-814·Zbl 1306.62207号
[27] Tibshirani,R.(1997)。Cox模型中变量选择的套索方法。医学统计学,16385-395·doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3
[28] Troyanskaya,O.,Cantor,M.,Sherlock,G.,Brown,P.,Hastie,T.,Tibshirani,R.等人(2001年)。DNA微阵列缺失值估计方法。生物信息学,17,520-525·doi:10.1093/bioinformatics/17.6.520
[29] van t Veer,L.、Dai,H.、van de Vijver,M.、He,Y.、Hart,A.、Mao,M.等人(2002年)。基因表达谱预测乳腺癌的临床结局。《自然》,415530-536·doi:10.1038/415530a
[30] Wu,Y.,Yin,G.(2015)。超高维异质数据的条件分位数筛选。生物特征,102,65-76·Zbl 1345.62097号
[31] Xu,C.,Chen,J.(2014)。用于超高维特征筛选的稀疏MLE。美国统计协会杂志,1091257-1269·兹比尔1368.62295
[32] Yang,G.,Yu,Y.,Li,R.,Buu,A.(2016)。超高维Cox模型中的特征筛选。中央统计局,26881-901·Zbl 1356.62175号
[33] Yang,G.,Hou,S.,Wang,L.,Sun,Y.(2018)。超高维可加Cox模型中的特征筛选。统计计算与模拟杂志,88,1117-1133·Zbl 07192595号
[34] Zhang,C.,Zhang,T.(2012)。高维稀疏估计问题的凹正则化的一般理论。统计科学,27576-593·Zbl 1331.62353号
[35] 张杰、刘毅、吴毅(2017)。超高维生存数据的相关秩筛选。计算统计与数据分析,108,121-132·Zbl 1466.62226号
[36] Zhao,S.,Li,Y.(2012年)。超高维协变量Cox模型的原则确定独立性筛选。多元分析杂志,105,397-411·Zbl 1233.62173号
[37] Zhao,S.,Li,Y.(2014)。分数测试变量筛选。生物统计学,70862-871·Zbl 1393.62116号
[38] Zhou,T.,Zhu,L.(2017)。超高维删失回归的无模型特征筛选。统计与计算,27947-961·兹伯利1384.62144
[39] 朱莉、李莉、李瑞、朱莉(2011)。超高维数据的无模型特征筛选。美国统计协会杂志,1061464-1475·Zbl 1233.62195号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。