×

非多项式维广义线性模型的稳健确定独立筛选。 (英语) Zbl 07748384号

摘要:我们考虑非多项式阶超高维广义线性模型(GLM)中的变量筛选问题。由于流行的SIS方法在存在污染和噪声的情况下极不稳定,我们讨论了一种基于边际回归系数的最小密度功率发散估计器(MDPDE)的新的鲁棒筛选程序。我们提出的筛选程序在纯数据和污染数据场景下表现良好。我们为使用边际MDPDE从人群和样本两个方面进行变量筛选提供了理论依据;特别地,我们证明了边缘MDPDE一致一致,从而确保了我们提出的算法的屏蔽特性。最后,我们针对GLM中的稳健条件筛选提出了一种基于MDPDE的适当扩展,并推导了其确定筛选属性。我们提出的方法通过广泛的数值研究以及有趣的实际数据应用进行了说明。
{©2022作者。斯堪的纳维亚统计杂志由John Wiley&Sons Ltd代表斯堪的纳维亚统计杂志基金会董事会出版。}

MSC公司:

62至XX 统计学

软件:

姐妹
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barut,E.、Fan,J.和Verhasselt,A.(2016年)。有条件的确定独立性筛选。《美国统计协会杂志》,111(515),1266-1277。
[2] Basak,S.、Basu,A.和Jones,M.C.(2021)。关于“最佳”密度功率发散调谐参数。应用统计学杂志,48(3),536-556·Zbl 1521.62257号
[3] Basu,A.、Ghosh,A.、Mandal,A.、Martin,N.和Pardo,L.(2017年)。基于最小密度幂散度估计的逻辑回归模型中检验线性假设的Wald型检验统计量。电子统计杂志,112741-2772·Zbl 1366.62052号
[4] Basu,A.、Ghosh,A.、Mandal,A.、Martin,N.和Pardo,L.(2021年)。基于最小密度功率发散估计量的随机设计GLM中的稳健Wald型检验。统计方法与应用,30(3),973-1005·Zbl 1480.62041号
[5] Basu,A.、Harris,I.R.、Hjort,N.L.和Jones,M.C.(1998年)。通过最小化密度功率发散,实现稳健高效的估计。生物特征,85,549-559·Zbl 0926.62021号
[6] Basu,A.、Shioya,H.和Park,C.(2011年)。统计推断:最小距离法。查普曼
[(&\]\)霍尔/CRC出版社·兹比尔1281.62016
[7] Buhlmann,P.和Van De Geer,S.(2011年)。高维数据统计:方法、理论和应用。施普林格科技与商业媒体·Zbl 1273.62015年
[8] Fan,J.,&Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。美国统计协会杂志,96,1348-1360·Zbl 1073.62547号
[9] Fan,J.和Lv,J.(2008)。确保超高维特征空间的独立筛选。英国皇家统计学会期刊:B系列(统计方法论),70(5),849-911·Zbl 1411.62187号
[10] Fan,J.和Song,R.(2010年)。具有NP维的广义线性模型中的确定独立筛选。《统计年鉴》,38(6),3567-3604·兹比尔1206.68157
[11] Gather,U.和Guddat,C.(2008年)。Fan,JQ和Lv,J.评论超高维特征空间的确定独立筛选。英国皇家统计学会杂志:B辑,70893-895。
[12] Gavine,P.R.、Wang,M.、Yu,D.、Hu,E.、Huang,C.、Xia,J.、Su,X.、Fan,J.,Zhang,T.、Ye,Q.和Zheng,L.(2015)。MAPK7(ERK5)失调作为肺鳞状细胞癌和食管癌新致癌靶点的鉴定和验证。BMC癌症,15(1),1-9。
[13] Ghosh,A.(2019)。贝塔回归模型下的稳健推断及其在卫生保健研究中的应用。医学研究中的统计方法,28(3),871-888。
[14] Ghosh,A.和Basu,A.(2013年)。使用密度幂散度对独立非齐次观测值进行稳健估计,并应用于线性回归。《电子统计杂志》,7,2420-2456·Zbl 1349.62087号
[15] Ghosh,A.和Basu,A.(2016)。广义线性模型中的稳健估计:密度幂散度方法。试验,25(2),269-290·Zbl 1342.62126号
[16] Ghosh,A.和Majumdar,S.(2020年)。使用非凹惩罚密度幂散度的超高维稳健高效稀疏回归。IEEE信息理论汇刊,66(12),7812-7827·Zbl 1457.62211号
[17] Ghosh,A.和Thoresen,M.(2021)。超高维数据的稳健变量筛选程序。医学研究中的统计方法,30(8),1816-1832。
[18] Giraud,C.(2014)。高维统计介绍。查普曼和霍尔/CRC出版社。
[19] 郭,X.,任,H.,邹,C.,&李,R.(2022)。用于错误率控制的特征筛选中的阈值选择。美国统计协会杂志。https://doi.org/101080/01621459.2021.2011735 ·Zbl 07751807号 ·doi:10.1080/01621459.2021.2011735
[20] Hall,P.和Miller,H.(2009年)。在高维问题中使用广义相关性来影响变量选择。计算与图形统计杂志,18(3),533-550。
[21] Hampel,F.R.、Ronchetti,E.、Rousseeuw,P.J.和Stahel,W.(1986年)。稳健统计:基于影响函数的方法。约翰·威利父子公司·Zbl 0593.62027号
[22] Hastie,T.、Tibshirani,R.和Wainwright,M.(2015)。稀疏性统计学习:套索和概括。CRC出版社·Zbl 1319.68003号
[23] Kiehl,S.、Herkt,S.C.、Richter,A.M.、Fuhrmann,L.、El‐Nikhely,N.、Seeger,W.、Savai,R.和Dammann,R.H.(2014)。ABCB4在人类癌症中经常表观遗传学沉默,并抑制肿瘤生长。科学报告,4(1),1-9。
[24] Li,G.,Peng,H.,Zhang,J.,&Zhu,L.(2012)。基于稳健秩相关的筛选。《统计年鉴》,40(3),1846-1877年·兹比尔1257.62067
[25] Li,R.,Zhong,W.,&Zhu,L.(2012)。通过距离相关学习进行特征筛选。《美国统计协会杂志》,107(499),1129-1139·Zbl 1443.62184号
[26] Lund,E.、Dumeaux,V.、Braaten,T.、Hjartaker,A.、Engeset,D.、Skeie,G.和Kumle,M.(2008)。队列简介:挪威妇女与癌症研究——NOWAC-Kvinner og kreft。《国际流行病学杂志》,37(1),36-41。
[27] Luo,S.、Song,R.和Witten,D.(2014)。确定筛选高斯图形模型。统计,1050(29),4。
[28] Meinshausen,N.和Buhlmann,P.(2010年)。稳定性选择。英国皇家统计学会杂志:B辑(统计方法),72417-473·Zbl 1411.62142号
[29] Mu,W.,&Xiong,S.(2014)。关于稳健确定独立筛选的一些注释。应用统计学杂志,41(10),2092-2102·Zbl 1352.62096号
[30] Saldana,D.F.和Feng,Y.(2018年)。SIS:超高维统计模型中确定独立性筛选的R包。《统计软件杂志》,83(2),1-25。
[31] Sandanger,T.M.、Nöst,T.H.、Guida,F.、Rylander,C.、Campanella,G.、Muller,D.C.、Van Dongen,J.、Boomsma,D.I.、Johansson,M.、Vineis,P.和Vermeulen,R.(2018年)。挪威女性和癌症队列中肺癌诊断前血液中的DNA甲基化和相关基因表达。科学报告,8(1),1-10。
[32] Wang,T.,Zheng,L.,Li,Z.和Liu,H.(2017)。高维数据的稳健变量筛选方法。应用统计学杂志,44(10),1839-1855·Zbl 1516.62651号
[33] Warwick,J.和Jones,M.C.(2005年)。选择鲁棒性调整参数。统计计算与模拟杂志,75581-588·Zbl 1115.62317号
[34] Zhang,T.,Shi,W.,Tian,K.,&Kong,Y.(2020)。含伴侣蛋白的t复合肽1亚单位6A与非小细胞肺癌的淋巴结转移、异常癌胚抗原和不良生存状况相关。世界外科肿瘤学杂志,18(1),1-10。
[35] Zhao,S.D.,&Li,Y.(2012)。具有超高维协变量的Cox模型的原则确定独立性筛选。多元分析杂志,105(1),397-411·Zbl 1233.62173号
[36] Zhong,W.(2014)。对超高维非正态数据进行稳健可靠的独立性筛选。《数学学报》英文丛书,30(11),1885-1896·Zbl 1305.62092号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。