×

通用的确定独立性筛选程序。 (英语) Zbl 1420.62146号

摘要:从超高维数据中提取重要特征是统计学习、信息论、精确医学和生物发现的主要任务之一。为满足这些需求而开发的许多可靠的独立筛选方法在某些假设下适用于特殊模型。随着更多数据类型和可能模型的可用性,需要一种无模型的通用筛选程序,其限制性假设越来越少。在本文中,我们基于最近开发的通用相关性度量:Ball相关性,提出了一种通用的非参数确定独立性筛选程序,称为BCor-SIS。我们表明,即使当维数是样本大小的指数阶时,该方法也具有很强的筛选一致性,并且不对数据施加次指数矩假设。我们通过考虑生物发现或精确医学中三种常见的挑战性设置来研究该程序的灵活性:迭代BCor-SIS、交互追踪和生存结果。我们使用仿真研究和实际数据分析来说明我们的BCor-SIS方法的通用性和实用性。

MSC公司:

62G05型 非参数估计
62N01号 审查数据模型

软件:

cmprskQR软件
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] O.贝尔宾。;Carrasquillo,M.M。;Crump,M。;O.J.卡利。;亨特,T.A。;马,L。;Bisceglio,G。;邹,F。;艾伦,M。;Dickson,D.W。;R.Graff-Radford,N。;C.Petersen,R。;摩根,K。;G.Younkin,S.,《晚发性阿尔茨海默病15个主要候选基因的研究》,《人类遗传学》,129,273-282(2011)
[2] 范,J。;Feng,Y。;Song,R.,稀疏超高维加性模型中的非参数独立性筛选,美国统计协会杂志,106,544-557(2009)·兹比尔1232.62064
[3] 范,J。;Feng,Y。;Tong,X.,《高维空间分类之路》。,《皇家统计学会杂志》,74745-770(2010)
[4] 范,J。;Li,R.,《基于非关联惩罚可能性的变量选择及其Oracle属性》,美国统计协会杂志,96,1348-1360(2001)·Zbl 1073.62547号
[5] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,英国皇家统计学会杂志,B系列,70849-911(2008)·Zbl 1411.62187号
[6] 范,J。;Song,R.,具有NP维的广义线性模型中的确定独立筛选,《统计年鉴》,38,3567-3604(2010)·Zbl 1206.68157号
[7] 范,Y。;孔,Y。;李,D。;Lv,J.,《与特征筛选和选择的互动追求》(2017)
[8] Gorst-Rasmussen,A。;Scheike,T.,《具有超高维特征的单指数危险率模型的独立筛选》,英国皇家统计学会杂志,75,217-245(2013)·Zbl 07555446号
[9] 格雷顿,A。;Fukumizu,K。;Teo,C.H。;宋,L。;肖尔科夫,B。;Smola,A.J.,《独立性的核心统计检验》,,神经信息处理系统研究进展, 2, 585-592 (2008)
[10] 郝,X。;严,J。;姚,X。;Risacher,S.L。;Saykin,A.J。;张博士。;Shen,L.,识别阿尔茨海默病遗传风险因素相关多模态神经成像生物标记物的诊断引导方法,太平洋生物计算研讨会,21,108-119(2016)
[11] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》。,1(2004),纽约:斯普林格,纽约
[12] 黄,D。;李,R。;Wang,H.,超高维分类数据的特征筛选及其应用,《商业与经济统计杂志》,32,237-244(2013)
[13] 孔,Y。;李,D。;范,Y。;Lv,J.,基于距离相关的高维多响应回归中的交互追求,《统计年鉴》,45897-922(2017)·Zbl 1368.62140号
[14] Lescai,F。;Chiamenti,A.M。;Codemo,A。;Pirazzini,C。;达戈斯蒂诺,G。;Ruaro,C。;吉多尼,R。;贝努西。;加林贝蒂,D。;埃斯波西托,F。;Marchegianil,F。;Cardelill,M。;Olivieril,F。;Nacmiasm,B。;Sorbim,S。;塔利亚维宁,F。;Albanio博士。;Boneschik,F.M。;比内提赫,G。;Santoro,A。;Forlonio,G。;Scarpinii,E。;克雷帕尔迪德,G。;Gabel-Lid,C。;Franceschi,C.,与减少相关的APOE单倍型ϵ4表达增加晚发性阿尔茨海默病的风险,阿尔茨海默氏病杂志,24,235-245(2011)
[15] 李,R。;钟伟。;Zhu,L.,通过距离相关学习进行特征筛选,美国统计协会杂志,1071129-1139(2012)·Zbl 1443.62184号
[16] Lyons,R.,度量空间中的距离协方差,《概率年鉴》,41,3284-3305(2013)·Zbl 1292.62087号
[17] 潘·W。;王,X。;张,H。;朱,H。;Zhu,J.,Ball协方差:巴拿赫空间依赖性的一般度量,未出版手稿(2018)
[18] 彭,L。;Fine,J.P.,《竞争风险量化回归》,《美国统计协会杂志》,1041440-1453(2009)·兹比尔1205.62090
[19] Sejdinovic,D。;Sriperumbudur,B.K。;格雷顿,A。;Fukumizu,K.,假设检验中基于距离和基于RKHS的统计的等价性,《统计学年鉴》,412263-2291(2013)·Zbl 1281.62117号
[20] 邵,X。;Zhang,J.,鞅差分相关及其在高维变量筛选中的应用,美国统计协会杂志,1091302-1318(2014)·Zbl 1368.62157号
[21] 柴田,N。;Kawarai,T。;Lee,J.H。;李·H·S。;柴田,E。;佐藤,C。;梁,Y。;杜阿拉,R。;马约,R.P。;George-Hyslop,P.H.,阿尔茨海默病中胆固醇代谢基因(CH25H、ABCA1和CH24H)的关联研究,《神经科学快报》,391142-146(2006)
[22] 宋,R。;卢·W。;马,S。;Jeng,X.J.,高维生存数据的审查等级独立性筛选,Biometrika,101799-814(2014)·Zbl 1306.62207号
[23] Tibshirani,R.,《通过拉索进行回归收缩和选择》,《皇家统计学会杂志》,58267-288(1996)·Zbl 0850.62538号
[24] Wang,H。;聂,F。;黄,H。;Kim,S。;Nho,K。;Risacher,S.L。;Saykin,A.J。;Shen,L.,通过群解析多任务回归和特征选择识别数量性状位点,生物信息学,28,229-237(2012)
[25] 王,X。;冷,C。;Dunson,D.B.,论高维变量筛选的一致性理论,神经信息处理系统,282431-2439(2015)
[26] Wang,Y。;Song,Y。;拉贾戈帕兰,P。;An,T。;刘凯。;周,Y。;古特曼,B.A。;多哥,A.W。;Thompson,P.M.,《基于表面的TBM增强检测大脑疾病影响的能力:一项N=804 ADNI研究》,《神经影像》,1993-2010年第56期(2011年)
[27] 赵S.D。;Li,Y.,具有超高维协变量的Cox模型的原则确定独立性筛选,多元分析杂志,105,397-411(2012)·Zbl 1233.62173号
[28] 钟伟。;Zhu,L.,基于距离相关的确定独立性筛选的迭代方法,统计计算与模拟杂志,85,2331-2345(2015)·Zbl 1457.62031号
[29] 朱,L。;李,L。;李,R。;Zhu,L.,超高维数据的无模型特征筛选,美国统计协会杂志,1061464-1475(2011)·Zbl 1233.62195号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。