×

用分类控制进行部分充分变量筛选。 (英语) Zbl 07737931号

摘要:变量筛选作为一种快速有效的降维工具,在分析超高维数据中发挥着重要作用。虽然大量实际数据集同时包含连续变量和分类变量,但现有方法大多是为连续数据设计的。提出了部分充分变量筛选,其目的是在存在一些控制变量的情况下,在不丢失回归信息的情况下减少主要兴趣的预测集,并提供了理论保证。具体来说,对于涉及混合类型预测因子的回归分析,变量筛选是在充分性的概念下进行的,通过类别变量确定的子总体约束连续变量的减少。通过包括各种回归和分类模型的模拟研究,以及在弥漫性大B细胞淋巴瘤预后基因筛查中的应用,证明了该方法的有效性。

MSC公司:

62-08 统计问题的计算方法

软件:

插补
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴拉苏布拉马尼安,K。;Sriperumbudur,B。;Lebanon,G.,通过RKHS嵌入进行超高维特征筛选,(人工智能与统计(2013)),126-134
[2] 巴鲁特,E。;范,J。;Verhasselt,A.,《有条件的确定独立性筛选》,美国统计协会,111,515,1266-1277(2016)
[3] 陈,X。;库克·R·D。;邹,C.,充分降维诊断研究,Biometrika,102,3,545-558(2015)·Zbl 1452.62567号
[4] 奇亚罗蒙特,F。;库克·R·D。;Li,B.,用分类预测因子进行回归的充分降维,《Ann.Stat.》,30,2,475-497(2002)·Zbl 1012.62036号
[5] 崔,H。;李,R。;Zhong,W.,超高维判别分析的无模型特征筛选,美国统计协会,110,510,630-641(2015)·Zbl 1373.62305号
[6] 丁·S。;钱,W。;Wang,L.,双策略辅助高维删失数据的充分降维,Ann.Stat.,48,4,2132-2154(2020)·Zbl 1455.62192号
[7] Dong,Y。;于,Z。;朱,L.,回归中条件均值的无模型变量选择,计算。统计数据分析。,152,第107042条pp.(2020)·Zbl 1510.62172号
[8] 范,J。;Lv,J.,超高维特征空间的确定独立性筛选,J.R.Stat.Soc.,Ser。B、 统计方法。,70, 5, 849-911 (2008) ·Zbl 1411.62187号
[9] 范,J。;马云(Ma,Y.)。;Dai,W.,稀疏超高维变系数模型中的非参数独立性筛选,美国统计协会,109,507,1270-1284(2014)·Zbl 1368.62095号
[10] 冯,Z。;Wen,X.M。;于,Z。;Zhu,L.,《关于部分充分降维及其在部分线性多指标模型中的应用》,美国统计协会,108,501,237-246(2013)·Zbl 06158339号
[11] Fukumizu,K。;格雷顿,A。;兰克里特,G.R。;Schölkopf,B。;Sriperumbudur,B.K.,概率分布RKHS嵌入的核选择和分类,(Bengio,Y.;Schuurmans,D.;Lafferty,J.D.;Williams,C.K.I.;Culotta,A.,《神经信息处理系统进展》,第22卷(2009),Curran Associates,Inc.),1750-1758
[12] 格雷顿,A。;Fukumizu,K。;特奥,C。;宋,L。;Schölkopf,B。;Smola,A.,《独立性的核统计检验》,(Platt,J.;Koller,D.;Singer,Y.;Roweis,S.,《神经信息处理系统的进展》,第20卷(2008),麻省理工出版社),585-592
[13] 格雷顿,A。;Sejdinovic,D。;斯特拉赫曼,H。;巴拉克里希南,S。;庞蒂尔,M。;Fukumizu,K。;Sriperumbudur,B.K.,《大规模双样本测试的最佳内核选择》(Pereira,F.;Burges,C.J.C.;Bottou,L.;Weinberger,K.Q.,《神经信息处理系统的进展》,第25卷(2012),Curran Associates,Inc.),1205-1213
[14] He,D。;Cheng,J。;Xu,K.,通过基于核的条件均值依赖进行高维变量筛选,J.Stat.Plan。推理,224,27-41(2023)·Zbl 1502.62044号
[15] Hoeffing,W.,有界随机变量和的概率不等式,美国统计协会,58,301,13-30(1963)·Zbl 0127.10602号
[16] Hong,H.G。;Kang,J。;Li,Y.,超高维协变量与生存结果的条件性筛选,寿命数据分析。,24, 1, 45-71 (2018) ·Zbl 1468.62386号
[17] Ke,C。;Yin,X.,测试独立性的预期条件特征函数测量,美国统计协会,115,530,985-996(2020)·Zbl 1445.62091号
[18] 李,B。;库克·R·D。;Chiaromonte,F.,带分类预测因子回归中条件均值的降维,《Ann.Stat.》,31,5,1636-1668(2003)·Zbl 1042.62037号
[19] Li,K.-C.,《降维切片逆回归》,美国统计协会,86,414,316-327(1991)·Zbl 0742.62044号
[20] Li,L.,基于临床和基因表达信息的弥漫性大B细胞淋巴瘤生存预测,生物信息学,22,4,466-471(2006)
[21] 李,L。;Ke,C。;尹,X。;Yu,Z.,广义鞅差分散度:检测条件平均独立性及其在变量筛选中的应用,计算。统计数据分析。,180,第107618条pp.(2023)·Zbl 07708610号
[22] 李,R。;钟伟。;Zhu,L.,通过距离相关学习进行特征筛选,美国法律总汇,1074991129-1139(2012)·Zbl 1443.62184号
[23] 刘杰。;李,R。;Wu,R.,超高维协变量变系数模型的特征选择,美国统计协会,109,505,266-274(2014)·Zbl 1367.62048号
[24] Mai,Q。;Zou,H.,高维二进制分类中用于变量筛选的Kolmogorov滤波器,Biometrika,100,1,229-234(2013)·Zbl 1452.62456号
[25] Mai,Q。;Zou,H.,融合Kolmogorov滤波器:一种非参数无模型筛选方法,Ann.Stat.,43,4,1471-1497(2015)·Zbl 1431.62216号
[26] 罗森瓦尔德,A。;赖特,G。;Chan,W.C。;康纳斯,J.M。;坎波,E。;费舍尔,R.I。;俄罗斯天然气公司。;Muller-Hermelink,香港。;斯迈兰德,E.B。;Giltnane,J.M.,《利用分子分析预测弥漫性大B细胞淋巴瘤化疗后的生存率》,新英格兰。医学杂志,346,2521937-1947(2002)
[27] 邵,X。;Zhang,J.,鞅差分相关及其在高维变量筛选中的应用,美国统计协会,109,507,1302-1318(2014)·Zbl 1368.62157号
[28] Silverman,B.W.,《统计和数据分析密度估计》(1986),CRC出版社·Zbl 0617.62042号
[29] 唐,Z。;蔡,Z。;Yang,S。;Li,R.,利用FDR控制进行无模型条件特征筛选,美国统计协会(2022)
[30] 俄勒冈州特罗扬斯卡娅。;康托,M。;Sherlock,G。;布朗,P。;哈斯蒂,T。;Tibshirani,R。;博茨坦,D。;Altman,R.B.,DNA微阵列缺失值估计方法,生物信息学,17,6,520-525(2001)
[31] 王,X。;潘·W。;胡,W。;田,Y。;Zhang,H.,条件距离相关,J.Am.Stat.Assoc.,110,512,1726-1734(2015)·Zbl 1373.62288号
[32] 温,C。;潘·W。;黄,M。;Wang,X.,调整协变量与超高维数据混淆的确定独立性筛选,Stat.Sin。,28, 1, 293-317 (2018) ·兹比尔1382.62057
[33] 杨,B。;尹,X。;Zhang,N.,使用独立性测度进行连续响应的充分变量选择,J.Multivar。分析。,173, 480-493 (2019) ·Zbl 1422.62208号
[34] Yang,G。;Yang,S。;Li,R.,超高维广义变系数模型中的特征筛选,Stat.Sin。,30, 1049-1067 (2020) ·Zbl 1439.62258号
[35] Yin,X.,带分类预测因子的单指标模型中方向的非参数估计,Aust。N.Z.J.Stat.,47,2,147-161(2005)·Zbl 1134.62330号
[36] 尹,X。;Hilafu,H.,大p,小n问题的序贯充分降维,J.R.Stat.Soc.,Ser。B、 统计方法。,77, 4, 879-892 (2015) ·Zbl 1414.62194号
[37] 尹,X。;袁强,《一类新的独立性检验方法》,《国家统计局》。,2131-2154年3月30日(2020年)·Zbl 1466.62341号
[38] 袁,Q。;陈,X。;Ke,C。;Yin,X.,独立性指数——分类反应的充分变量筛选,计算。统计数据分析。,174,第107530条pp.(2022)·兹伯利07561892
[39] 周,Y。;刘杰。;Zhu,L.,条件独立性测试及其在条件筛选中的应用,J.Multivar。分析。,175,第104557条pp.(2020)·Zbl 1435.62160号
[40] 朱丽萍。;李,L。;李,R。;Zhu,L.-X.,超高维数据的无模型特征筛选,美国统计协会,106,496,1464-1475(2011)·Zbl 1233.62195号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。