×

通过RKHS嵌入对分类数据进行基于分区的特征筛选。 (英语) Zbl 1510.62064号

摘要:本文提出了一种新的分类反应超高维数据筛选方法。通过利用预测因子之间的群结构,通过在最大平均差框架中嵌入再生核希尔伯特空间(RKHS),开发了一种新的基于分区的筛选方法,新方法能够识别边际筛选方法可能忽略的影响因素组。此外,通过使用RKHS嵌入,新的排名指数具有非常简单的形式,因此可以很容易地进行评估。作为副产品,新方法是无模型的,没有指定预测因子和响应之间的任何关系。通过数值研究和实际数据分析,证明了该方法具有一定的筛选性能,并说明了该方法的有效性。

MSC公司:

62-08 统计问题的计算方法
62G08号 非参数回归和分位数回归
62H30型 分类和区分;聚类分析(统计方面)

软件:

处罚LDA
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Berlinet,A。;Thomas-Agnan,C.,《概率统计中的核希尔伯特空间再现》(2011),施普林格科学与商业媒体
[2] Caliánski,T。;Harabasz,J.,用于聚类分析的树枝晶方法,Commun。统计师-理论方法,3,1,1-27(1974)·Zbl 0273.62010
[3] Chang,J。;Tang,C.Y。;Wu,Y.,边际经验似然和确定独立性特征筛选,Ann.Statist。,41, 4, 2123-2148 (2013) ·Zbl 1277.62109号
[4] 克莱门森,L。;哈斯蒂,T。;维滕,D。;Ersböll,B.,稀疏判别分析,技术计量学,53,4,406-413(2011)
[5] 崔,H。;李,R。;Zhong,W.,超高维判别分析的无模型特征筛选,J.Amer。统计师。协会,110,510,630-641(2015)·Zbl 1373.62305号
[6] 范,J。;Feng,Y。;Tong,X.,高维空间中的分类之路:正则化最优仿射判别式,J.R.Stat.Soc.Ser。B统计方法。,74, 4, 745-771 (2012) ·Zbl 1411.62167号
[7] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J.R.Stat.Soc.Ser。B统计方法。,70, 5, 849-911 (2008) ·Zbl 1411.62187号
[8] 范,J。;Song,R.,具有np维的广义线性模型中的确定独立筛选,Ann.Statist。,38, 6, 3567-3604 (2010) ·Zbl 1206.68157号
[9] Feng,Y。;Wu,Y。;Stefanski,L.A.,《通过优选平滑带宽进行非参数独立筛选》,J.Statist。计划。推理,197,1-14(2018)·Zbl 1432.62093号
[10] 格雷顿,A。;Borgwardt,K。;拉什,M。;Schölkopf,B。;Smola,A.J.,双样本问题的核方法,(神经信息处理系统进展(2007)),513-520
[11] 何,X。;Wang,L。;Hong,H.G.,高维异质数据的分位数自适应无模型变量筛选,Ann.Statist。,41, 1, 342-369 (2013) ·Zbl 1295.62053号
[12] 黄,D。;李,R。;Wang,H.,超高维分类数据的特征筛选及其应用,J.Bus。经济。统计人员。,32, 2, 237-244 (2014)
[13] Kang,J。;Hong,H.G。;Li,Y.,基于分区的超高维变量筛选,Biometrika,104,4,785-800(2017)·兹伯利07072328
[14] Ke,C。;Yin,X.,测试独立性的预期条件特征函数测量,J.Amer。统计师。协会,115、530、985-996(2020年)·Zbl 1445.62091号
[15] 李,R。;钟伟。;Zhu,L.,通过距离相关学习进行特征筛选,J.Amer。统计师。协会,1074991129-1139(2012)·Zbl 1443.62184号
[16] 林,L。;Sun,J。;Zhu,L.,非参数特征筛选,计算。统计师。数据分析。,67, 162-174 (2013) ·Zbl 1471.62119号
[17] 刘杰。;李,R。;Wu,R.,超高维协变量变系数模型的特征选择,J.Amer。统计师。协会,109,505,266-274(2014)·Zbl 1367.62048号
[18] 卢,J。;Lin,L.,具有超高维预测因子的多响应变系数模型的特征筛选,计算。统计师。数据分析。,128, 242-254 (2018) ·Zbl 1469.62113号
[19] Mai,Q。;Zou,H.,融合kolmogorov滤波器:一种非参数无模型筛选方法,Ann.Statist。,43, 4, 1471-1497 (2015) ·Zbl 1431.62216号
[20] Murtagh,F.,《层次聚类算法最新进展概览》,计算。J.,26,4354-359(1983)·Zbl 0523.68030号
[21] 潘,R。;Wang,H。;Li,R.,通过两两确定独立筛选进行超高维多类线性判别分析,J.Amer。统计师。协会,111,513,169-179(2016)
[22] Tibshirani,R。;哈斯蒂,T。;Chu,G.,通过基因表达的收缩质心诊断多种癌症,Proc。国家。阿卡德。科学。,99, 10, 6567-6572 (2002)
[23] 王,X。;Leng,C.,筛选变量的高维普通最小二乘投影,J.R.Stat.Soc.Ser。B统计方法。,78, 589-611 (2016) ·Zbl 1414.62313号
[24] Witten,D.M。;Tibshirani,R.,使用fisher线性判别法进行惩罚分类,J.R.Stat.Soc.Ser。B统计方法。,73, 5, 753-772 (2011) ·Zbl 1228.62079号
[25] 谢军。;Lin,Y。;Tang,N.,超高维异质分类数据的类别自适应变量筛选,J.Amer。统计师。协会,115、530、747-760(2020年)·Zbl 1445.62020号
[26] 赵S.D。;Li,Y.,超高维协变量cox模型的原则确定独立性筛选,《多元分析杂志》。,105, 1, 397-411 (2012) ·Zbl 1233.62173号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。