×

椭圆copula回归模型的稳健特征筛选。 (英语) Zbl 1431.62157号

本文提出了椭圆Copula回归(ECR)模型的自适应稳健筛选。作者通过以下方式介绍ECR模型。设(f=\left\lbrace f_{0},f_{1},\ldots,f_}p}\right\rbrace)是一组单调的单变量函数。随机向量(mathbf{Z}=left(Y,X{1},ldots,X{p}\right)^{mathrm{T}})满足ECR模型当且仅当向量(left(f_{0}\left(Y\right[f_{0}\左(Y\右)=\sum_{j=1}^{p}\beta_{j}f_{j{\左(X_{jneneneep\right)+\epsilon,\]其中\(Y\)是响应,\(\left(X_{1},\ldots,X_{p}\right)^{\mathrm{T}}})是协变量,\(\epsilon\)是误差项。筛选程序基于Kendall’s(tau)估计的分类典型相关。
作者摘要:理论分析表明,该方法具有一定的筛选特性,即在概率趋于1的情况下,特征筛选过程选择了所有重要变量,并根据样本大小将维数大大降低到中等大小。进行了深入的数值研究,以说明其相对于现有特征筛选方法的优势。最后,将所提出的方法应用于基因表达实际数据集,以证明其经验有用性。

MSC公司:

62G08号 非参数回归和分位数回归
62G35型 非参数稳健性
62小时05 多元概率分布的表征与结构理论;连接线

软件:

火箭
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴伯,R.F。;Kolar,M.,《火箭:基于Kendallτ的跨椭圆图形模型稳健置信区间》,《统计年鉴》。,46、6B、3422-3450(2018)·Zbl 1410.62059号
[2] Boldstad,B。;爱尔兰共和国。;Astrand,M。;Speed,T.,基于偏差和方差的高密度寡核苷酸阵列数据归一化方法的比较,生物信息学,19,2,185-193(2003)
[3] Cai,T.T。;张,L.,高维高斯copula回归:自适应估计和统计推断,统计学。Sinica,28963-993(2018)·Zbl 1390.62099号
[4] 坎迪斯,E。;Tao,T.,dantzig选择器:当p远大于n时的统计估计,Ann.Statist。,3521313-2351(2007年)·Zbl 1139.62019号
[5] 蒋,A.P。;贝克,J.S。;Yen,H.-J。;Tayeh,M.K。;Scheetz,T.E。;瑞典斯威德斯基。;西村,D.Y。;Braun,T.A。;Kim,K.-Y.A。;Huang,J.,利用SNP阵列进行纯合度映射,将e3泛素连接酶trim32确定为bardet–biedl综合征基因(bbs11),Proc。国家。阿卡德。科学。,103162876-292(2006年)
[6] 崔,H。;李,R。;Zhong,W.,超高维判别分析的无模型特征筛选,J.Amer。统计师。协会,110,510,630-641(2015)·兹比尔1373.62305
[7] 范,J。;Feng,Y。;Song,R.,稀疏超高维可加模型中的非参数独立筛选,J.Amer。统计师。协会,106,494,544-557(2011)·Zbl 1232.62064号
[8] 范,J。;Li,R.,通过非冲突惩罚似然进行变量选择及其预言性质,J.Amer。统计师。协会,96,456,1348-1360(2001)·Zbl 1073.62547号
[9] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J.R.Stat.Soc.Ser。B.统计方法。,70, 5, 849-911 (2008) ·Zbl 1411.62187号
[10] 范,J。;马云(Ma,Y.)。;Dai,W.,稀疏超高维变系数模型中的非参数独立筛选。,J.Amer。统计师。协会,109,507,1270(2014)·Zbl 1368.62095号
[11] 范,J。;薛,L。;Zou,H.,超正态模型下的多任务分位数回归,J.Amer。统计师。协会,1115161726-1735(2016)
[12] 方,H.B。;Fang,K.T。;Kotz,S.,《给定边缘的超椭圆分布》,《多元分析杂志》。,82, 1, 1-16 (2002) ·Zbl 1002.62016年
[13] Han,F。;Liu,H.,高维超椭圆数据的尺度不变稀疏PCA,J.Amer。统计师。协会,109,505,275-287(2014)·Zbl 1367.62185号
[14] 黄,J。;霍洛维茨,J.L。;魏凤,非参数可加模型中的变量选择,统计年鉴。,38, 4, 2282-2313 (2010) ·Zbl 1202.62051号
[15] 爱尔兰共和国。;霍布斯,B。;科林,F。;Beazer-Barclay,Y.D。;Antonellis,K.J。;谢尔夫,美国。;Speed,T.P.,《高密度寡核苷酸阵列探针水平数据的探索、规范化和总结》,生物统计学,4,2,249-264(2003)·Zbl 1141.62348号
[16] Kong,X.B。;刘,Z。;姚,Y。;Zhou,W.,《通过对典型相关性进行排序进行确定性筛选》,Test,26,1,1-25(2017)·Zbl 1402.62071号
[17] 李·G。;彭,H。;张杰。;朱磊,基于稳健秩相关的筛选,安统计学家。,40, 3, 1846-1877 (2012) ·Zbl 1257.62067号
[18] 李·G。;彭,H。;Zhu,L.,具有发散参数数的非凹惩罚m-估计,Statist。Sinica,21,1,391-419(2011)·Zbl 1206.62036号
[19] 李,R。;钟伟。;Zhu,L.,通过距离相关学习进行特征筛选,J.Amer。统计师。协会,1074991129-1139(2012)·Zbl 1443.62184号
[20] Lindskog,F。;麦克尼尔,A。;施莫克。,U.,椭圆分布的Kendallτ。,信贷风险,149-156(2003)
[21] 刘,H。;Han,F。;袁,M。;Lafferty,J。;Wasserman,L.,高维半参数高斯copula图形模型,Ann.Statist。,40, 4 (2012) ·兹比尔1297.62073
[22] Liu,J.Y。;钟伟。;Li,R.,超高维数据特征筛选的选择性概述,科学。中国数学。,58, 10, 1-22 (2015) ·Zbl 1327.62345号
[23] Meier,L。;Geer,S.V.D。;Bühlmann,P.,《高维加性建模》,《统计年鉴》。,37、6B、3779-3821(2009)·Zbl 1360.62186号
[24] Scheetz,T.E。;Kim,K.-Y.A。;瑞典斯威德斯基。;菲尔普,A.R。;Braun,T.A。;Knudtson,K.L。;多伦斯,A.M。;DiBona,G.F。;黄,J。;Casavant,T.L.,哺乳动物眼睛中基因表达的调节及其与眼病的相关性,Proc。国家。阿卡德。科学。,103, 39, 14429-14434 (2006)
[25] 宋,R。;卢·W。;马,S。;Jessie Jeng,X.,《高维生存数据的审查等级独立性筛选》,Biometrika,101,4,799-814(2014)·Zbl 1306.62207号
[26] Sun,T。;Zhang,C.-H.,标度稀疏线性回归,Biometrika,99,4,879-898(2012)·Zbl 1452.62515号
[27] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.Ser。B.统计方法。,58, 1, 267-288 (1996) ·Zbl 0850.62538号
[28] 韦塞尔曼,A.M。;Praag,B.M.S.V.,椭圆回归操作化,经济学。莱特。,23269-274(1987年)·Zbl 1328.62451号
[29] 袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,J.R.Stat.Soc.Ser。B.统计方法。,68, 1, 49-67 (2006) ·Zbl 1141.62030号
[30] 张春华,极小极大凹惩罚下的几乎无偏变量选择,安统计学家。,38, 2, 894-942 (2010) ·Zbl 1183.62120号
[31] 朱,L。;李,L。;李,R。;Zhu,L.,超高维数据的无模型特征筛选,J.Amer。统计师。协会,106,496,1464-1475(2011)·Zbl 1233.62195号
[32] Zou,H.,《自适应套索及其预言属性》,J.Amer。统计师。协会,101,476,1418-1429(2006)·Zbl 1171.62326号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。