×

超高维可加部分线性模型的稀疏模型识别与学习。 (英语) Zbl 1422.62188号

摘要:可加部分线性模型(APLM)结合了非参数回归的灵活性和回归模型的简约性,被广泛用作多元非参数回归中缓解“维数灾难”的流行工具。实践中提出的一个自然问题是非参数部分的结构选择,即连续协变量是以线性形式还是非参数形式进入模型,对于线性和非参数分量都可能大于样本量的超高维APLM,我们提出了一个同时进行稀疏模型识别和学习的综合框架。我们提出了一种快速有效的两阶段程序。在第一阶段,我们将非参数函数分解为线性部分和非线性部分。用常样条基逼近非线性函数,提出了一种利用自适应群LASSO选择非零分量的三重惩罚方法。在第二阶段,我们使用高阶多项式样条对选定的协变量重新拟合数据,并应用样条支持的局部线性平滑来获得估计量的渐近正态性。该程序与模型结构识别一致。它可以正确有效地识别零、线性和非线性分量。可以对线性系数和非参数函数进行推断。我们进行了模拟研究以评估该方法的性能,并将所提出的方法应用于玉米基因型茎尖分生组织(SAM)的数据集以进行说明。

理学硕士:

62甲12 多元分析中的估计
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社,剑桥·Zbl 1058.90049号
[2] Breheny,P.,:分组协变量回归模型的正则化路径(2016),R(右)软件包版本3.0-2。可在“<ce:inter-ref id=“interref1”xlink:role=“http://www.elsevier.com/xml/linking-roles/text/html“xlink:href=”https://cran.r-project.org/web/packages/grpreg/index.html“xlink:type=”simple“>https://cran.r-project.org/web/packages/grpreg/index.html
[3] Breheny,P。;Huang,J.,具有分组预测因子的非凸惩罚线性和逻辑回归模型的群下降算法,Stat.Comput。,173-187年5月25日(2015年)·Zbl 1331.62359号
[4] 陈,J。;Chen,Z.,用于大模型空间模型选择的扩展贝叶斯信息标准,Biometrika,95759-771(2008)·Zbl 1437.62415号
[5] 陈,Z。;Chen,J.,Tournament screening cum EBIC for feature selection with high dimensions feature spaces,科学。中国Ser。A: 数学。,52, 1327-1341 (2009) ·Zbl 1176.62014年
[6] Claeskens,G。;Van Keilegom,I.,回归曲线及其导数的Bootstrap置信带,Ann.Statist。,31, 1852-1884 (2003) ·Zbl 1042.62044号
[7] 范,J。;Feng,Y。;Song,R.,稀疏超高维可加模型中的非参数独立筛选,J.Amer。统计师。协会,106,544-557(2011)·Zbl 1232.62064号
[8] 范,J。;Gijbels,I.,《局部多项式建模及其应用》(1996),佛罗里达州博卡拉顿CRC出版社·Zbl 0873.62037号
[9] 范,J。;Li,R.,通过非冲突惩罚似然进行变量选择及其预言性质,J.Amer。统计师。协会,96,1348-1360(2001)·Zbl 1073.62547号
[10] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J.R.Stat.Soc.Ser。B.统计方法。,70, 849-911 (2008) ·Zbl 1411.62187号
[11] 黄,J。;Breheny,P。;Ma,S.,《高维模型中群体选择的选择性综述》,统计学。科学。,27, 481-499 (2012) ·兹比尔1331.62347
[12] 黄,J。;霍洛维茨,J.L。;魏凤,非参数可加模型中的变量选择,统计年鉴。,38, 2282-2313 (2010) ·Zbl 1202.62051号
[13] 黄,J。;魏,F。;Ma,S.,半参数回归追踪,统计学。Sinica,221403-1426(2012)·Zbl 1253.62024号
[14] Lee,E.R。;Noh,H。;Park,B.U.,通过分位数回归模型的贝叶斯信息准则进行模型选择,J.Amer。统计师。协会,109216-229(2014)·Zbl 1367.62122号
[15] 莱博夫,S。;李,X。;胡海川。;托德,N。;杨,J。;李,X。;Yu,X。;Muehlbauer,G.J。;Timmermans,M.C。;Yu,J。;Schnable,P.S。;Scanlon,M.J.,《玉米茎尖分生组织形态多样性的遗传控制》,《自然通讯》,68974-9974(2015)
[16] 李,X。;Wang,L。;Nettleton,D.,超高维加性部分线性模型的稀疏模型识别和学习(2018),完整版本可在arXiv.org/abs/1111.000488上获得
[17] 李,X。;Wang,L。;Nettleton,D.,超高维可加部分线性模型,Stat(2019)
[18] Lian,H。;Liang,H。;Ruppert,D.,在高维部分线性加性模型中将协变量分离为非参数部分和参数部分,Statist。中国科学院,25591-607(2015)·Zbl 06503812号
[19] Lian,H。;Liang,H。;Wang,L.,使用GEE的具有发散协变量数的聚类数据的广义加性部分线性模型,Statist。Sinica,24,173-196(2014)·Zbl 1285.62080号
[20] Liang,H。;瑟斯顿,S.W。;Ruppert博士。;阿帕纳索维奇,T。;Hauser,R.,带测量误差的加性部分线性模型,Biometrika,95,667-678(2008)·Zbl 1437.62526号
[21] 林海燕。;刘,Q。;李,X。;杨,J。;刘,S。;黄,Y。;Scanlon,M.J。;Nettleton,D。;Schnable,P.S.,转录因子表达中的遗传变异对eRD-GWAS揭示的表型变异的重大贡献,基因组生物学。,18, 192 (2017)
[22] 刘,X。;Wang,L。;Liang,H.,半参数可加部分线性模型的估计和变量选择,统计学。Sinica,21,1225-1248(2011)·Zbl 1223.62020年
[23] 马,S。;宋,Q。;Wang,L.,纵向/聚类数据半参数建模中的同时变量选择和估计,Bernoulli,19,252-274(2013)·Zbl 1259.62021号
[24] 马,S。;杨,L.,部分线性可加模型的样条拟合核平滑,J.Statist。计划。推断,141204-219(2011)·Zbl 1197.62130号
[25] Ruppert,D.,《为缺陷样条线选择节点数》,J.Compute。图表。统计人员。,11, 735-757 (2002)
[26] Wand,M.P。;Jones,M.C.,《内核平滑》(1995),佛罗里达州博卡拉顿CRC出版社·Zbl 0854.62043号
[27] Wang,J。;Yang,L.,《加性模型的高效快速样条拟合核平滑》,《Ann.Inst.Statist》。数学。,61, 663-690 (2009) ·Zbl 1332.62141号
[28] Wang,L。;刘,X。;Liang,H。;Carroll,R.J.,广义可加部分线性模型的估计和变量选择,Ann.Statist。,39, 1827-1851 (2011) ·Zbl 1227.62053号
[29] Wang,L。;薛,L。;Qu,A。;Liang,H.,协变量发散数相关数据广义可加部分线性模型的估计和模型选择,Ann.Statist。,42, 592-624 (2014) ·兹比尔1309.62077
[30] Wang,L。;杨,L.,非线性加性自回归模型的样条拟合核平滑,Ann.Statist。,35, 2474-2503 (2007) ·兹比尔1129.62038
[31] 薛,L。;Yang,L.,通过多项式样条进行加性系数建模,Statist。Sinica,16,1423-1446(2006)·Zbl 1109.62030号
[32] 张春华,极小极大凹惩罚下的几乎无偏变量选择,安统计学家。,38, 894-942 (2010) ·Zbl 1183.62120号
[33] Zhang,H.H。;Cheng,G。;Liu,Y.,线性还是非线性?部分线性模型的自动结构发现,J.Amer。统计师。协会,1061099-1112(2011)·Zbl 1229.62051号
[34] 郑,S。;刘,R。;Yang,L。;Härdle,W.K.,《广义可加模型的统计推断:同时置信走廊和变量选择》,Test,25,607-626(2016)·Zbl 1422.62155号
[35] Zou,H.,《自适应套索及其预言属性》,J.Amer。统计师。协会,101,1418-1429(2006)·Zbl 1171.62326号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。