李新义;王,李;丹·奈特尔顿 超高维可加部分线性模型的稀疏模型识别与学习。 (英语) Zbl 1422.62188号 《多元分析杂志》。 173, 204-228 (2019). 摘要:可加部分线性模型(APLM)结合了非参数回归的灵活性和回归模型的简约性,被广泛用作多元非参数回归中缓解“维数灾难”的流行工具。实践中提出的一个自然问题是非参数部分的结构选择,即连续协变量是以线性形式还是非参数形式进入模型,对于线性和非参数分量都可能大于样本量的超高维APLM,我们提出了一个同时进行稀疏模型识别和学习的综合框架。我们提出了一种快速有效的两阶段程序。在第一阶段,我们将非参数函数分解为线性部分和非线性部分。用常样条基逼近非线性函数,提出了一种利用自适应群LASSO选择非零分量的三重惩罚方法。在第二阶段,我们使用高阶多项式样条对选定的协变量重新拟合数据,并应用样条支持的局部线性平滑来获得估计量的渐近正态性。该程序与模型结构识别一致。它可以正确有效地识别零、线性和非线性分量。可以对线性系数和非参数函数进行推断。我们进行了模拟研究以评估该方法的性能,并将所提出的方法应用于玉米基因型茎尖分生组织(SAM)的数据集以进行说明。 引用于1文件 理学硕士: 62甲12 多元分析中的估计 2012年12月62日 参数估计量的渐近性质 关键词:尺寸缩减;超高维数据的推理;半参数回归;样条拟合局部多项式;结构识别;变量选择 软件:科恩平滑;格普雷格 PDF格式BibTeX公司 XML格式引用 \textit{X.Li}等人,《多元分析杂志》。173204-228(2019年;Zbl 1422.62188) 全文: 内政部 arXiv公司 参考文献: [1] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社,剑桥·Zbl 1058.90049号 [2] Breheny,P.,:分组协变量回归模型的正则化路径(2016),R(右)软件包版本3.0-2。可在“<ce:inter-ref id=“interref1”xlink:role=“http://www.elsevier.com/xml/linking-roles/text/html“xlink:href=”https://cran.r-project.org/web/packages/grpreg/index.html“xlink:type=”simple“>https://cran.r-project.org/web/packages/grpreg/index.html” [3] Breheny,P。;Huang,J.,具有分组预测因子的非凸惩罚线性和逻辑回归模型的群下降算法,Stat.Comput。,173-187年5月25日(2015年)·Zbl 1331.62359号 [4] 陈,J。;Chen,Z.,用于大模型空间模型选择的扩展贝叶斯信息标准,Biometrika,95759-771(2008)·Zbl 1437.62415号 [5] 陈,Z。;Chen,J.,Tournament screening cum EBIC for feature selection with high dimensions feature spaces,科学。中国Ser。A: 数学。,52, 1327-1341 (2009) ·Zbl 1176.62014年 [6] Claeskens,G。;Van Keilegom,I.,回归曲线及其导数的Bootstrap置信带,Ann.Statist。,31, 1852-1884 (2003) ·Zbl 1042.62044号 [7] 范,J。;Feng,Y。;Song,R.,稀疏超高维可加模型中的非参数独立筛选,J.Amer。统计师。协会,106,544-557(2011)·Zbl 1232.62064号 [8] 范,J。;Gijbels,I.,《局部多项式建模及其应用》(1996),佛罗里达州博卡拉顿CRC出版社·Zbl 0873.62037号 [9] 范,J。;Li,R.,通过非冲突惩罚似然进行变量选择及其预言性质,J.Amer。统计师。协会,96,1348-1360(2001)·Zbl 1073.62547号 [10] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J.R.Stat.Soc.Ser。B.统计方法。,70, 849-911 (2008) ·Zbl 1411.62187号 [11] 黄,J。;Breheny,P。;Ma,S.,《高维模型中群体选择的选择性综述》,统计学。科学。,27, 481-499 (2012) ·兹比尔1331.62347 [12] 黄,J。;霍洛维茨,J.L。;魏凤,非参数可加模型中的变量选择,统计年鉴。,38, 2282-2313 (2010) ·Zbl 1202.62051号 [13] 黄,J。;魏,F。;Ma,S.,半参数回归追踪,统计学。Sinica,221403-1426(2012)·Zbl 1253.62024号 [14] Lee,E.R。;Noh,H。;Park,B.U.,通过分位数回归模型的贝叶斯信息准则进行模型选择,J.Amer。统计师。协会,109216-229(2014)·Zbl 1367.62122号 [15] 莱博夫,S。;李,X。;胡海川。;托德,N。;杨,J。;李,X。;Yu,X。;Muehlbauer,G.J。;Timmermans,M.C。;Yu,J。;Schnable,P.S。;Scanlon,M.J.,《玉米茎尖分生组织形态多样性的遗传控制》,《自然通讯》,68974-9974(2015) [16] 李,X。;Wang,L。;Nettleton,D.,超高维加性部分线性模型的稀疏模型识别和学习(2018),完整版本可在arXiv.org/abs/1111.000488上获得 [17] 李,X。;Wang,L。;Nettleton,D.,超高维可加部分线性模型,Stat(2019) [18] Lian,H。;Liang,H。;Ruppert,D.,在高维部分线性加性模型中将协变量分离为非参数部分和参数部分,Statist。中国科学院,25591-607(2015)·Zbl 06503812号 [19] Lian,H。;Liang,H。;Wang,L.,使用GEE的具有发散协变量数的聚类数据的广义加性部分线性模型,Statist。Sinica,24,173-196(2014)·Zbl 1285.62080号 [20] Liang,H。;瑟斯顿,S.W。;Ruppert博士。;阿帕纳索维奇,T。;Hauser,R.,带测量误差的加性部分线性模型,Biometrika,95,667-678(2008)·Zbl 1437.62526号 [21] 林海燕。;刘,Q。;李,X。;杨,J。;刘,S。;黄,Y。;Scanlon,M.J。;Nettleton,D。;Schnable,P.S.,转录因子表达中的遗传变异对eRD-GWAS揭示的表型变异的重大贡献,基因组生物学。,18, 192 (2017) [22] 刘,X。;Wang,L。;Liang,H.,半参数可加部分线性模型的估计和变量选择,统计学。Sinica,21,1225-1248(2011)·Zbl 1223.62020年 [23] 马,S。;宋,Q。;Wang,L.,纵向/聚类数据半参数建模中的同时变量选择和估计,Bernoulli,19,252-274(2013)·Zbl 1259.62021号 [24] 马,S。;杨,L.,部分线性可加模型的样条拟合核平滑,J.Statist。计划。推断,141204-219(2011)·Zbl 1197.62130号 [25] Ruppert,D.,《为缺陷样条线选择节点数》,J.Compute。图表。统计人员。,11, 735-757 (2002) [26] Wand,M.P。;Jones,M.C.,《内核平滑》(1995),佛罗里达州博卡拉顿CRC出版社·Zbl 0854.62043号 [27] Wang,J。;Yang,L.,《加性模型的高效快速样条拟合核平滑》,《Ann.Inst.Statist》。数学。,61, 663-690 (2009) ·Zbl 1332.62141号 [28] Wang,L。;刘,X。;Liang,H。;Carroll,R.J.,广义可加部分线性模型的估计和变量选择,Ann.Statist。,39, 1827-1851 (2011) ·Zbl 1227.62053号 [29] Wang,L。;薛,L。;Qu,A。;Liang,H.,协变量发散数相关数据广义可加部分线性模型的估计和模型选择,Ann.Statist。,42, 592-624 (2014) ·兹比尔1309.62077 [30] Wang,L。;杨,L.,非线性加性自回归模型的样条拟合核平滑,Ann.Statist。,35, 2474-2503 (2007) ·兹比尔1129.62038 [31] 薛,L。;Yang,L.,通过多项式样条进行加性系数建模,Statist。Sinica,16,1423-1446(2006)·Zbl 1109.62030号 [32] 张春华,极小极大凹惩罚下的几乎无偏变量选择,安统计学家。,38, 894-942 (2010) ·Zbl 1183.62120号 [33] Zhang,H.H。;Cheng,G。;Liu,Y.,线性还是非线性?部分线性模型的自动结构发现,J.Amer。统计师。协会,1061099-1112(2011)·Zbl 1229.62051号 [34] 郑,S。;刘,R。;Yang,L。;Härdle,W.K.,《广义可加模型的统计推断:同时置信走廊和变量选择》,Test,25,607-626(2016)·Zbl 1422.62155号 [35] Zou,H.,《自适应套索及其预言属性》,J.Amer。统计师。协会,101,1418-1429(2006)·Zbl 1171.62326号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。