×

高维变量误差回归的校正零形式正则LS估计。 (英语) Zbl 1470.62112号

摘要:本研究重点在于使用高维变量误差回归,从测量误差或缺失数据不能忽略的应用程序中损坏的数据中识别少量重要的可解释因素。受凸条件Lasso(CoCoLasso)方法的启发,以及对干净数据使用零形式正则LS估计而不是Lasso估计的优点,我们提出了一种校准的零形式正则化LS(CaZnRLS)估计。为此,我们用协方差矩阵的无偏代理的正定投影构造了一个校准的最小二乘损失。然后,我们使用多级凸松弛方法来计算所提出的估计量。在真协变量矩阵的限制强凸性下,我们导出了每次迭代的误差界。然后,我们建立了有限步数后迭代的递减误差界序列和符号一致性。在两种测量误差下,还为CaZnRLS估计器提供了统计保证。与CoCoLasso和非凸Lasso的数值比较表明,CaZnRLS具有更好的相对RMSE,并且能够正确识别更多的预测因子。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
62甲12 多元分析中的估计
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司

参考文献:

[1] Belloni,A.、Rosenbaum,M.和Tsybakov,A.B.(2017年)。高维误差-变量模型中的线性和圆锥规划时间。英国皇家统计学会杂志,B辑(统计方法)79,939-956·Zbl 1411.62180号
[2] Belloni,A.、Rosenbaum,M.和Tsybakov,A.B.(2016)。高维误差变量模型的1,2,∞正则化方法。《电子统计杂志》第10期,1729-1750页·Zbl 1397.62246号
[3] Bi,S.J.和Pan,S.H.(2018年)。群零形式正则化最小二乘估计的GEP-MSCRA。arXiv:1804.09887v1。
[4] Benjamini,Y.和Speed,T.P.(2012年)。总结并纠正高通量测序中的GC含量偏差。核酸研究40,e72-e72。
[5] Bühlmann,P.和van de Geer,S.A.(2011年)。高维数据统计:方法、理论和应用。海德堡施普林格·Zbl 1273.62015年
[6] Chen,Y.和Caramanis,C.(2013)。噪音和缺失数据回归:分布式支持恢复。机器学习研究杂志28,383-391。
[7] Candès,E.和Tao,T.(2007年)。Dantzig选择器:当p远大于n时的统计估计。统计年鉴35,2313-2351·Zbl 1139.62019号
[8] Datta,A.和Zou,H.(2017)。CoCoLASSO用于高维变量误差回归。《统计年鉴》45,2400-2426·兹比尔1486.62210
[9] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。《美国统计协会杂志》96,1348-1360·Zbl 1073.62547号
[10] Fan,J.和Lv,J.(2010)。高维特征空间中变量选择的选择性概述。《中国统计》第20期,第101-148页·Zbl 1180.62080号
[11] Loh,P.L.和Wainwright,M.J.(2012年)。含噪声和缺失数据的高维回归:具有非凸性的可证明保证。《统计年鉴》第40期,1637-1664页·Zbl 1257.62063号
[12] Loh,P.L.(2014)。系统损坏数据的高维统计信息。博士论文。加利福尼亚大学。http://escholarship.org/uc/item/8j49c5n4。
[13] Li,X.D.,Sun,D.F.和Toh,K.-C.(2018年)。一种求解拉索问题的高效半光滑牛顿增广拉格朗日方法。SIAM优化杂志28,433-458·Zbl 1392.65062号
[14] Negahban,S.、Ravikumar,P.、Wainwright,M.J.和Yu,B.(2012年)。具有可分解正则化子的M-估计量高维分析的统一框架。统计科学27,538-557·兹比尔1331.62350
[15] Purdom,E.和Holmes,S.P.(2005年)。基因表达数据的错误分布。遗传学和分子生物学中的统计应用4,第16条·Zbl 1083.62114号
[16] Raskutti,G.、Wainwright,M.J.和Yu,B.(2010年)。相关高斯设计的受限特征值特性。机器学习研究杂志11,2241-2259·Zbl 1242.62071号
[17] Raskutti,G.、Wainwright,M.J.和Yu,B.(2011年)。1-ball上高维线性回归的最小最大估计率。IEEE信息理论汇刊57,6976-6994·Zbl 1365.62276号
[18] Rockafellar,R.T.(1970)。凸分析。新泽西州普林斯顿大学出版社·Zbl 0193.18401号
[19] Rosenbaum,M.和Tsybakov,A.B.(2010年)。矩阵不确定性下的稀疏恢复。《统计年鉴》38,2620-2651·Zbl 1373.62357号
[20] Rosenbaum,M.和Tsybakov,A.B.(2013)。改进的矩阵不确定性选择器。数理统计研究所收藏9,276-290·Zbl 1327.62410号
[21] Slijepcevic,S.、Megerian,S.和Potkonjak,M.(2002)。无线嵌入式传感器网络中的位置错误:来源、模型和对应用程序的影响。移动计算与通信评论6,67-78。
[22] Städler,N.和Bühlmann,P.(2012)。缺失值:稀疏逆协方差估计和稀疏回归的扩展。统计与计算22,219-235·Zbl 1322.62115号
[23] Tibshirani,R.(1996)。通过拉索回归收缩和选择。英国皇家统计学会杂志,B辑(统计方法)58,267-288·Zbl 0850.62538号
[24] van de Geer,S.A.和Bühlmann,P.(2009)。根据用于证明拉索预言结果的条件。电子统计杂志3,1360-1392·Zbl 1327.62425号
[25] Zhang,C.H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。《统计年鉴》38,894-942·Zbl 1183.62120号
[26] Zou,H.和Hastie,T.(2005年)。通过弹性网进行规则化和变量选择。英国皇家统计学会杂志,B辑(统计方法)67,301-320·Zbl 1069.62054号
[27] 邹华(2006)。自适应Lasso及其oracle属性。美国统计协会期刊101,1418-1429·Zbl 1171.62326号
[28] 邹浩和李若明(2008)。非凹陷惩罚似然模型中的一步稀疏估计。《统计年鉴》36,1509-1533·Zbl 1142.62027号
[29] 华南工业大学数学学院,广州510640,中国。电子邮件:201620122022@mail.scut.edu.cn
[30] 中国广州市华南理工大学潘绍华数学学院,邮编510640。电子邮件:shhpan@scut.edu.cn中国广州市华南理工大学蜀郡毕数学学院,邮编510640。电子邮件:bishj@scut.edu.cn(2018年5月收到;2019年7月接受)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。