Pierre C.Bellec。;Dalalyan,Arnak S。;埃德温·格拉宾;巴黎,昆廷 关于部分标记设置中拉索的预测损失。 (英语) Zbl 1408.62114号 电子。J.统计。 12,第2号,3443-3472(2018). 小结:在本文中,我们重新讨论了传递学习和半监督学习环境下Lasso估计的风险边界。换句话说,所考虑的设置是部分标记下随机设计的回归。主要目标是获得用户友好的非样本预测风险边界。为此,考虑了有界响应变量和有界(高维)协变量的简单设置。我们提出了拉索对这些设置的一些新修改,并建立了预期和偏差的预言不等式。这些结果提供了风险的非渐近上限,突出了由于线性模型的错误规范导致的偏差、由于近似稀疏性导致的偏差和方差之间的相互作用。它们还表明,在设计矩阵的限制特征值消失或非常小的情况下,大量未标记特征的存在可能会产生显著的积极影响。 引用于7文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62G08号 非参数回归和分位数回归 62J07型 岭回归;收缩估计器(拉索) 68T05型 人工智能中的学习和自适应系统 关键词:半监督学习;稀疏;拉索;oracle不等式;传导学习;高维回归;预测风险 PDF格式BibTeX公司 XML格式引用 \textit{P.C.Bellec}等人,《电子》。J.Stat.12,No.2,3443--3472(2018;Zbl 1408.62114) 全文: 内政部 arXiv公司 欧几里得 参考文献: [1] 弗拉基米尔·瓦普尼克。,统计学习理论。信号处理、通信和控制的自适应和学习系统。John Wiley&Sons,Inc.,纽约,1998年。Wiley Interscience出版。 [2] 玛丽亚·弗洛丽娜·巴尔坎、阿夫林·布鲁姆、帕特里克·巴基安·崔、约翰·拉弗蒂、布莱恩·潘塔诺、穆吉齐·鲁班吉拉和朱晓金。网络摄像头图像中的人识别:半监督学习的应用。,ICM L2005部分分类培训数据学习研讨会,2005年。 [3] 马蒂厄·吉利亚明(Matthieu Guillaumin)、雅各布·J·韦贝克(Jakob J.Verbeek)和科迪利亚·施密德(Cordelia Schmid)。用于图像分类的多模态半监督学习。2010年6月13日至18日,美国加利福尼亚州旧金山,第20届IEEE计算机视觉和模式识别会议,CVPR 2010,第902-909页。统一资源定位地址http://dx.doi.org/10.109/CVPR.2010.5540120。 [4] 塞琳·布鲁瓦尔、弗洛伦斯·德·阿尔切·布克和玛丽·萨弗兰斯基。链路预测的半监督惩罚输出核回归。编辑Lise Getoor和Tobias Scheffer,《第28届机器学习国际会议论文集》,2011年ICML,美国华盛顿贝尔维尤,2011年6月28日至7月2日,第593-600页。Omnipress,2011年。 [5] O.Chapelle、B.Shölkopf和A.Zien,编辑。,半监督学习。麻省理工学院出版社,2006年。 [6] 菲利普·里戈莱特(Philippe Rigollet)。聚类假设下半监督分类的广义误差界。,J.马赫。学习。2007年第8:1369–1392号决议·Zbl 1222.68288号 [7] 王俊晖和沈小童。大幅度半监督学习。,J.马赫。学习。决议,8:1867-18912007年·兹比尔1222.68329 [8] 约翰·拉弗蒂(John D.Lafferty)和拉里·瓦瑟曼(Larry A.Wasserman)。半监督回归的统计分析。在,NIPS,第801–808页。Curran Associates,Inc.,2007年。 [9] 米哈伊尔·贝尔金(Mikhail Belkin)、帕塔·尼约吉(Partha Niyogi)和维卡斯·辛德瓦尼(Vikas Sindhwani)。流形正则化:从标记和未标记示例学习的几何框架。,J.马赫。学习。2006年第7:2399–2434号决议·Zbl 1222.68144号 [10] Boaz Nadler、Nathan Srebro和Xueyuan Zhou。半监督学习的统计分析:无限未标记数据的极限。年,《神经信息处理系统进展》22,第1330–1338页。Curran Associates,Inc.,2009年。 [11] 帕塔·尼约吉。流形正则化和半监督学习:一些理论分析。,机器学习研究杂志,14:1229–12502013。统一资源定位地址http://jmlr.org/papers/v14/niyogi13a.html。 ·Zbl 1317.68178号 [12] 孙世良和约翰·肖·泰勒。使用共轭函数的稀疏半监督学习。,J.马赫。学习。2010年第11:2423-2455号决议·Zbl 1242.68251号 [13] David Azriel、Lawrence D Brown、Michael Sklar、Richard Berk、Andreas Buja和Linda Zhao。半监督线性回归。,arXiv预印arXiv:1612.023912016。 [14] A.Chakrabortty和T.Cai。半监督环境下的高效自适应线性回归。,ArXiv电子版,2017年1月。 [15] 罗伯特·提比拉尼(Robert Tibshirani)。通过套索进行回归收缩和选择。,J.罗伊。统计师。Soc.序列号。B、 58(1):267–2881996年·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x [16] 彼得·鲍尔曼和萨拉·范德格尔。,高维数据统计。统计学中的斯普林格系列。施普林格,海德堡,2011年。方法、理论和应用·Zbl 1273.62015年 [17] Pierre C Bellec、Guillaume Lecué和Alexandre B Tsybakov。斜率满足套索:改进了预言边界和优化。,《统计年鉴》,46(6B):3603–36422018。统一资源定位地址https://projecteuclid.org/euclid.aos/1536631285。 ·Zbl 1405.62056号 ·doi:10.1214/17-AOS1670 [18] 弗拉基米尔·科尔钦斯基(Vladimir Koltchinskii)、卡里姆·卢尼奇(Karim Lounici)和亚历山大·谢巴科夫(Alexandre B.Tsybakov)。噪声低秩矩阵补全的核形式惩罚与最优速率。,《统计年鉴》,39(5):2302–23292011年·Zbl 1231.62097号 ·doi:10.1214/11-AOS894 [19] 孙廷妮和张存慧。标度稀疏线性回归。,《生物统计学》,99(4):879–8982012·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043 [20] Arnak S.Dalalyan、Mohamed Heibiri和Johannes Lederer。关于套索的预测性能。,伯努利,23(1):552-5812017·Zbl 1359.62295号 ·doi:10.3150/15-BEJ756 [21] Fei Ye和Cun-Hui Zhang。Lasso和Dantzig选择器的速率最小性\(ℓ _q)损失\(ℓ _r)滚珠。,J.马赫。学习。2010年第11:3519–3540号决议·Zbl 1242.62074号 [22] 加维什·拉斯库蒂(Garvesh Raskutti)、马丁·温赖特(Martin J.Wainwright)和余斌(Bin Yu)。上高维线性回归的极小极大估计率\(Ş_q)-球。,IEEE传输。通知。理论,57(10):6976–69942011·兹比尔1365.62276 ·doi:10.1109/TIT.2011.2165799 [23] 菲利普·里戈莱特(Philippe Rigollet)和亚历山大·茨巴科夫(Alexandre Tsybakov)。指数筛选和稀疏估计的最佳速率。,安.统计师。,39(2):731–771, 2011. ·Zbl 1215.62043号 ·doi:10.1214/10-AOS854 [24] 菲利普·里戈莱特(Philippe Rigollet)和亚历山大·茨巴科夫(Alexandre B.Tsybakov)。指数加权稀疏估计。,统计师。科学。,27(4):558–575, 2012. ·兹比尔1331.62351 ·doi:10.1214/12-STS393 [25] 彼得·比克尔(Peter J.Bickel)、亚奥科夫·里托夫(Ya’acov Ritov)和亚历山大·谢巴科夫(Alexandre B.Tsybakov)。同时分析套索和Dantzig选择器。,安.统计师。,37(4) :1705–1732, 2009. ·Zbl 1173.62022号 ·doi:10.1214/08-AOS620 [26] Sara van de Geer和Peter Bühlmann。根据用于证明Lasso.的oracle结果的条件。,电子。J.Stat.,3:1360–13922009年·Zbl 1327.62425号 ·doi:10.1214/09-EJS506 [27] 弗拉基米尔·科尔钦斯基。,Oracle在经验风险最小化和稀疏恢复问题中的不平等:圣弗洛尔概率经济研究所XXXVIII-2008年第38卷。施普林格,2011年·Zbl 1223.91002号 [28] 皮埃尔·阿尔基尔(Pierre Alquier)和穆罕默德·希比里(Mohamed Hebiri)。LASSO和dantzig选择器的传导性版本。,《统计规划与推断杂志》,142(9):2485–2500,2012年·兹比尔1428.62312 ·doi:10.1016/j.jspi.2012.03.020 [29] 纪尧姆·勒库埃(Guillaume Lecué)和沙哈·门德尔森(Shahar Mendelson)。正则化和小球方法i:稀疏恢复。技术报告1601.05584,arXiv,2016年1月·Zbl 1403.60085号 ·doi:10.1214/17-AOS1562 [30] 加维什·拉斯库蒂(Garvesh Raskutti)、马丁·温赖特(Martin J Wainwright)和余斌(Bin Yu)。相关高斯设计的受限特征值特性。,机器学习研究杂志,11:2241–22592010·Zbl 1242.62071号 [31] 罗伯托·伊姆布泽罗·奥利维拉。随机二次型的下尾,应用于普通最小二乘和限制特征值性质。,arXiv预印arXiv:1312.29032013·Zbl 1360.60075号 ·doi:10.1007/s00440-016-0738-9 [32] 马克·鲁德尔森和周书恒。各向异性随机测量的重建。,信息理论,IEEE汇刊,59(6):3434–34472013·Zbl 1364.94158号 ·doi:10.1109/TIT.2013.2243201 [33] 安纳托利·朱迪茨基(Anatoli Juditsky)和阿卡迪·内米洛夫斯基(Arkadi Nemirovski)。恢复的准确性保证。,信息理论,IEEE汇刊,57(12):7818–78392011·Zbl 1365.94077号 ·doi:10.1109/TIT.2011.2162569 [34] 亚历山大·贝洛尼(Alexandre Belloni)、维克托·切尔诺朱科夫(Victor Chernozhukov)和王烈(Lie Wang)。非参数回归中基于平方套索的枢轴估计。,安.统计师。,42(2):757–788, 04 2014. 统一资源定位地址http://dx.doi.org/10.1214/14-AAOS1204。 ·Zbl 1321.62030号 ·doi:10.1214/14-AOS1204 [35] M.彭斯基。使用过完备字典解决线性不适定问题。技术报告1408.3386,Ann.Statist。,将于2014年8月在arXiv发布·Zbl 1346.62061号 ·doi:10.1214/16-AOS145 [36] R.Vershynin。随机矩阵的非渐近分析导论。,ArXiv电子版,2010年11月·Zbl 1259.60008号 [37] Bubacarr Bah和Jared Tanner。极限渐近中限制等距常数的界:高斯矩阵的公式。,线性代数应用。,441:88–109, 2014. ·Zbl 1282.15030号 ·doi:10.1016/j.laa.2012.11.024 [38] 乔尔·特罗普(Joel A.Tropp)。随机矩阵和的用户友好尾部界限。,计算数学基础,12(4):389–4342012·Zbl 1259.60008号 ·doi:10.1007/s10208-011-9099-z [39] 帕斯卡·马萨特。,浓度不平等和模型选择:圣弗洛概率学院三十三-2003年,第1896卷。施普林格,2007年·Zbl 1170.60006号 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。