×

关于部分标记设置中拉索的预测损失。 (英语) Zbl 1408.62114号

小结:在本文中,我们重新讨论了传递学习和半监督学习环境下Lasso估计的风险边界。换句话说,所考虑的设置是部分标记下随机设计的回归。主要目标是获得用户友好的非样本预测风险边界。为此,考虑了有界响应变量和有界(高维)协变量的简单设置。我们提出了拉索对这些设置的一些新修改,并建立了预期和偏差的预言不等式。这些结果提供了风险的非渐近上限,突出了由于线性模型的错误规范导致的偏差、由于近似稀疏性导致的偏差和方差之间的相互作用。它们还表明,在设计矩阵的限制特征值消失或非常小的情况下,大量未标记特征的存在可能会产生显著的积极影响。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62G08号 非参数回归和分位数回归
62J07型 岭回归;收缩估计器(拉索)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 弗拉基米尔·瓦普尼克。,统计学习理论。信号处理、通信和控制的自适应和学习系统。John Wiley&Sons,Inc.,纽约,1998年。Wiley Interscience出版。
[2] 玛丽亚·弗洛丽娜·巴尔坎、阿夫林·布鲁姆、帕特里克·巴基安·崔、约翰·拉弗蒂、布莱恩·潘塔诺、穆吉齐·鲁班吉拉和朱晓金。网络摄像头图像中的人识别:半监督学习的应用。,ICM L2005部分分类培训数据学习研讨会,2005年。
[3] 马蒂厄·吉利亚明(Matthieu Guillaumin)、雅各布·J·韦贝克(Jakob J.Verbeek)和科迪利亚·施密德(Cordelia Schmid)。用于图像分类的多模态半监督学习。2010年6月13日至18日,美国加利福尼亚州旧金山,第20届IEEE计算机视觉和模式识别会议,CVPR 2010,第902-909页。统一资源定位地址http://dx.doi.org/10.109/CVPR.2010.5540120。
[4] 塞琳·布鲁瓦尔、弗洛伦斯·德·阿尔切·布克和玛丽·萨弗兰斯基。链路预测的半监督惩罚输出核回归。编辑Lise Getoor和Tobias Scheffer,《第28届机器学习国际会议论文集》,2011年ICML,美国华盛顿贝尔维尤,2011年6月28日至7月2日,第593-600页。Omnipress,2011年。
[5] O.Chapelle、B.Shölkopf和A.Zien,编辑。,半监督学习。麻省理工学院出版社,2006年。
[6] 菲利普·里戈莱特(Philippe Rigollet)。聚类假设下半监督分类的广义误差界。,J.马赫。学习。2007年第8:1369–1392号决议·Zbl 1222.68288号
[7] 王俊晖和沈小童。大幅度半监督学习。,J.马赫。学习。决议,8:1867-18912007年·兹比尔1222.68329
[8] 约翰·拉弗蒂(John D.Lafferty)和拉里·瓦瑟曼(Larry A.Wasserman)。半监督回归的统计分析。在,NIPS,第801–808页。Curran Associates,Inc.,2007年。
[9] 米哈伊尔·贝尔金(Mikhail Belkin)、帕塔·尼约吉(Partha Niyogi)和维卡斯·辛德瓦尼(Vikas Sindhwani)。流形正则化:从标记和未标记示例学习的几何框架。,J.马赫。学习。2006年第7:2399–2434号决议·Zbl 1222.68144号
[10] Boaz Nadler、Nathan Srebro和Xueyuan Zhou。半监督学习的统计分析:无限未标记数据的极限。年,《神经信息处理系统进展》22,第1330–1338页。Curran Associates,Inc.,2009年。
[11] 帕塔·尼约吉。流形正则化和半监督学习:一些理论分析。,机器学习研究杂志,14:1229–12502013。统一资源定位地址http://jmlr.org/papers/v14/niyogi13a.html。 ·Zbl 1317.68178号
[12] 孙世良和约翰·肖·泰勒。使用共轭函数的稀疏半监督学习。,J.马赫。学习。2010年第11:2423-2455号决议·Zbl 1242.68251号
[13] David Azriel、Lawrence D Brown、Michael Sklar、Richard Berk、Andreas Buja和Linda Zhao。半监督线性回归。,arXiv预印arXiv:1612.023912016。
[14] A.Chakrabortty和T.Cai。半监督环境下的高效自适应线性回归。,ArXiv电子版,2017年1月。
[15] 罗伯特·提比拉尼(Robert Tibshirani)。通过套索进行回归收缩和选择。,J.罗伊。统计师。Soc.序列号。B、 58(1):267–2881996年·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[16] 彼得·鲍尔曼和萨拉·范德格尔。,高维数据统计。统计学中的斯普林格系列。施普林格,海德堡,2011年。方法、理论和应用·Zbl 1273.62015年
[17] Pierre C Bellec、Guillaume Lecué和Alexandre B Tsybakov。斜率满足套索:改进了预言边界和优化。,《统计年鉴》,46(6B):3603–36422018。统一资源定位地址https://projecteuclid.org/euclid.aos/1536631285。 ·Zbl 1405.62056号 ·doi:10.1214/17-AOS1670
[18] 弗拉基米尔·科尔钦斯基(Vladimir Koltchinskii)、卡里姆·卢尼奇(Karim Lounici)和亚历山大·谢巴科夫(Alexandre B.Tsybakov)。噪声低秩矩阵补全的核形式惩罚与最优速率。,《统计年鉴》,39(5):2302–23292011年·Zbl 1231.62097号 ·doi:10.1214/11-AOS894
[19] 孙廷妮和张存慧。标度稀疏线性回归。,《生物统计学》,99(4):879–8982012·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043
[20] Arnak S.Dalalyan、Mohamed Heibiri和Johannes Lederer。关于套索的预测性能。,伯努利,23(1):552-5812017·Zbl 1359.62295号 ·doi:10.3150/15-BEJ756
[21] Fei Ye和Cun-Hui Zhang。Lasso和Dantzig选择器的速率最小性\(ℓ _q)损失\(ℓ _r)滚珠。,J.马赫。学习。2010年第11:3519–3540号决议·Zbl 1242.62074号
[22] 加维什·拉斯库蒂(Garvesh Raskutti)、马丁·温赖特(Martin J.Wainwright)和余斌(Bin Yu)。上高维线性回归的极小极大估计率\(Ş_q)-球。,IEEE传输。通知。理论,57(10):6976–69942011·兹比尔1365.62276 ·doi:10.1109/TIT.2011.2165799
[23] 菲利普·里戈莱特(Philippe Rigollet)和亚历山大·茨巴科夫(Alexandre Tsybakov)。指数筛选和稀疏估计的最佳速率。,安.统计师。,39(2):731–771, 2011. ·Zbl 1215.62043号 ·doi:10.1214/10-AOS854
[24] 菲利普·里戈莱特(Philippe Rigollet)和亚历山大·茨巴科夫(Alexandre B.Tsybakov)。指数加权稀疏估计。,统计师。科学。,27(4):558–575, 2012. ·兹比尔1331.62351 ·doi:10.1214/12-STS393
[25] 彼得·比克尔(Peter J.Bickel)、亚奥科夫·里托夫(Ya’acov Ritov)和亚历山大·谢巴科夫(Alexandre B.Tsybakov)。同时分析套索和Dantzig选择器。,安.统计师。,37(4) :1705–1732, 2009. ·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[26] Sara van de Geer和Peter Bühlmann。根据用于证明Lasso.的oracle结果的条件。,电子。J.Stat.,3:1360–13922009年·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[27] 弗拉基米尔·科尔钦斯基。,Oracle在经验风险最小化和稀疏恢复问题中的不平等:圣弗洛尔概率经济研究所XXXVIII-2008年第38卷。施普林格,2011年·Zbl 1223.91002号
[28] 皮埃尔·阿尔基尔(Pierre Alquier)和穆罕默德·希比里(Mohamed Hebiri)。LASSO和dantzig选择器的传导性版本。,《统计规划与推断杂志》,142(9):2485–2500,2012年·兹比尔1428.62312 ·doi:10.1016/j.jspi.2012.03.020
[29] 纪尧姆·勒库埃(Guillaume Lecué)和沙哈·门德尔森(Shahar Mendelson)。正则化和小球方法i:稀疏恢复。技术报告1601.05584,arXiv,2016年1月·Zbl 1403.60085号 ·doi:10.1214/17-AOS1562
[30] 加维什·拉斯库蒂(Garvesh Raskutti)、马丁·温赖特(Martin J Wainwright)和余斌(Bin Yu)。相关高斯设计的受限特征值特性。,机器学习研究杂志,11:2241–22592010·Zbl 1242.62071号
[31] 罗伯托·伊姆布泽罗·奥利维拉。随机二次型的下尾,应用于普通最小二乘和限制特征值性质。,arXiv预印arXiv:1312.29032013·Zbl 1360.60075号 ·doi:10.1007/s00440-016-0738-9
[32] 马克·鲁德尔森和周书恒。各向异性随机测量的重建。,信息理论,IEEE汇刊,59(6):3434–34472013·Zbl 1364.94158号 ·doi:10.1109/TIT.2013.2243201
[33] 安纳托利·朱迪茨基(Anatoli Juditsky)和阿卡迪·内米洛夫斯基(Arkadi Nemirovski)。恢复的准确性保证。,信息理论,IEEE汇刊,57(12):7818–78392011·Zbl 1365.94077号 ·doi:10.1109/TIT.2011.2162569
[34] 亚历山大·贝洛尼(Alexandre Belloni)、维克托·切尔诺朱科夫(Victor Chernozhukov)和王烈(Lie Wang)。非参数回归中基于平方套索的枢轴估计。,安.统计师。,42(2):757–788, 04 2014. 统一资源定位地址http://dx.doi.org/10.1214/14-AAOS1204。 ·Zbl 1321.62030号 ·doi:10.1214/14-AOS1204
[35] M.彭斯基。使用过完备字典解决线性不适定问题。技术报告1408.3386,Ann.Statist。,将于2014年8月在arXiv发布·Zbl 1346.62061号 ·doi:10.1214/16-AOS145
[36] R.Vershynin。随机矩阵的非渐近分析导论。,ArXiv电子版,2010年11月·Zbl 1259.60008号
[37] Bubacarr Bah和Jared Tanner。极限渐近中限制等距常数的界:高斯矩阵的公式。,线性代数应用。,441:88–109, 2014. ·Zbl 1282.15030号 ·doi:10.1016/j.laa.2012.11.024
[38] 乔尔·特罗普(Joel A.Tropp)。随机矩阵和的用户友好尾部界限。,计算数学基础,12(4):389–4342012·Zbl 1259.60008号 ·doi:10.1007/s10208-011-9099-z
[39] 帕斯卡·马萨特。,浓度不平等和模型选择:圣弗洛概率学院三十三-2003年,第1896卷。施普林格,2007年·Zbl 1170.60006号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。