文件Zbl 1408.62114-zbMATH Open

Pierre C.Bellec。;Dalalyan，Arnak S。;埃德温·格拉宾;巴黎，昆廷

关于部分标记设置中拉索的预测损失。（英语） Zbl 1408.62114号

电子。J.统计。 12，第2号，3443-3472（2018）.

小结：在本文中，我们重新讨论了传递学习和半监督学习环境下Lasso估计的风险边界。换句话说，所考虑的设置是部分标记下随机设计的回归。主要目标是获得用户友好的非样本预测风险边界。为此，考虑了有界响应变量和有界（高维）协变量的简单设置。我们提出了拉索对这些设置的一些新修改，并建立了预期和偏差的预言不等式。这些结果提供了风险的非渐近上限，突出了由于线性模型的错误规范导致的偏差、由于近似稀疏性导致的偏差和方差之间的相互作用。它们还表明，在设计矩阵的限制特征值消失或非常小的情况下，大量未标记特征的存在可能会产生显著的积极影响。

引用于7文件

MSC公司：

62H30型	分类和区分；聚类分析（统计方面）
62G08号	非参数回归和分位数回归
62J07型	岭回归；收缩估计器（拉索）
68T05型	人工智能中的学习和自适应系统

关键词：

半监督学习;稀疏;拉索;oracle不等式;传导学习;高维回归;预测风险

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司欧几里得

参考文献：

[1]	弗拉基米尔·瓦普尼克。，统计学习理论。信号处理、通信和控制的自适应和学习系统。John Wiley&Sons，Inc.，纽约，1998年。Wiley Interscience出版。
[2]	玛丽亚·弗洛丽娜·巴尔坎、阿夫林·布鲁姆、帕特里克·巴基安·崔、约翰·拉弗蒂、布莱恩·潘塔诺、穆吉齐·鲁班吉拉和朱晓金。网络摄像头图像中的人识别：半监督学习的应用。，ICM L2005部分分类培训数据学习研讨会，2005年。
[3]	马蒂厄·吉利亚明（Matthieu Guillaumin）、雅各布·J·韦贝克（Jakob J.Verbeek）和科迪利亚·施密德（Cordelia Schmid）。用于图像分类的多模态半监督学习。2010年6月13日至18日，美国加利福尼亚州旧金山，第20届IEEE计算机视觉和模式识别会议，CVPR 2010，第902-909页。统一资源定位地址http://dx.doi.org/10.109/CVPR.2010.5540120。
[4]	塞琳·布鲁瓦尔、弗洛伦斯·德·阿尔切·布克和玛丽·萨弗兰斯基。链路预测的半监督惩罚输出核回归。编辑Lise Getoor和Tobias Scheffer，《第28届机器学习国际会议论文集》，2011年ICML，美国华盛顿贝尔维尤，2011年6月28日至7月2日，第593-600页。Omnipress，2011年。
[5]	O.Chapelle、B.Shölkopf和A.Zien，编辑。，半监督学习。麻省理工学院出版社，2006年。
[6]	菲利普·里戈莱特（Philippe Rigollet）。聚类假设下半监督分类的广义误差界。，J.马赫。学习。2007年第8:1369–1392号决议·Zbl 1222.68288号
[7]	王俊晖和沈小童。大幅度半监督学习。，J.马赫。学习。决议，8:1867-18912007年·兹比尔1222.68329
[8]	约翰·拉弗蒂（John D.Lafferty）和拉里·瓦瑟曼（Larry A.Wasserman）。半监督回归的统计分析。在，NIPS，第801–808页。Curran Associates，Inc.，2007年。
[9]	米哈伊尔·贝尔金（Mikhail Belkin）、帕塔·尼约吉（Partha Niyogi）和维卡斯·辛德瓦尼（Vikas Sindhwani）。流形正则化：从标记和未标记示例学习的几何框架。，J.马赫。学习。2006年第7:2399–2434号决议·Zbl 1222.68144号
[10]	Boaz Nadler、Nathan Srebro和Xueyuan Zhou。半监督学习的统计分析：无限未标记数据的极限。年，《神经信息处理系统进展》22，第1330–1338页。Curran Associates，Inc.，2009年。
[11]	帕塔·尼约吉。流形正则化和半监督学习：一些理论分析。，机器学习研究杂志，14:1229–12502013。统一资源定位地址http://jmlr.org/papers/v14/niyogi13a.html。 ·Zbl 1317.68178号
[12]	孙世良和约翰·肖·泰勒。使用共轭函数的稀疏半监督学习。，J.马赫。学习。2010年第11:2423-2455号决议·Zbl 1242.68251号
[13]	David Azriel、Lawrence D Brown、Michael Sklar、Richard Berk、Andreas Buja和Linda Zhao。半监督线性回归。，arXiv预印arXiv:1612.023912016。
[14]	A.Chakrabortty和T.Cai。半监督环境下的高效自适应线性回归。，ArXiv电子版，2017年1月。
[15]	罗伯特·提比拉尼（Robert Tibshirani）。通过套索进行回归收缩和选择。，J.罗伊。统计师。Soc.序列号。B、 58（1）：267–2881996年·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[16]	彼得·鲍尔曼和萨拉·范德格尔。，高维数据统计。统计学中的斯普林格系列。施普林格，海德堡，2011年。方法、理论和应用·Zbl 1273.62015年
[17]	Pierre C Bellec、Guillaume Lecué和Alexandre B Tsybakov。斜率满足套索：改进了预言边界和优化。，《统计年鉴》，46（6B）：3603–36422018。统一资源定位地址https://projecteuclid.org/euclid.aos/1536631285。 ·Zbl 1405.62056号 ·doi:10.1214/17-AOS1670
[18]	弗拉基米尔·科尔钦斯基（Vladimir Koltchinskii）、卡里姆·卢尼奇（Karim Lounici）和亚历山大·谢巴科夫（Alexandre B.Tsybakov）。噪声低秩矩阵补全的核形式惩罚与最优速率。，《统计年鉴》，39（5）：2302–23292011年·Zbl 1231.62097号 ·doi:10.1214/11-AOS894
[19]	孙廷妮和张存慧。标度稀疏线性回归。，《生物统计学》，99（4）：879–8982012·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043
[20]	Arnak S.Dalalyan、Mohamed Heibiri和Johannes Lederer。关于套索的预测性能。，伯努利，23（1）：552-5812017·Zbl 1359.62295号 ·doi:10.3150/15-BEJ756
[21]	Fei Ye和Cun-Hui Zhang。Lasso和Dantzig选择器的速率最小性\(ℓ _q）损失\(ℓ _r）滚珠。，J.马赫。学习。2010年第11:3519–3540号决议·Zbl 1242.62074号
[22]	加维什·拉斯库蒂（Garvesh Raskutti）、马丁·温赖特（Martin J.Wainwright）和余斌（Bin Yu）。上高维线性回归的极小极大估计率\(Ş_q）-球。，IEEE传输。通知。理论，57（10）：6976–69942011·兹比尔1365.62276 ·doi:10.1109/TIT.2011.2165799
[23]	菲利普·里戈莱特（Philippe Rigollet）和亚历山大·茨巴科夫（Alexandre Tsybakov）。指数筛选和稀疏估计的最佳速率。，安.统计师。，39(2):731–771, 2011. ·Zbl 1215.62043号 ·doi:10.1214/10-AOS854
[24]	菲利普·里戈莱特（Philippe Rigollet）和亚历山大·茨巴科夫（Alexandre B.Tsybakov）。指数加权稀疏估计。，统计师。科学。，27(4):558–575, 2012. ·兹比尔1331.62351 ·doi:10.1214/12-STS393
[25]	彼得·比克尔（Peter J.Bickel）、亚奥科夫·里托夫（Ya’acov Ritov）和亚历山大·谢巴科夫（Alexandre B.Tsybakov）。同时分析套索和Dantzig选择器。，安.统计师。，37(4) :1705–1732, 2009. ·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[26]	Sara van de Geer和Peter Bühlmann。根据用于证明Lasso.的oracle结果的条件。，电子。J.Stat.，3:1360–13922009年·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[27]	弗拉基米尔·科尔钦斯基。，Oracle在经验风险最小化和稀疏恢复问题中的不平等：圣弗洛尔概率经济研究所XXXVIII-2008年第38卷。施普林格，2011年·Zbl 1223.91002号
[28]	皮埃尔·阿尔基尔（Pierre Alquier）和穆罕默德·希比里（Mohamed Hebiri）。LASSO和dantzig选择器的传导性版本。，《统计规划与推断杂志》，142（9）：2485–2500，2012年·兹比尔1428.62312 ·doi:10.1016/j.jspi.2012.03.020
[29]	纪尧姆·勒库埃（Guillaume Lecué）和沙哈·门德尔森（Shahar Mendelson）。正则化和小球方法i：稀疏恢复。技术报告1601.05584，arXiv，2016年1月·Zbl 1403.60085号 ·doi:10.1214/17-AOS1562
[30]	加维什·拉斯库蒂（Garvesh Raskutti）、马丁·温赖特（Martin J Wainwright）和余斌（Bin Yu）。相关高斯设计的受限特征值特性。，机器学习研究杂志，11:2241–22592010·Zbl 1242.62071号
[31]	罗伯托·伊姆布泽罗·奥利维拉。随机二次型的下尾，应用于普通最小二乘和限制特征值性质。，arXiv预印arXiv:1312.29032013·Zbl 1360.60075号 ·doi:10.1007/s00440-016-0738-9
[32]	马克·鲁德尔森和周书恒。各向异性随机测量的重建。，信息理论，IEEE汇刊，59（6）：3434–34472013·Zbl 1364.94158号 ·doi:10.1109/TIT.2013.2243201
[33]	安纳托利·朱迪茨基（Anatoli Juditsky）和阿卡迪·内米洛夫斯基（Arkadi Nemirovski）。恢复的准确性保证。，信息理论，IEEE汇刊，57（12）：7818–78392011·Zbl 1365.94077号 ·doi:10.1109/TIT.2011.2162569
[34]	亚历山大·贝洛尼（Alexandre Belloni）、维克托·切尔诺朱科夫（Victor Chernozhukov）和王烈（Lie Wang）。非参数回归中基于平方套索的枢轴估计。，安.统计师。，42(2):757–788, 04 2014. 统一资源定位地址http://dx.doi.org/10.1214/14-AAOS1204。 ·Zbl 1321.62030号 ·doi:10.1214/14-AOS1204
[35]	M.彭斯基。使用过完备字典解决线性不适定问题。技术报告1408.3386，Ann.Statist。，将于2014年8月在arXiv发布·Zbl 1346.62061号 ·doi:10.1214/16-AOS145
[36]	R.Vershynin。随机矩阵的非渐近分析导论。，ArXiv电子版，2010年11月·Zbl 1259.60008号
[37]	Bubacarr Bah和Jared Tanner。极限渐近中限制等距常数的界：高斯矩阵的公式。，线性代数应用。，441:88–109, 2014. ·Zbl 1282.15030号 ·doi:10.1016/j.laa.2012.11.024
[38]	乔尔·特罗普（Joel A.Tropp）。随机矩阵和的用户友好尾部界限。，计算数学基础，12（4）：389–4342012·Zbl 1259.60008号 ·doi:10.1007/s10208-011-9099-z
[39]	帕斯卡·马萨特。，浓度不平等和模型选择：圣弗洛概率学院三十三-2003年，第1896卷。施普林格，2007年·Zbl 1170.60006号

此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配，并且可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	括号

示例

领域

操作员

关于部分标记设置中拉索的预测损失。（英语） Zbl 1408.62114号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

关于部分标记设置中拉索的预测损失。 （英语） Zbl 1408.62114号

MSC公司：

关键词：

参考文献：

关于部分标记设置中拉索的预测损失。（英语） Zbl 1408.62114号