×

大维数据的随机矩阵分析和半监督学习的改进。 (英语) Zbl 1476.68236号

摘要:本文提供了对一类面向图形的半监督学习算法在大数据和大量数据限制下的行为的原始理解。事实证明,这些方法的根本直觉在这个极限下崩溃了,因此,大多数方法变得不一致。提出了纠正措施和一种新的数据驱动参数化方案,并对由此产生的方法的渐近性能进行了理论分析。本文还说明了高斯混合模型和实际数据集的理论性能之间惊人的密切关系,从而表明了所提出的分析对于处理实际数据的重要性。因此,使用所提出的参数化在实际数据分类中观察到显著的性能提高。

MSC公司:

68T05型 人工智能中的学习和自适应系统
60对20 随机矩阵(概率方面)
2012年12月62日 参数估计量的渐近性质
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 阿米尔·安尼斯(Aamir Anis)、阿利·埃尔·加马尔(Aly El Gamal)、萨勒曼·阿维斯蒂梅尔(Salman Avestimehr)和安东尼奥·奥尔特加(Antonio Ortega)。半监督学习中图形信号带限插值的渐近证明。IEEE声学、语音和信号处理国际会议,第5461-5465页。IEEE,2015年。25 ·Zbl 1431.94049号
[2] 康斯坦丁·阿夫拉琴科夫(Konstantin Avrachenkov)、保罗·冈(Paulo Gon)小牛、阿列克谢·米舍宁(Alexey Mishenin)和玛丽娜·索科尔(Marina Sokol)。基于图的半监督学习的广义优化框架。arXiv预印本arXiv:1110.42782011。
[3] 米哈伊尔·贝尔金和帕塔·尼约吉。黎曼流形上的半监督学习。机器学习,56(1-3):209-2392004·Zbl 1089.68086号
[4] 米哈伊尔·贝尔金(Mikhail Belkin)、伊琳娜·马特维娃(Irina Matveeva)和帕塔·尼约吉(Partha Niyogi)。大型图的正则化和半监督学习。在国际计算学习理论会议(COLT),第624-638页。斯普林格,2004年·Zbl 1078.68685号
[5] Peter J Bickel,Bo Li,等。未知流形上的局部多项式回归。《复杂数据集和反问题》,第177-186页。数学统计研究所,2007年。
[6] P.Billingsley。概率与测度。约翰·威利父子公司,新泽西州霍博肯,第三版,1995年·Zbl 0822.60002号
[7] 奥利维尔·沙佩尔、伯恩哈德·施奥尔科普夫和亚历山大·齐恩。半监督学习。麻省理工学院出版社,2006年。
[8] 罗曼·库伊莱特(Romain Couillet)和弗洛伦特·贝纳伊奇·乔治斯(Florent Benaych-Georges)。大维数据的核谱聚类。arXiv预印arXiv:1510.035472015·Zbl 1398.62160号
[9] 罗曼·库伊莱特(Romain Couillet)和阿布拉·坎穆恩(Abla Kammoun)。随机矩阵改进了子空间聚类。在信号、系统和计算机Asilomar会议上,第90-94页。IEEE,2016年·Zbl 1507.60015号
[10] 阿克谢·加德(Akshay Gadde)、阿米尔·安尼斯(Aamir Anis)和安东尼奥·奥尔特加(Antonio Ortega)。基于图形信号采样理论的主动半监督学习。在知识发现和数据挖掘国际会议上,第492-501页。ACM,2014年·Zbl 1414.94853号
[11] 埃米尔·格勒克森、罗伊·利夫尼和沙伊·沙列夫·施瓦茨。流形上的有效半监督学习。在国际学习理论会议(COLT)上,第978-1003页,2017年。
[12] Andrew B Goldberg、Zhu Xiaojin、Aarti Singh、Xu Zhiting和Robert Nowak。多流形半监督学习。2009
[13] 马丁·斯祖默(Martin Szummer)、托米·雅科拉(Tommi Jaakkola)和马丁·舒默(Marting Szumer)。马尔可夫随机游动的部分标记分类。神经信息处理系统国际会议,14:945-9522002。
[14] 托尔斯滕·约阿希姆(Thorsten Joachims)等人。通过谱图分割的传递学习。机器学习国际会议,第3卷,第290-297页,2003年。
[15] Yann LeCun、Corinna Cortes和Christopher JC Burges。mnist手写数字数据库,1998年。
[16] 廖振宇和罗曼·库伊勒。最小二乘支持向量机的大维分析。arXiv预印arXiv:1701.029672017。26 ·Zbl 1414.62250号
[17] Amit Moscovich、Ariel Jaffe和Boaz Nadler。未知流形上的极小极大最优半监督回归。arXiv预印arXiv:1611.022212016。
[18] Boaz Nadler、Nathan Srebro和Xueyuan Zhou。图拉普拉斯半监督学习:无限未标记数据的极限。神经信息处理系统国际会议,第1330-1338页,2009年。
[19] Sunil K Narang、Akshay Gadde和Antonio Ortega。图形结构数据内插的信号处理技术。IEEE国际会议《声学、语音和信号处理》,第5445-5449页。IEEE,2013年a。
[20] Sunil K Narang、Akshay Gadde、Eduard Sanou和Antonio Ortega。图结构数据插值的局部迭代方法。在全球信号和信息处理会议上,第491-494页。IEEE,2013年b。
[21] Bernhard Sch¨olkopf和Alexander J Smola。使用内核学习:支持向量机、正则化、优化及其他。麻省理工学院出版社,2002年。
[22] 拉里·瓦瑟曼(Larry Wasserman)和约翰·德拉弗蒂(John D Lafferty)。半监督回归的统计分析。神经信息处理系统国际会议,第801-808页,2008年·Zbl 1132.62026号
[23] 周登勇(Dengyong Zhou)、奥利维尔·布斯克特(Olivier Bousquet)、托马斯·纳文·拉尔(Thomas Navin Lal)、杰森·韦斯顿(Jason Weston)和伯恩哈德·施科尔科夫(Bernhard Sch¨olkopf)。以本地和全球一致性学习。第16卷,第321-328页,2004年。
[24] 朱晓金和邹斌·加拉马尼。通过标签传播从标记和未标记数据中学习。技术报告,Citeser,2002年。
[25] 朱晓金,Zoubin Ghahramani,John Lafferty,等。使用高斯场和调和函数的半监督学习。在机器学习国际会议上,第3卷,第912-919页,2003年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。