×

一种稀疏的大边缘半监督学习方法。 (英语) Zbl 1294.62135号

摘要:我们提出了一种稀疏半监督学习方法,该方法结合了大裕度方法和\(L_{1}\)约束。本文的主要贡献是开发了一种高效的优化算法。大裕度半监督学习方法中要最小化的目标函数是非凸且不可微的,因此需要特殊的优化算法。为此,我们开发了一种优化算法,它是CCCP和梯度LASSO算法的混合。与现有的半监督学习方法相比,该方法的优点是可以识别少量相关输入变量,同时保持较高的预测精度。此外,该算法非常简单,可以应用于各种实际问题,而不受计算限制的限制。为了证实这些优点,我们通过分析模拟数据集和实际数据集,将该方法与标准半监督方法进行了比较。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62J07型 岭回归;收缩估计器(拉索)

软件:

套索
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] An,L。;Tao,P.,用D.C.算法求解一类线性约束的不定二次型问题,《全局优化杂志》,11,253-285(1997)·Zbl 0905.90131号
[2] O.布斯克。;沙佩尔,O。;Hein,M.,基于测量的正则化,(《神经信息处理系统的进展》,第16卷(2004年),麻省理工学院出版社:麻省理工学院出版社,马萨诸塞州剑桥)
[3] 贝尔金,M。;Niyogi,P.,黎曼流形上的半监督学习,机器学习,56209-239(2004)·Zbl 1089.68086号
[4] Bennett,K。;Demiriz,A.,《半监督支持向量机》,(神经信息处理系统进展,第10卷(1998年),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥)
[5] 沙佩尔,O。;Zien,A.,通过低密度分离进行半监督分类,(神经信息处理系统进展,第15卷(2003年),麻省理工学院出版社:麻省理学院出版社剑桥,MA)
[6] Chapelle,O.,《训练原始支持向量机》,《神经计算》,第19期,第1155-1178页(2007年)·兹比尔1123.68101
[7] 沙佩尔,O。;信德瓦尼,V。;Keerthi,S.,半监督支持向量机的优化技术,机器学习研究杂志,9203-233(2008)·Zbl 1225.68158号
[8] 科洛伯特,R。;辛兹,F。;J·韦斯顿。;Bottou,L.,可伸缩性的交易凸性,(神经信息处理系统进展,第18卷(2006年),麻省理工学院出版社:麻省理学院出版社剑桥,MA)
[9] 科洛伯特,R。;辛兹,F。;J·韦斯顿。;Bottou,L.,《大规模转换SVM》,《机器学习研究杂志》,第7期,1687-1712页(2006年)·Zbl 1222.68173号
[10] Grandvalet,Y。;Bengio,Y.,《熵最小化半监督学习》,(神经信息处理系统进展,第17卷(2005年),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥)
[11] Joachims,T.,使用支持向量机进行文本分类的归纳推理,(第十六届机器学习国际会议论文集(1999),Morgan Kaufmann:Morgan Koufmann San Francisco,CA),200-209
[12] Kim,J。;Kim,Y。;Kim,Y.,LASSO的基于梯度的优化算法,计算与图形统计杂志,1994-1009(2008)
[13] Kimeldorf,G。;Wahba,G.,关于切比雪夫样条函数的一些结果,数学分析与应用杂志,33,82-95(1971)·Zbl 0201.39702号
[14] Lin,Y.,分类中的支持向量机和贝叶斯规则,数据挖掘和知识发现,6259-275(2002)
[15] Nigam,K。;麦卡勒姆,A。;特隆,S。;Mitchell,T.,使用EM从标记和未标记文档中进行文本分类,机器学习,39,103-134(2000)·Zbl 0949.68162号
[16] 奥斯本,M。;Presnell,B。;Turlach,B.A.,《套索及其对偶》,《计算与图形统计杂志》,9,319-337(2000)
[17] Platt,J.C.,《使用序列最小优化快速训练支持向量机》,(《内核方法的进展》(1999),麻省理工学院出版社:麻省理学院出版社剑桥)
[18] Rosset,S。;Zhu,J.,分段线性正则解路径,《统计年鉴》,351012-1030(2007)·Zbl 1194.62094号
[19] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会杂志》,B辑,58267-288(1996)·Zbl 0850.62538号
[20] Vapnik,V.,《统计学习理论的本质》(1995),斯普林格出版社·Zbl 0833.62008号
[21] Wang,J。;沈,X。;Pan,W.,《关于转导支持向量机》,《当代数学丛书》,第43期,第7-19页(2007年)·Zbl 1147.68657号
[22] Wang,J。;沈欣,《大幅度半监督学习》,《机器学习研究杂志》,81867-1891(2007)·Zbl 1222.68329号
[23] J·韦斯顿。;莱斯利,C。;即E。;Zhou博士。;Elisseeff,A。;Noble,W.S.,使用簇核进行半监督蛋白质分类,生物信息学,21,3241-3247(2000)
[24] 尤耶,A。;Rangarajan,A.,凹-凸过程,神经计算,15,915-936(2003)·Zbl 1022.68112号
[25] 张,H。;瓦赫巴,G。;Lin,Y。;沃克尔,M。;费里斯,M。;Klein,R。;Klein,B.,通过似然基追踪进行变量选择和模型构建,美国统计协会杂志,99,659-672(2004)·Zbl 1117.62459号
[26] 朱,J。;Rosset,S。;哈斯蒂,T。;Tibshirani,R.,《神经信息处理系统进展》,第16卷(2004年),麻省理工学院出版社:麻省理工学院出版社剑桥
[27] 邹,H。;哈斯蒂,T。;Tibshirani,R.,《关于套索的自由度》,《统计年鉴》,352173-2192(2007)·Zbl 1126.62061号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。