×

一种可自动调整的半监督自训练算法。 (英语) Zbl 1461.68187号

摘要:作为传统分类方法的替代,半监督学习算法已经成为一个重要的研究课题,传统分类方法在标记数据上表现出显著的性能,但缺乏应用于大量未标记数据的能力。在这项工作中,我们提出了一种新的半监督学习算法,该算法基于自训练原理,从分类器池中动态选择最有希望的学习者来解决分类问题。我们的实验结果表明,该算法在准确性方面优于其分量半监督学习算法,从而获得更高效、稳定和鲁棒的预测模型。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Alpaydin,E;机器学习导论:剑桥,马萨诸塞州,美国2010·兹比尔1191.68485
[2] 朱,X。;Goldberg,A。;半监督学习导论;合成。莱克特。工件。智力。马赫。学习。:2009; 第3卷,1-130·Zbl 1209.68435号
[3] 朱,X。;半监督学习;机器学习百科全书:德国柏林,2011,892-897.
[4] 利维埃利斯,I.E。;Drakopoulou,K。;坦帕卡斯,V。;米克罗普洛斯,T。;Pintelas,P。;利用半监督学习方法预测中学生的学习成绩;J.教育。计算。决议:2018年。
[5] Sigdel,M。;Dinç,I。;Dinç,S。;西格德尔,M。;Pusey,M。;Aygün,R。;蛋白质结晶图像分类的半监督学习评价;程序。IEEE东南:2014,1-6.
[6] Keyvanpour,M。;伊马尼,M。;半监督文本分类:使用集成学习算法挖掘未标记数据;智力。数据分析:2013; 第17卷,367-385。
[7] 哈桑扎德,H。;Keyvanpour,M。;半监督和主动学习相结合的两阶段序列标记方法;智力。数据分析:2013; 第17卷,251-270。
[8] Borchani,H。;拉腊尼亚加,P。;比尔扎,C。;用部分标记数据对演化数据流进行分类;智力。数据分析:2011年;第15卷,655-670。
[9] 陈,M。;Tan,X。;张,L。;脑机接口中的迭代自训练支持向量机算法;智力。数据分析:2016; 第20卷,67-82。
[10] 拉勒,N。;Azgomi,文学硕士。;流数据中的一种混合欺诈评分和尖峰检测技术;智力。数据分析:2010; 第14卷,773-800。
[11] Blum,A。;Chawla,S。;利用图形切割从标记和未标记数据中学习;第十八届机器学习国际会议论文集:美国马萨诸塞州伯灵顿,19-26.
[12] Blum,A。;米切尔,T。;将标记和未标记数据与联合训练相结合;第11届计算学习理论年会论文集:美国纽约州纽约市,1998年,92-100.
[13] Triguero,I。;南卡罗来纳州加西亚。;Herrera,F。;半监督学习中的自我标记技术:分类、软件和实证研究;知识。信息系统:2015; 第42卷,245-284。
[14] Nigam,K。;加尼,R。;分析联合培训的有效性和适用性;第九届信息和知识管理国际会议记录:2000年美国纽约州纽约市,86-93.
[15] 李,M。;Zhou,Z。;SETRED:编辑自我训练;亚太知识发现和数据挖掘会议:德国柏林,2005年,611-621.
[16] Tanha,J。;van Someren,M。;Afsarmanesh,H。;决策树分类器的半监督自训练;国际J·马赫。学习。网络:2015; 第8卷,355-370页。
[17] Ghosh,J。;多分类器系统:回到未来;多分类器系统国际研讨会:德国柏林/海德堡,2002年,277-280. ·Zbl 1047.68737号
[18] Ng,V。;Cardie,C。;无冗余视图的弱监督自然语言学习;计算语言学协会北美分会2003年人类语言技术会议记录:;第1卷,94-101。
[19] Triguero,I。;Sáez,J。;Luengo,J。;南卡罗来纳州加西亚。;Herrera,F。;最近邻分类中半监督自训练噪声滤波器的特性研究;神经计算:2014年;第132卷,30-41页。
[20] 周,Y。;高盛,S。;民主合作学习;第16届IEEE人工智能工具国际会议论文集:,594-602.
[21] 李,M。;Zhou,Z。;使用未诊断样本,利用机器学习技术改进计算机辅助诊断;IEEE传输。系统。人类网络。A: 2007年;第37卷,1088-1098。
[22] Zhou,Z。;李,M。;三训练:使用三个分类器开发未标记数据;IEEE传输。知识。数据工程:2005年;第17卷,1529-1541。
[23] 哈迪,M。;Schwenker,F。;结合基于委员会的半监督学习和主动学习;J.计算。科学。技术:2010; 第25卷,681-698。
[24] 科斯托普洛斯,G。;利维埃利斯,I。;Kotsiantis,S。;坦帕卡斯,V。;CST表决-一种用于分类问题的半监督集成方法;J.智力。模糊系统:2018; 第35卷,99-109。
[25] 利维埃利斯,I.E。;卡纳沃斯,A。;坦帕卡斯,V。;Pintelas,P。;一种用于胸部X射线图像高效分类的集成SSL算法;J.成像:2018年;第4卷·Zbl 1461.68187号
[26] 利维埃利斯,I.E。;Drakopoulou,K。;坦帕卡斯,V。;米克罗普洛斯,T。;Pintelas,P。;基于集成的半监督学生成绩预测方法;教育中的电子学习和信息通信技术研究:2018年德国柏林。
[27] 鲍姆加特纳博士。;塞尔彭,G。;WEKA分类器的大型实验和评估工具;国际协调数据最小值:2009年;第16卷,340-346。
[28] 霍尔,M。;E.弗兰克。;霍姆斯,G。;普法林格,B。;鲁特曼,P。;Witten,I。;WEKA数据挖掘软件:更新;SIGKDD探索。新闻:2009; 第11卷,10-18。
[29] 巴赫,K。;利奇曼,M;UCI机器学习库:美国加利福尼亚州奥克兰,2013。
[30] Alcalá-Fdez,J。;费尔南德斯,A。;Luengo,J。;Derrac,J.等人。;南卡罗来纳州加西亚。;桑切斯,L。;Herrera,F。;龙骨数据挖掘软件工具:数据集存储库、算法集成和实验分析框架;J.穆特-宝贵的。日志。软计算:2011; 第17卷,255-287。
[31] Wang,Y。;Xu,X。;赵,H。;华,Z。;基于最近邻规则和切割边的半监督学习;知识-基于系统:2010; 第23卷,547-554。
[32] 吴,X。;库马尔,V。;J.昆兰。;Ghosh,J。;Yang,Q.杨。;Motoda,H。;麦克拉克伦,G。;Ng,A。;刘,B。;余,P。;数据挖掘领域的十大算法;知识。信息系统:2008; 第14卷,1-37页。
[33] 昆兰,J;C4.5:机器学习课程:美国加利福尼亚州旧金山,1993年。
[34] 科恩,W。;快速有效的规则归纳;机器学习国际会议论文集:,115-123.
[35] 阿哈,D;《懒惰的学习:多德雷赫特》,荷兰,1997年·Zbl 0869.68071号
[36] Dolan,E。;莫雷,J。;用性能曲线对标优化软件;数学。程序:2002; 第91卷,201-213·邮编:1049.90004
[37] 利维埃利斯,I.E。;Pintelas,P。;一种改进的谱共轭梯度神经网络训练算法;国际艺术杂志。智力。工具:2012;第21卷,1250009·Zbl 1245.65068号
[38] 利维埃利斯,I.E。;Pintelas,P。;一类新的非单调共轭梯度训练算法;申请。数学。计算:2015; 第266404-413卷·Zbl 1410.65235号
[39] 芬纳,H。;关于逐步递减多重测试过程中的单调性问题;《美国统计杂志》。协会:1993年;第88卷,920-923·Zbl 0799.62077号
[40] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F。;计算智能和数据挖掘实验设计中多重比较的高级非参数测试:功率实验分析;通知。科学:2010; 第180卷,2044-2064。
[41] 朱,X;半监督学习文献调查:麦迪逊,威斯康星州,美国2006。
[42] 比尔,T.D。;北卡罗来纳州克里斯蒂亚尼尼。;转导的凸方法;神经信息处理系统进展:剑桥,马萨诸塞州,美国2005,73-80.
[43] De Bie,T.等人。;北卡罗来纳州克里斯蒂亚尼尼。;基于半定规划的半监督学习;半监督学习:剑桥,马萨诸塞州,美国2006;第32卷。
[44] 齐,Z。;田,Y。;牛,L。;王,B。;具有特权信息的半监督分类;国际J·马赫。学习。网络:2015; 第6卷,667-676。
[45] 侯,X。;姚,G。;Wang,J。;基于低秩表示的半监督分类;算法:2016年;第9卷·Zbl 1461.62098号
[46] 冯·L。;Yu,G。;基于混合图的半监督分类;算法:2015年;第8卷,1021-1034。
[47] 查Z.J。;梅,T。;Wang,J。;王,Z。;Hua,X.S。;基于图的多标签半监督学习;视觉杂志。Commun公司。图像表示:2009; 第20卷,97-103。
[48] 周,D。;黄,J。;Schölkopf,B。;有向图上标记和未标记数据的学习;第22届机器学习国际会议论文集:纽约,纽约,美国2005,1036-1043.
[49] 潘,F。;Wang,J。;林,X。;基于局部边缘的半监督视觉识别鉴别嵌入;神经计算:2011年;第74卷,812-819。
[50] 李凯。;张杰。;Xu,H。;罗,S。;李,H。;一种基于协同训练的半监督极限学习机方法;J.计算。信息系统:2013; 第9卷,207-214。
[51] Huang,G.等人。;Song,S。;古普塔,J.N。;吴,C。;半监督和非监督极端学习机;IEEE传输。网络:2014; 第44卷,2405-2417。
[52] 贾,X。;王,R。;刘杰。;Powers,D.M。;一种半监督在线顺序极值学习机方法;神经计算:2016年;第174卷,168-178页。
[53] Nigam,K。;McCallum,A.K。;特隆,S。;米切尔,T。;使用EM对标记和未标记文档进行文本分类;马赫。学习。:2000; 第39卷,第103-134页·Zbl 0949.68162号
[54] Bishop,C;模式识别的神经网络:牛津,英国1995·兹比尔0868.68096
[55] 普拉特,J。;利用稀疏性和解析QP加速支持向量机的训练;神经信息处理系统的进展:英国剑桥,1999,557-563.
[56] 李,S。;王,Z。;周,G。;李,S.Y.M。;非平衡情绪分类的半监督学习;国际人工智能学会会议记录——国际人工智能联合会议:;第22卷,1826年。
[57] 杰尼,洛杉矶。;科恩,J.F。;德拉托雷,F。;面对不平衡的数据——关于使用性能指标的建议;2013年Humaine协会情感计算和智能交互会议记录:,245-251.
[58] 弗拉奇,P.A。;ROC空间的几何:通过ROC等距图理解机器学习度量;第20届国际机器学习会议论文集(ICML-03):,194-201年。
[59] Powers,D.M。;评价:从精确性、召回率和F-测量到ROC、信息性、标记性和相关性;J.马赫。学习。技术:2011; 第2卷,37-63。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。