×

支持向量机的半监督主动学习:一种利用数据中结构信息的新方法。 (英语) Zbl 1440.68202号

摘要:在当今的信息社会中,越来越多的数据出现,例如在社交网络、技术应用或商业实践中。公司尝试使用数据挖掘或机器学习方法将这些数据商业化。为此,通常对数据进行分类或分类,但很多时候成本很高(金钱或时间)。降低这些成本的有效方法是应用任何类型的主动学习(AL)方法,因为AL通过专门查询单个数据点(样本)来控制分类器的训练过程,然后由领域专家标记这些数据点(例如,提供类成员身份)。然而,对当前AL研究的分析表明,AL仍存在一些不足。特别是,分类输入空间中(未标记的)数据的空间模式给出的结构信息(例如,聚类信息)使用得不够充分。为了应对这一挑战,本文提出了一种基于支持向量机(SVM)的人工神经网络分类方法。结构信息通过概率模型捕获,当标签信息可用时,概率模型在运行时进行迭代改进。然后在基于距离、密度、多样性和分布信息的AL(4DS策略)选择策略和SVM(责任加权马氏核)特定核函数中考虑概率模型。有了20个基准数据集和MNIST数据集,我们的新解决方案比最先进的方法产生了更好的结果。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.Asuncion,D.Newman,UCI机器学习库,上次访问日期:2018年3月27日(http://archive.ics.uci.edu/ml/; A.Asuncion,D.Newman,UCI机器学习库,上次访问日期:2018年3月27日(http://archive.ics.uci.edu/ml/
[2] Beygelzimer,A。;达斯古普塔,S。;Langford,J.,重要性加权主动学习,第26届国际机器学习年会(ICML'09)论文集,蒙特利尔,QC,49-56(2009)
[3] Beygelzimer,A。;Hsu,D.,高效主动学习,第28届机器学习国际会议(ICML’11)论文集,研讨会,华盛顿州贝尔维尤(2011)
[4] Bordes,A。;俄勒冈州埃尔特金。;韦斯顿,J。;Bottou,L.,《具有在线和主动学习的快速核分类器》,J.Mach。学习。第6号决议,1579-1619(2005)·Zbl 1222.68152号
[5] Brinker,K.,《利用支持向量机将多样性纳入主动学习》,《第20届机器学习国际会议论文集》,华盛顿特区,59-66(2003)
[6] Calma,A。;Leimeister,J.M。;Lukowicz,P。;Oeste-Reiß,S。;雷特迈尔,T。;施密特,A。;生病,B。;Stumme,G。;Zweig,K.A.,《从主动学习到专用协作交互学习》,计算系统架构国际会议,德国纽伦堡,1-8(2016)
[7] Cawlay,C.G.,《主动学习的基线方法》,JMLR:研讨会和会议记录16,意大利撒丁岛,47-57(2011)
[8] Chang,C.-C。;Lin,C.-J.,LIBSVM:支持向量机库,ACM Trans。智力。系统。技术。,2, 27:1-27:27 (2011)
[9] Chapelle,O.,在原始神经计算中训练支持向量机。,19, 5, 1155-1178 (2007) ·兹比尔1123.68101
[10] 卡尔弗,M。;Kun,D。;Scott,S.,《积极学习以最大化ROC曲线下的面积》,第六届国际数据挖掘会议论文集,中国香港,149-158(2006)
[11] Cunhe,L。;Chenggang,W.,基于主动学习的新型半监督支持向量机学习算法,第二届未来计算机与通信国际会议论文集,武汉,638-641(2010)
[12] Dagli,C.K。;拉贾拉姆,S。;Huang,T.S.,利用信息论多样性进行SVM主动学习,第18届模式识别国际会议论文集(ICPR’06),中国香港,506-511(2006)
[13] Dasgupta,S.,《积极学习的两面》,Theor。计算。科学。,412, 19, 1767-1781 (2011) ·Zbl 1209.68408号
[14] 达斯古普塔,S。;Hsu,D.,主动学习的分层抽样,《第25届机器学习国际会议论文集》,芬兰赫尔辛基,208-215(2008)
[15] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
[16] 杜达,R.O。;哈特,体育。;斯托克·D·G,《模式分类》(2001),约翰·威利父子公司:约翰·威立父子公司,纽约州奇切斯特·Zbl 0968.68140号
[17] 范,M。;顾,N。;乔·H。;张,B.,半监督分类的稀疏正则化,模式识别。,44, 8, 1777-1784 (2011) ·Zbl 1218.68120号
[18] Fisch,D。;Kalkowski,E。;生病,B。;Ovaska,S.J.,《为了您的利益——生成分类器的客观兴趣度测量》,《第三届代理与人工智能国际会议(ICAART'11)论文集》,意大利罗马,414-423(2011)
[19] Fisch博士。;Sick,B.,《利用弹性传播和变分贝叶斯推理训练径向基函数分类器》,神经网络国际联合会议(IJCNN’09),佐治亚州亚特兰大,838-847(2009)
[20] 弗里德曼,M.,《(M)排名问题重要性替代测试的比较》,《数学年鉴》。统计,11,1,86-92(1940)
[21] 甘蒂,R。;Gray,A.,《搭建桥梁:从多臂强盗镜头中观察主动学习》,《第二十届人工智能不确定性会议论文集》(UAI'13),华盛顿州贝尔维尤(2013)
[22] 徐,C.-W。;Lin,C.-J.,《多类支持向量机方法的比较》,IEEE Trans。神经网络。,13, 415-425 (2002)
[23] Ji,M。;Han,J.,图上主动学习的方差最小化标准,第15届国际人工智能与统计会议论文集(AISTATS’12),加那利群岛拉帕尔马,22556-564(2012)
[24] Lefakis,L。;Wiering,M.,《使用主动学习进行手写字符识别的半监督方法》,《比利时-荷兰人工智能会议论文集》,荷兰乌得勒支,205-212(2007)
[25] Leng,Y。;Xu,X。;Qi,G.,结合主动学习和半监督学习构建SVM分类器,Knowl。基于系统。,44, 0, 121-131 (2013)
[26] Mazzoni,D。;Wagstaff,K.L。;Burl,M.C.,《带无关示例的主动学习》,第17届欧洲机器学习会议论文集(ECML'06),德国柏林,695-702(2006)
[27] S.Melacci,流形正则化:Laplacian SVM,上次访问时间2018年3月27日(http://www.dii.unisi.it网站/melacci/lapsvmp/;S.Melacci,流形正则化:Laplacian SVM,上次访问时间2018年3月27日(http://www.dii.unisi.it网站/melacci/lapsvmp公司/
[28] MNIST,MNIST手写数字数据库,上次访问日期:2018年3月27日(http://yann.lecun.com/exdb/mnist/; MNIST,MNIST手写数字数据库,上次访问日期:2018年3月27日(http://yann.lecun.com/exdb/mnist/
[29] Nemenyi,P.,《无分布多重比较》(1963年),普林斯顿大学:普林斯顿大学,美国新泽西州普林斯顿
[30] Nguyen,H.T。;Smeulders,A.,使用预聚类的主动学习,第21届机器学习国际会议论文集(ICML'04),Banff,AB,623-630(2004)
[31] Ni,T。;钟,F.-L。;Wang,S.,具有流形正则化和部分标记隐私保护的支持向量机,信息科学。,294, 0, 390-407 (2015) ·Zbl 1360.68702号
[32] 牛,B。;Cheng,J。;Bai,X。;Lu,H.,基于非对称传播的批处理模式主动学习用于图像检索,信号处理。,1639-1650年6月93日(2013年)
[33] C.奥尔罕。塔什坦,ALEVS:通过统计杠杆抽样进行主动学习,最后一次访问日期:2018年3月27日(http://arxiv.org/abs/1507.04155; C.奥尔罕。塔什坦,ALEVS:通过统计杠杆抽样进行主动学习,最后一次访问日期:2018年3月27日(http://arxiv.org/abs/1507.04155
[34] 齐,Z。;田,Y。;Shi,Y.,拉普拉斯支持向量机的连续超松弛,IEEE Trans。神经网络。学习。系统。,26, 4, 674-683 (2015)
[35] 雷特迈尔,T。;卡尔玛,A。;Sick,B.,《Transductive active learning-一种新的半监督学习方法》,《Inf.Sci.》。,293, 275-298 (2014)
[36] 雷特迈尔,T。;Sick,B.,让我们知道你的决定:使用选择策略4DS、Inf.Sci.、。,230, 106-131 (2013)
[37] 雷特迈尔,T。;Sick,B.,《用于分类的支持向量机半监督训练的责任加权马氏核》,《信息科学》。,323, 179-198 (2015)
[38] B.Ripley,模式识别和神经网络,上次访问日期:2018年3月27日(http://www.stats.ox.ac.uk/pub/PRNN/; B.Ripley,模式识别和神经网络,上次访问日期:2018年3月27日(http://www.stats.ox.ac.uk/pub/PRNN/
[39] Settles,B.,《主动学习文献调查》,计算机科学与技术Bericht(2009),威斯康星大学计算机科学系
[40] 沉降,B。;Craven,M.,《序列标记任务的主动学习策略分析》,自然语言处理实证方法会议论文集,夏威夷州火奴鲁鲁,1070-1079(2008)
[41] 宋,M。;Yu,H。;Han,W.-S.S.,结合主动学习和半监督学习技术提取蛋白质相互作用句子,BMC Bioinf。,12,补充12,1-11(2011)
[42] 唐,S。;Koller,D.,支持向量机主动学习及其在文本分类中的应用,J.Mach。学习。第245-66号决议(2002年)·Zbl 1009.68131号
[43] UCL,UCL/MLG Elena数据库,上次访问时间2018年3月27日(https://www.elen.ucl.ac.be/neural-nets/Research/Projects/ELENA/ELENA.htm; UCL,UCL/MLG Elena数据库,上次访问时间2018年3月27日(https://www.elen.ucl.ac.be/neural-nets/Research/Projects/ELENA/ELENA.htm
[44] 王,Z。;Yan,S。;Zhang,C.,带自适应正则化的主动学习,模式识别,44,10-11,2375-2383(2011)·Zbl 1218.68137号
[45] 徐,Z。;Yu,K。;Tresp,V.公司。;Xu,X。;Wang,J.,使用支持向量机进行文本分类的代表性采样,信息检索进展。信息检索进展,计算机科学讲稿,2633393-407(2003),施普林格·Zbl 1027.68590号
[46] 杨,Z。;Xu,Y.,用于半监督分类的拉普拉斯双参数边缘支持向量机,神经计算,171,325-334(2016)
[47] 张欣,基于多分类器融合和主动学习的交互式专利分类,神经计算,127200-205(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。