文件Zbl 1440.68202-zbMATH Open

支持向量机的半监督主动学习：一种利用数据中结构信息的新方法。（英语） Zbl 1440.68202号

信息科学。 456, 13-33 (2018).

摘要：在当今的信息社会中，越来越多的数据出现，例如在社交网络、技术应用或商业实践中。公司尝试使用数据挖掘或机器学习方法将这些数据商业化。为此，通常对数据进行分类或分类，但很多时候成本很高（金钱或时间）。降低这些成本的有效方法是应用任何类型的主动学习（AL）方法，因为AL通过专门查询单个数据点（样本）来控制分类器的训练过程，然后由领域专家标记这些数据点（例如，提供类成员身份）。然而，对当前AL研究的分析表明，AL仍存在一些不足。特别是，分类输入空间中（未标记的）数据的空间模式给出的结构信息（例如，聚类信息）使用得不够充分。为了应对这一挑战，本文提出了一种基于支持向量机（SVM）的人工神经网络分类方法。结构信息通过概率模型捕获，当标签信息可用时，概率模型在运行时进行迭代改进。然后在基于距离、密度、多样性和分布信息的AL（4DS策略）选择策略和SVM（责任加权马氏核）特定核函数中考虑概率模型。有了20个基准数据集和MNIST数据集，我们的新解决方案比最先进的方法产生了更好的结果。

引用于4文件

MSC公司：

68T05型

人工智能中的学习和自适应系统

关键词：

主动学习;半监督学习;支持向量机;结构信息;责任加权马氏核;4DS战略

软件：

利比亚支持向量机

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	A.Asuncion，D.Newman，UCI机器学习库，上次访问日期：2018年3月27日(http://archive.ics.uci.edu/ml/; A.Asuncion，D.Newman，UCI机器学习库，上次访问日期：2018年3月27日(http://archive.ics.uci.edu/ml/
[2]	Beygelzimer，A。；达斯古普塔，S。；Langford，J.，重要性加权主动学习，第26届国际机器学习年会（ICML'09）论文集，蒙特利尔，QC，49-56（2009）
[3]	Beygelzimer，A。；Hsu，D.，高效主动学习，第28届机器学习国际会议（ICML’11）论文集，研讨会，华盛顿州贝尔维尤（2011）
[4]	Bordes，A。；俄勒冈州埃尔特金。；韦斯顿，J。；Bottou，L.，《具有在线和主动学习的快速核分类器》，J.Mach。学习。第6号决议，1579-1619（2005）·Zbl 1222.68152号
[5]	Brinker，K.，《利用支持向量机将多样性纳入主动学习》，《第20届机器学习国际会议论文集》，华盛顿特区，59-66（2003）
[6]	Calma，A。；Leimeister，J.M。；Lukowicz，P。；Oeste-Reiß，S。；雷特迈尔，T。；施密特，A。；生病，B。；Stumme，G。；Zweig，K.A.，《从主动学习到专用协作交互学习》，计算系统架构国际会议，德国纽伦堡，1-8（2016）
[7]	Cawlay，C.G.，《主动学习的基线方法》，JMLR:研讨会和会议记录16，意大利撒丁岛，47-57（2011）
[8]	Chang，C.-C。；Lin，C.-J.，LIBSVM：支持向量机库，ACM Trans。智力。系统。技术。，2, 27:1-27:27 (2011)
[9]	Chapelle，O.，在原始神经计算中训练支持向量机。，19, 5, 1155-1178 (2007) ·兹比尔1123.68101
[10]	卡尔弗，M。；Kun，D。；Scott，S.，《积极学习以最大化ROC曲线下的面积》，第六届国际数据挖掘会议论文集，中国香港，149-158（2006）
[11]	Cunhe，L。；Chenggang，W.，基于主动学习的新型半监督支持向量机学习算法，第二届未来计算机与通信国际会议论文集，武汉，638-641（2010）
[12]	Dagli，C.K。；拉贾拉姆，S。；Huang，T.S.，利用信息论多样性进行SVM主动学习，第18届模式识别国际会议论文集（ICPR’06），中国香港，506-511（2006）
[13]	Dasgupta，S.，《积极学习的两面》，Theor。计算。科学。，412, 19, 1767-1781 (2011) ·Zbl 1209.68408号
[14]	达斯古普塔，S。；Hsu，D.，主动学习的分层抽样，《第25届机器学习国际会议论文集》，芬兰赫尔辛基，208-215（2008）
[15]	Demšar，J.，多数据集上分类器的统计比较，J.Mach。学习。研究，7，1-30（2006）·Zbl 1222.68184号
[16]	杜达，R.O。；哈特，体育。；斯托克·D·G，《模式分类》（2001），约翰·威利父子公司：约翰·威立父子公司，纽约州奇切斯特·Zbl 0968.68140号
[17]	范，M。；顾，N。；乔·H。；张，B.，半监督分类的稀疏正则化，模式识别。，44, 8, 1777-1784 (2011) ·Zbl 1218.68120号
[18]	Fisch，D。；Kalkowski，E。；生病，B。；Ovaska，S.J.，《为了您的利益——生成分类器的客观兴趣度测量》，《第三届代理与人工智能国际会议（ICAART'11）论文集》，意大利罗马，414-423（2011）
[19]	Fisch博士。；Sick，B.，《利用弹性传播和变分贝叶斯推理训练径向基函数分类器》，神经网络国际联合会议（IJCNN’09），佐治亚州亚特兰大，838-847（2009）
[20]	弗里德曼，M.，《（M）排名问题重要性替代测试的比较》，《数学年鉴》。统计，11，1，86-92（1940）
[21]	甘蒂，R。；Gray，A.，《搭建桥梁：从多臂强盗镜头中观察主动学习》，《第二十届人工智能不确定性会议论文集》（UAI'13），华盛顿州贝尔维尤（2013）
[22]	徐，C.-W。；Lin，C.-J.，《多类支持向量机方法的比较》，IEEE Trans。神经网络。，13, 415-425 (2002)
[23]	Ji，M。；Han，J.，图上主动学习的方差最小化标准，第15届国际人工智能与统计会议论文集（AISTATS’12），加那利群岛拉帕尔马，22556-564（2012）
[24]	Lefakis，L。；Wiering，M.，《使用主动学习进行手写字符识别的半监督方法》，《比利时-荷兰人工智能会议论文集》，荷兰乌得勒支，205-212（2007）
[25]	Leng，Y。；Xu，X。；Qi，G.，结合主动学习和半监督学习构建SVM分类器，Knowl。基于系统。，44, 0, 121-131 (2013)
[26]	Mazzoni，D。；Wagstaff，K.L。；Burl，M.C.，《带无关示例的主动学习》，第17届欧洲机器学习会议论文集（ECML'06），德国柏林，695-702（2006）
[27]	S.Melacci，流形正则化：Laplacian SVM，上次访问时间2018年3月27日(http://www.dii.unisi.it网站/melacci/lapsvmp/；S.Melacci，流形正则化：Laplacian SVM，上次访问时间2018年3月27日(http://www.dii.unisi.it网站/melacci/lapsvmp公司/
[28]	MNIST，MNIST手写数字数据库，上次访问日期：2018年3月27日(http://yann.lecun.com/exdb/mnist/; MNIST，MNIST手写数字数据库，上次访问日期：2018年3月27日(http://yann.lecun.com/exdb/mnist/
[29]	Nemenyi，P.，《无分布多重比较》（1963年），普林斯顿大学：普林斯顿大学，美国新泽西州普林斯顿
[30]	Nguyen，H.T。；Smeulders，A.，使用预聚类的主动学习，第21届机器学习国际会议论文集（ICML'04），Banff，AB，623-630（2004）
[31]	Ni，T。；钟，F.-L。；Wang，S.，具有流形正则化和部分标记隐私保护的支持向量机，信息科学。，294, 0, 390-407 (2015) ·Zbl 1360.68702号
[32]	牛，B。；Cheng，J。；Bai，X。；Lu，H.，基于非对称传播的批处理模式主动学习用于图像检索，信号处理。，1639-1650年6月93日（2013年）
[33]	C.奥尔罕。塔什坦，ALEVS：通过统计杠杆抽样进行主动学习，最后一次访问日期：2018年3月27日(http://arxiv.org/abs/1507.04155; C.奥尔罕。塔什坦，ALEVS：通过统计杠杆抽样进行主动学习，最后一次访问日期：2018年3月27日(http://arxiv.org/abs/1507.04155
[34]	齐，Z。；田，Y。；Shi，Y.，拉普拉斯支持向量机的连续超松弛，IEEE Trans。神经网络。学习。系统。，26, 4, 674-683 (2015)
[35]	雷特迈尔，T。；卡尔玛，A。；Sick，B.，《Transductive active learning-一种新的半监督学习方法》，《Inf.Sci.》。，293, 275-298 (2014)
[36]	雷特迈尔，T。；Sick，B.，让我们知道你的决定：使用选择策略4DS、Inf.Sci.、。，230, 106-131 (2013)
[37]	雷特迈尔，T。；Sick，B.，《用于分类的支持向量机半监督训练的责任加权马氏核》，《信息科学》。，323, 179-198 (2015)
[38]	B.Ripley，模式识别和神经网络，上次访问日期：2018年3月27日(http://www.stats.ox.ac.uk/pub/PRNN/; B.Ripley，模式识别和神经网络，上次访问日期：2018年3月27日(http://www.stats.ox.ac.uk/pub/PRNN/
[39]	Settles，B.，《主动学习文献调查》，计算机科学与技术Bericht（2009），威斯康星大学计算机科学系
[40]	沉降，B。；Craven，M.，《序列标记任务的主动学习策略分析》，自然语言处理实证方法会议论文集，夏威夷州火奴鲁鲁，1070-1079（2008）
[41]	宋，M。；Yu，H。；Han，W.-S.S.，结合主动学习和半监督学习技术提取蛋白质相互作用句子，BMC Bioinf。，12，补充12，1-11（2011）
[42]	唐，S。；Koller，D.，支持向量机主动学习及其在文本分类中的应用，J.Mach。学习。第245-66号决议（2002年）·Zbl 1009.68131号
[43]	UCL，UCL/MLG Elena数据库，上次访问时间2018年3月27日(https://www.elen.ucl.ac.be/neural-nets/Research/Projects/ELENA/ELENA.htm; UCL，UCL/MLG Elena数据库，上次访问时间2018年3月27日(https://www.elen.ucl.ac.be/neural-nets/Research/Projects/ELENA/ELENA.htm
[44]	王，Z。；Yan，S。；Zhang，C.，带自适应正则化的主动学习，模式识别，44，10-11，2375-2383（2011）·Zbl 1218.68137号
[45]	徐，Z。；Yu，K。；Tresp，V.公司。；Xu，X。；Wang，J.，使用支持向量机进行文本分类的代表性采样，信息检索进展。信息检索进展，计算机科学讲稿，2633393-407（2003），施普林格·Zbl 1027.68590号
[46]	杨，Z。；Xu，Y.，用于半监督分类的拉普拉斯双参数边缘支持向量机，神经计算，171，325-334（2016）
[47]	张欣，基于多分类器融合和主动学习的交互式专利分类，神经计算，127200-205（2014）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

支持向量机的半监督主动学习：一种利用数据中结构信息的新方法。 （英语） Zbl 1440.68202号

MSC公司：

关键词：

软件：

参考文献：

支持向量机的半监督主动学习：一种利用数据中结构信息的新方法。（英语） Zbl 1440.68202号