文件Zbl 1491.68161-zbMATH Open

丹尼尔·科特克;马雷克·赫德;Christoph Sandrock公司;丹尼斯·胡塞尔基克;乔治·克伦普;生病了，伯恩哈德

使用贝叶斯方法实现最优概率主动学习。（英语）兹比尔1491.68161

机器。学习。 110，第6期，1199-1231（2021）.

主动学习方法选择下一个要学习的输入，以便在监督学习下使学习更有效，即输入-输出关系的学习。本文考虑了分类环境中的主动学习框架。利用分类模型的Dirichlet共轭先验，定义了估计的风险差异，并提出了一种新的主动学习策略，即主动学习的期望概率增益（xPAL）。通过一些修改，xPAL简化为现有的主动学习方法、预期误差减少（EER）、概率主动学习（PAL）和不确定性采样（US）。作者从理论上证明了这些关系，并将xPAL的性能与现有方法进行了数值比较。虽然很少讨论基于统计实验设计的主动学习框架的联系，但xPAL为最近的主动学习方法提供了一个统一的框架。

审核人：渡边和穗（丰桥）

引用于三文件

MSC公司：

68T05型	人工智能中的学习和自适应系统
62H30型	分类和区分；聚类分析（统计方面）

关键词：

主动学习;分类;概率主动学习

软件：

scikit活性ml;开放多媒体程序库;PRMLT公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	巴拉姆，Y。；亚尼夫，RE；Luz，K.，《主动学习算法的在线选择》，《机器学习研究杂志》，5，255-291（2004）
[2]	Beyer，C.、Krempl，G.和Lemaire，V.（2015）。如何选择重要信息：关于分类的主动学习策略的比较研究。《第15届国际知识技术和数据驱动商业会议论文集》，计算机械协会，i-KNOW’15，美国纽约州纽约市。
[3]	Bishop，CM，模式识别和机器学习（2006），Springer·Zbl 1107.68072号
[4]	Bondu，A.、Lemaire，V.和Boullé，M.（2010年）。主动学习中的探索与开发：贝叶斯方法。在国际神经网络联合会议（IJCNN）上（第1-7页）。电气与电子工程师协会。
[5]	Brinker，K.（2003年）。在主动学习中结合多样性和支持向量机。第20届国际机器学习会议（ICML）论文集（第59-66页）。
[6]	Calma，A。；雷特迈尔，T。；Sick，B.，《支持向量机的半监督主动学习：利用数据结构信息的新方法》，《信息科学》，456，13-33（2018）·Zbl 1440.68202号 ·doi:10.1016/j.ins.2018.04.063
[7]	Chapelle，O.（2005）。parzen窗口分类器的主动学习。第10届人工智能与统计国际研讨会论文集（AISTATS）（第5卷，第49-56页）。
[8]	Chaudhuri，A.、Kakde，D.、Sadek，C.、Gonzalez，L.和Kong，S.（2017年）。支持向量数据描述的核带宽选择的平均值和中值标准。数据挖掘研讨会国际会议（ICDMW）（第842-849页）。电气与电子工程师协会。
[9]	Cuong，N.V.、Lee，W.S.和Ye，N.（2014）。具有一般损失的近最优自适应池式主动学习。《第30届人工智能不确定性会议论文集》（第122-131页）。
[10]	Dasgupta，S.（2009年）。积极学习的两个方面。在发现科学国际会议上（第35-35页）。斯普林格。
[11]	Donmez，P.、Carbonell，J.G.和Bennett，P.N.（2007年）。双策略主动学习。《欧洲机器学习会议论文集》（ECML）（第116-127页）。斯普林格。
[12]	Golovin，D.和Krause，A.（2010年）。自适应子模块：一种新的主动学习和随机优化方法。算法学习理论（ALT）第23届会议论文集（第333-345页）。
[13]	Guillory，A.和Bilmes，J.（2010年）。交互式子模块集合封面。第27届国际机器学习会议（ICML）论文集。
[14]	Hernández-González，J。；罗德里格斯，D。；Inza，I。；哈里森·R。；Lozano，JA，由一群可靠性未知的注释者标记的缺陷报告的两个数据集，《简要数据》，18，840-845（2018）·doi:10.1016/j.dib.2018.03.109
[15]	Houlsby，N.、Huszár，F.、Ghahramani，Z.和Lengyel，M.（2011）。贝叶斯主动学习用于分类和偏好学习。arXiv:1112.5745[stat.ML]。
[16]	Huang，K.和Lin，H.（2016）。一种用于成本敏感多类主动学习的新的不确定性采样算法。第16届国际数据挖掘会议（ICDM）论文集（第925-930页）。电气与电子工程师协会。
[17]	Hutter，F。；徐，L。；呼，HH；Leyton Brown，K.，算法运行时预测：方法与评估，人工智能，206，79-111（2014）·Zbl 1334.68185号 ·doi:10.1016/j.artint.2013.10.003
[18]	贾普科维奇，N。；Shah，M.，《评估学习算法：分类视角》（2011），剑桥大学出版社·Zbl 1230.68020号 ·doi:10.1017/CBO9780511921803
[19]	Konyushkova，K.、Sznitman，R.和Fua，P.（2018年）。发现通用主动学习策略。arXiv:1810.04114v2[cs.LG]。
[20]	Kottke，D.、Krempl，G.、Lang，D.、Teschner，J.和Spiliopoulou，M.（2016）。多类概率主动学习。《欧洲人工智能会议论文集》（第586-594页）。IOS出版社。
[21]	Kottke，D.、Herde，M.、Minh，T.P.、Benz，A.、Mergard，P.、Roghman，A.、Sandrock，C.和Sick，B.（2021年）。scikit-activeml：一个用于主动学习算法的库和工具箱。预印本，2021030194。
[22]	Krempl，G。；科特克，D。；Lemaire，V.，优化概率主动学习（OPAL），机器学习，100，2-3，449-476（2015）·Zbl 1341.68160号 ·doi:10.1007/s10994-015-5504-1
[23]	Lewis，D.D.和Gale，W.A.（1994年）。用于训练文本分类器的序列算法。第17届信息检索研究与开发国际年会（SIGIR）会议记录（第3-12页）。斯普林格。
[24]	Murphy，K.P.（2006）。二项式和多项式分布。技术报告，不列颠哥伦比亚大学。
[25]	Nguyen，H.T.和Smeulders，A.（2004）。使用预聚类进行主动学习。第21届机器学习国际会议（ICML）论文集（第79-86页）。ACM出版社。
[26]	Osugi，T.、Kim，D.和Scott，S.（2005）。平衡探索和开发：一种新的主动机器学习算法。第五届国际数据挖掘会议（ICDM）论文集（第330-337页）。电气与电子工程师协会。
[27]	Roy，N.和McCallum，A.（2001年）。通过蒙特卡罗误差减少估计实现最优主动学习。第18届国际机器学习会议（ICML）论文集（第441-448页）。
[28]	定居，B.（2009年）。主动学习文献调查。技术报告，威斯康星大学麦迪逊分校计算机科学系。
[29]	安定下来，B，积极学习。摩根和克莱普尔出版社（Morgan and Claypool Publishers）关于人工智能和机器学习的综合讲座（2012）排名第18·Zbl 1270.68006号
[30]	Seung，H.S.、Opper，M.和Sompolinsky，H.（1992年）。委员会质询。第五届计算学习理论年度研讨会论文集（COLT）（第287-294页）。ACM公司。
[31]	Shi，S.，Liu，Y.，Huang，Y.、Zhu，S..和Liu，Y.（2008）。基于打包特征的kNN主动学习。第四届自然计算国际会议论文集（第61-64页），中国济南。
[32]	Thrun，S.B.和Möller，K.（1992年）。在动态环境中积极探索。《神经信息处理系统进展》（第531-538页）。
[33]	Vanschoren，J。；van Rijn，JN；Bischl，B。；Torgo，L.，Openml：机器学习中的网络科学，SIGKDD Explorations，15，2，49-60（2013）·doi:10.145/2641190.2641198
[34]	Vapnik，VN，统计学习理论的本质（1995），Springer·Zbl 0833.62008号 ·数字对象标识代码：10.1007/978-1-4757-2440-0
[35]	Wei，K.、Iyer，R.和Bilmes，J.（2015）。数据子集选择和主动学习中的子模块。第32届机器学习国际会议（ICML）论文集（1954-1963页）。
[36]	Weigl，E。；Heidl，W。；Lughofer，E。；Radauer，T。；Eitzinger，C.，《通过在线主动学习和灵活分类器更新提高表面检测系统性能》，《机器视觉与应用》，27，1，103-127（2015）·doi:10.1007/s00138-015-0731-9
[37]	Xu，Z.、Akella，R.和Zhang，Y.（2007）。在主动学习中融入多样性和密度，以获得相关反馈。《欧洲信息检索会议论文集》（ECIR）（第246-257页）。斯普林格。
[38]	Zoller，T.和Buhmann，J.M.（2000年）。分层成对数据聚类的主动学习。第15届模式识别国际会议论文集（ICPR）（第186-189页）。电气与电子工程师协会。
[39]	《狮子座》，I。；Bifet，A。；普法林格，B。；Holmes，G.，《使用漂移流数据进行主动学习》，《神经网络和学习系统学报》，25，1，27-39（2014）·doi:10.1109/TNNLS.2012.2236570

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文件类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

使用贝叶斯方法实现最优概率主动学习。（英语）兹比尔1491.68161

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

使用贝叶斯方法实现最优概率主动学习。 （英语） 兹比尔1491.68161

MSC公司：

关键词：

软件：

参考文献：

使用贝叶斯方法实现最优概率主动学习。（英语）兹比尔1491.68161