×

积极学习成本敏感分类。 (英语) Zbl 1489.68227号

摘要:我们设计了一种主动学习算法用于成本敏感的多类分类:不同错误具有不同成本的问题。我们的算法COAL通过回归每个标签的成本并预测最小值来进行预测。在一个新的例子中,它使用一组对过去数据表现良好的回归变量来估计每个标签的可能成本。它只查询那些可能是最好的标签,而忽略了那些肯定会失败的标签。我们证明了COAL可以有效地用于任何允许平方损失优化的回归族;在预测性能和标记工作方面,它也得到了强有力的保证。我们将COAL与被动学习和几个主动学习基线进行了实证比较,结果表明在实际数据集的标记工作和测试成本方面有了显著改进。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 阿列克·阿加瓦尔(Alekh Agarwal)。成本敏感多类预测的选择性采样算法。在2013年国际机器学习会议上。
[2] Alekh Agarwal、Daniel Hsu、Satyen Kale、John Langford、Lihong Li和Robert E.Schapire。驯服怪物:一种快速而简单的上下文土匪算法。2014年国际机器学习会议。
[3] Sanjeev Arora、Elad Hazan和Satyen Kale。乘法权重更新方法:一种元算法及其应用。《计算理论》,2012年·Zbl 1283.68414号
[4] 玛丽亚·弗洛里娜·巴尔坎(Maria Florina Balcan)和菲利普·朗(Philip M.Long)。对数曲线分布下线性分隔符的主动和被动学习。2013年学习理论会议。
[5] Maria Florina Balcan、Alina Beygelzimer和John Langford。不可知的主动学习。在2006年国际机器学习会议上·Zbl 1162.68516号
[6] 玛丽亚·弗洛里娜·巴尔坎(Maria Florina Balcan)、安德烈·布罗德(Andrei Broder)和张彤(Tong Zhang)。基于边际的主动学习。在2007年学习理论会议上·Zbl 1203.68136号
[7] Alina Beygelzimer、Sanjoy Dasgupta和John Langford。重要性加权主动学习。2009年国际机器学习会议·Zbl 1162.68516号
[8] Alina Beygelzimer、Daniel Hsu、John Langford和Tong Zhang。无约束的不可知主动学习。神经信息处理系统进展,2010年。
[9] 亚历山德拉·卡彭蒂尔(Alexandra Carpentier)、安德烈亚·罗泰利(Andrea Locatelli)和萨默里·科波图夫(Samory Kpotufe)。非参数主动学习中对噪声参数的适应性。2017年学习理论会议·Zbl 1405.68296号
[10] R.M.Castro和R.D.Nowak。主动学习的最小极限。《信息理论学报》,2008年。
[11] 鲁伊·卡斯特罗(Rui Castro)、丽贝卡·威利特(Rebecca Willett)和罗伯特·诺瓦克(Robert D.Nowak)。通过主动学习加快回归速度。神经信息处理系统进展,2005年。
[12] 乔瓦尼·卡瓦兰蒂、尼科洛·塞萨·比安奇和克劳迪奥·金蒂莱。通过自适应和选择性采样学习噪声线性分类器。机器学习,2011年·Zbl 1237.68139号
[13] 张凯伟(Kai-Wei Chang)、阿克谢·克里希纳穆西(Akshay Krishnamurthy)、阿列克·阿加瓦尔(Alekh Agarwal)、哈尔·达姆三世(Hal Daumée III)和约翰·朗福德(John Langford)。学会比你的老师搜索得更好。2015年国际机器学习会议。
[14] Sanjoy Dasgupta、Daniel Hsu和Claire Monteleoni。一种通用的不可知主动学习算法。神经信息处理系统进展,2007年。
[15] 哈尔·达姆三世、约翰·朗福德和丹尼尔·马库。基于搜索的结构化预测。机器学习,2009年·Zbl 1470.68094号
[16] Ofer Dekel、Claudio Gentile和Karthik Sridharan。从单个和多个教师中进行稳健的选择性抽样。2010年学习理论会议·Zbl 1433.68336号
[17] 约翰·杜奇(John Duchi)、伊拉德·哈赞(Elad Hazan)和约拉姆·辛格(Yoram Singer)。在线学习和随机优化的自适应次梯度方法。2010年学习理论会议·Zbl 1280.68164号
[18] 迪兰·福斯特(Dylan Foster)、阿勒克·阿加瓦尔(Alekh Agarwal)、米罗斯拉夫·杜迪克(Miroslav Dudik)、罗海鹏(Haipeng Luo)和罗伯特·夏皮雷(Robert Schapire)。具有回归神谕的实用背景盗贼。2018年国际机器学习大会。
[19] 史蒂夫·汉内克(Steve Hanneke)。基于分歧的主动学习理论。机器学习的基础和趋势,2014年·Zbl 1327.68193号
[20] 史蒂夫·汉内克和刘洋。替代被动和主动学习中的损失。arXiv:1207.37722012年·Zbl 1433.62158号
[21] 史蒂夫·汉内克和刘洋。主动学习的Minimax分析。机器学习研究杂志,2015年·Zbl 1351.68210号
[22] 大卫·豪斯勒。具有有界Vapnik-Chervonenkis维数的布尔n-立方体子集的球面包装数。组合理论杂志,A辑,1995年·Zbl 0818.60005号
[23] 丹尼尔·徐(Daniel Hsu)。主动学习算法。加州大学圣地亚哥分校博士论文,2010年。
[24] 黄子国、阿加瓦尔、徐彦祖、兰福德和夏皮雷。高效和节俭的不可知论主动学习。神经信息处理系统进展,2015年。
[25] Nikos Karampatziakis和John Langford。在线重要性权重感知更新。《人工智能中的不确定性》,2011年。
[26] 阿克沙伊·克里希纳穆尔西(Akshay Krishnamurthy)、阿勒克·阿加瓦尔(Alekh Agarwal)、祖库·黄(Tzu-Kuo Huang)、哈尔·达姆(Hal Daumée)、三世(III)和约翰·朗福德(John Langford。积极学习成本敏感分类。2017年国际机器学习会议·Zbl 1489.68227号
[27] 约翰·朗福德(John Langford)和艾琳娜·贝格尔齐默(Alina Beygelzimer)。敏感的纠错输出代码。2005年学习理论会议·Zbl 1137.68551号
[28] David D.Lewis、Yiming Yang、Tony G.Rose和Fan Li。Rcv1:文本分类研究的新基准集合。机器学习研究杂志,2004年。可用数据网址:http://www.jmlr.org/papers/volume5/lewis04a/lyrl2004_rcv1v2_README。htm。
[29] 梁腾元(Tengyuan Liang)、亚历山大·拉赫林(Alexander Rakhlin)和卡提克·斯里德哈兰(Karthik Sridharan)。平方损失学习:通过偏移雷达的复杂性进行定位。2015年学习理论会议·Zbl 1357.68181号
[30] Enno Mammen和Alexandre B.Tsybakov。平滑判别分析。《统计年鉴》,1999年·Zbl 0961.62058号
[31] Pascal Massart和“Elodie N”ed电气。统计学习的风险边界。《统计年鉴》,2006年·Zbl 1108.62007号
[32] 斯坦尼斯拉夫·明斯克。插入式主动学习方法。机器学习研究杂志,2012年·Zbl 1283.68294号
[33] 弗朗西斯科·奥拉博纳和尼科洛·塞萨·比安奇。更好的选择性采样算法。在2011年国际机器学习会议上。
[34] Serge A.Plotkin、David B.Shmoys和Eva Tardos。分数包装和覆盖问题的快速近似算法。运筹学数学,1995年·Zbl 0837.90103号
[35] Alexander Rakhlin和Karthik Sridharan。鞅尾界与确定性后悔不等式的等价性。2017年学习理论会议记录,2017年·Zbl 1380.62176号
[36] Alexander Rakhlin、Karthik Sridharan、Alexandre B Tsybakov等。经验熵、极大极小后悔和极大极小风险。伯努利,2017·Zbl 1380.62176号
[37] Stephane Ross和J.Andrew Bagnell。通过交互式非重复学习进行强化和模仿学习。arXiv:1406.59792014。
[38] Stephane Ross、Paul Mineiro和John Langford。规范化在线学习。《人工智能中的不确定性》,2013年。
[39] 伯尔定居。积极学习。人工智能和机器学习综合讲座,2012年·Zbl 1270.68006号
[40] 史天莲(Tianlian Shi)、雅各布·斯坦哈特(Jacob Steinhardt)和梁佩西(Percy Liang)。学习如何在结构化预测中采样。《人工智能与统计》,2015年。
[41] 卡洛斯·西拉(Carlos N.Silla Jr.)和亚历克斯·弗雷塔斯(Alex A.Freitas)。跨不同应用程序域的层次分类调查。数据挖掘和知识发现,2011年·Zbl 1235.68190号
[42] 孙文(Wen Sun)、阿伦·文卡特曼(Arun Venkatraman)、杰弗里·戈登(Geoffrey J.Gordon)、拜伦·布茨(Byron Boots)和安德鲁·巴涅尔(J.Andrew Bagnell)。Deeply AggreVaTeD:用于序列预测的差异模拟学习。2017年国际机器学习会议。
[43] 瓦西里斯·西尔卡尼(Vasilis Syrgkanis)、阿克谢·克里希纳穆西(Akshay Krishnamurthy)和罗伯特·夏皮雷(Robert E.Schapire)。对抗性上下文学习的高效算法。2016年国际机器学习会议。
[44] Christian Szegedy、Wei Liu、Yangqing Jia、Pierre Sermanet、Scott E.Reed、Dragomir Angelov、Dumitru Erhan、Vincent Vanhoucke和Andrew Rabinovich。用卷积深入。InComputer Vision and Pattern Recognition,2015年。
[45] 亚历山大·谢巴科夫(Alexandre B.Tsybakov)。统计学习中分类器的最优聚合。《统计年鉴》,2004年·Zbl 1105.62353号
[46] 张赤诚(Chicheng Zhang)和卡马利卡·乔杜里(Kamalika Chaudhuri)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。