Easy Learning from Label Proportions

Busa-Fekete, Robert Istvan; Choi, Heejin; Dick, Travis; Gentile, Claudio; medina, Andres Munoz

计算机科学>机器学习

arXiv公司：2302.03115（cs）

【于2023年2月6日提交(第1版)，上次修订日期：2023年2月13日（本版本，v2）]

标题：从标签比例中轻松学习

作者：罗伯特·伊斯特万·布萨·费科特（Robert Istvan Busa-Fekete）,Heejin Choi先生,特拉维斯·迪克,克劳迪奥·詹蒂莱,安德烈斯·穆尼奥斯·梅迪纳

查看PDF

摘要：我们考虑从标签比例（LLP）中学习的问题，LLP是一种弱监督的分类设置，其中实例被分组为“包”，并且只有每个包中类标签的频率可用。尽管如此，学习者的目标是在个体层面上实现低任务损失。在这里，我们提出了Easylp：一种基于聚合标签的灵活且易于实现的去噪方法，它可以操作任意的损失函数。我们的技术允许我们在单个级别准确估计任意模型的预期损失。我们通过将其应用于流行的学习框架，如经验风险最小化（ERM）和随机梯度下降（SGD），展示了我们方法的灵活性，并对实例级性能提供了可证明的保证。更具体地说，与全面监督相比，我们展示了一种方差减少技术，该技术使得ERM和SGD设置中的LLP学习质量仅下降了一个因子k（k是包大小）。最后，我们在多个数据集上验证了我们的理论结果，证明了我们的算法尽管简单，但性能与以前的LLP方法一样好或更好。

学科：	机器学习（cs.LG）; 机器学习（stat.ML）
引用为：	arXiv:2302.03115【cs.LG】
	（或 arXiv:2302.03115v2【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2302.03115

提交历史记录

发件人：Claudio Gentile[查看电子邮件]
[第1版]2023年2月6日星期一20:41:38 UTC（413 KB）
[版本2]2023年2月13日星期一23:28:05 UTC（416 KB）

计算机科学>机器学习

标题：从标签比例中轻松学习

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

标题：从标签比例中轻松学习

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目