带偏正和无标记示例的类先验估计

作者

  • 山塔努耆那教 东北大学
  • 贾斯汀·德拉诺 东北大学
  • 希曼舒·夏尔马 东北大学
  • Predrag Radivojac公司 东北大学

DOI(操作界面):

https://doi.org/10.1609/aaai.v34i04.5848

摘要

正-无标记学习通常是在假设标记的阳性样本是从阳性样本的真实分布中随机抽取的情况下进行研究的。然而,在许多应用领域中,支持正类条件分布的某些区域表现过度,而其他区域在正样本中表现不足。尽管这在正标记学习的各个方面都引入了问题,但我们开始通过关注类先验估计、后验概率估计的核心量以及真实分类性能的恢复来解决这一挑战。我们首先做出一组假设来对采样偏差进行建模。然后,我们将类先验的可识别性理论从无偏环境扩展到有偏环境。最后,我们推导了一种估计类先验的算法,该算法依靠聚类将原始问题分解为无偏正标记学习的子问题。我们的实证研究表明,修正策略是可行的,整体表现良好。

下载

出版

2020-04-03

如何引用

Jain,S.、Delano,J.、Sharma,H.和Radivojac,P.(2020年)。带有有偏正和无标记示例的类先验估计。AAAI人工智能会议记录,34(04), 4255-4263. https://doi.org/10.1609/aaai.v34i04.5848

问题

章节

AAAI技术方向:机器学习