的一部分神经信息处理系统进展27(NIPS 2014)
刘安琪、布莱恩·齐巴特
在许多重要的机器学习应用中,用于估计概率分类器的源分布与分类器用于预测的目标分布不同。由于其渐近性质,样本重加权损失最小化是处理这种差异的常用技术。然而,给定有限数量的标记源数据,该技术在具有较大样本选择偏差的设置中存在显著的估计误差。我们开发了一个框架,用于使用极小极大估计公式鲁棒学习概率分类器,以适应不同的样本选择偏差。我们的方法只需要对源分布下的统计数据进行准确估计,否则对条件标签分布的未知属性尽可能稳健,除非包含明确的泛化假设。我们证明了我们的方法在合成和UCI二进制分类任务上的行为和有效性。
在电子程序中更改姓名的请求将被接受,不会提出任何问题。然而,名称更改可能会导致书目跟踪问题。作者被要求仔细考虑这一点,并在要求在电子诉讼中更改姓名之前与合著者进行讨论。
使用“报告问题”链接请求更改名称。