信任或不信任分类器

的一部分神经信息处理系统进展31(NeurIPS 2018)

Bibtex公司 元数据 纸类 评论 补充的

作者

Heinrich Jiang、Been Kim、Melody Guan、Maya Gupta

摘要

了解分类器的预测何时可信在许多应用中都很有用,对安全使用人工智能至关重要。虽然机器学习研究的大部分工作都是为了提高分类器的性能,但了解分类器的预测何时应该可信和不应该可信受到的关注要少得多。标准方法是使用分类器的判别分数或置信度;然而,我们表明存在一种在许多情况下更有效的替代方案。我们提出了一个新的分数,称为{信任分数},它衡量了分类器和修改后的最近邻分类器在测试示例上的一致性。我们的经验表明,高(低)信任分数在识别正确(错误)分类示例时产生了令人惊讶的高精度,始终优于分类器的置信分数以及许多其他基线。此外,在一些温和的分布假设下,我们表明,如果示例的信任分数高(低),分类器可能会同意(不同意)贝叶斯最优分类器。我们的保证包括在各种非参数设置下统计一致性的非渐近速率,并基于拓扑数据分析的最新发展。