×

半监督新颖性检测。 (英语) Zbl 1242.68205号

摘要:新颖性检测的常见设置假设标称类别中的标记示例可用,但新颖性的标记示例不可用。标准(归纳)方法是在标称密度较低的情况下宣布新颖性,这将问题简化为密度水平集估计。在本文中,我们考虑在学习时也可以使用未标记和可能受污染的样本的设置。我们认为,这种半监督环境中的新颖性检测可以通过一般化为二进制分类问题来自然解决。特别是,可以通过降低Neyman-Pearson分类来实现具有所需假阳性率的检测器。与归纳法不同,无论新颖性的分布如何,半监督新颖性检测(SSND)产生的检测器都是最佳的(例如,统计一致)。因此,在新颖性检测中,未标记数据对决策规则的理论属性有很大影响。我们通过广泛的实验研究验证了SSND的实用性。我们还表明,SSND为假设检验中的两个众所周知的问题提供了无分布的学习理论解决方案。首先,我们的结果提供了一般双样本问题的一般解,即确定两个随机样本是否来自同一分布的问题。第二,SSND的专门化与所谓随机效应模型下多重测试的标准(p)值方法一致。与基于阈值的标准拒绝区域不同,通用SSND框架允许适应多维中的任意替代分布。

MSC公司:

68T05年 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 链接