×

内核双样本测试。 (英语) Zbl 1283.62095号

摘要:我们提出了一个分析和比较分布的框架,用于构建统计测试,以确定是否从不同的分布中提取了两个样本。我们的测试统计是再生核希尔伯特空间(RKHS)单位球中函数期望值的最大差异,称为最大平均差异(MMD)。我们提出了两种基于MMD大偏差界的无分布检验,以及一种基于此统计量的渐近分布的第三种检验。虽然可以使用有效的线性时间近似值,但MMD可以用二次时间计算。我们的统计是积分概率度量的一个实例,当使用替代函数类代替RKHS时,可以获得关于分布的各种经典度量。我们将我们的两个样本测试应用于各种问题,包括使用匈牙利婚姻方法的数据库属性匹配,在这些数据库中,它们表现得很好。在比较图上的分布时也获得了优异的性能,这是第一次进行此类测试。

MSC公司:

62G10型 非参数假设检验
62G08号 非参数回归和分位数回归
60层10 大偏差

软件:

UCI-毫升;KDD杯
PDF格式BibTeX公司 XML格式引用
全文: 链接