亚瑟·格雷顿;Karsten M.Borgwardt。;麦尔特·拉什。;伯恩哈德·舍尔科夫;亚历山大·斯莫拉 内核双样本测试。 (英语) Zbl 1283.62095号 J.马赫。学习。物件。 13, 723-773 (2012). 摘要:我们提出了一个分析和比较分布的框架,用于构建统计测试,以确定是否从不同的分布中提取了两个样本。我们的测试统计是再生核希尔伯特空间(RKHS)单位球中函数期望值的最大差异,称为最大平均差异(MMD)。我们提出了两种基于MMD大偏差界的无分布检验,以及一种基于此统计量的渐近分布的第三种检验。虽然可以使用有效的线性时间近似值,但MMD可以用二次时间计算。我们的统计是积分概率度量的一个实例,当使用替代函数类代替RKHS时,可以获得关于分布的各种经典度量。我们将我们的两个样本测试应用于各种问题,包括使用匈牙利婚姻方法的数据库属性匹配,在这些数据库中,它们表现得很好。在比较图上的分布时也获得了优异的性能,这是第一次进行此类测试。 引用于197文件 MSC公司: 62G10型 非参数假设检验 62G08号 非参数回归和分位数回归 60层10 大偏差 关键词:内核方法;双样本试验;一致收敛界;模式匹配;积分概率度量;假设检验 软件:UCI-毫升;KDD杯 PDF格式BibTeX公司 XML格式引用 \textit{A.Gretton}等人,J.Mach。学习。第13、723--773号决议(2012年;Zbl 1283.62095) 全文: 链接