主页

论文

提交文件

新闻

编辑委员会

特殊问题

开源软件

程序(PMLR)

数据(DMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

内核双样本测试

阿瑟·格雷顿(Arthur Gretton)、卡斯滕·博格沃德(Karsten M.Borgwardt)、马尔特·拉什(Malte J.Rasch)、伯恩哈德·舍尔科夫(Bernhard Schölkopf)、亚历山大·斯莫拉; 13(25):723−773, 2012.

摘要

我们提出了一个分析和比较分布的框架,用于构建统计测试,以确定是否从不同的分布中提取了两个样本。我们的测试统计是再生核希尔伯特空间(RKHS)单位球中函数期望值的最大差异,称为最大平均偏差(毫米)。我们提出了两种基于MMD大偏差界的无分布检验,以及一种基于此统计量的渐近分布的第三种检验。虽然可以使用有效的线性时间近似值,但MMD可以用二次时间计算。我们的统计是积分概率度量的一个实例,当使用替代函数类代替RKHS时,可以获得关于分布的各种经典度量。我们将我们的两个样本测试应用于各种问题,包括使用匈牙利婚姻方法的数据库属性匹配,在这些数据库中,它们表现得很好。在比较图上的分布时也获得了优异的性能,这是第一次进行此类测试。

[腹肌][pdf格式][围兜]      
©JMLR公司2012(编辑,贝塔)

乳臭虫