开放式访问
2020年5月 公平性、区间估计和统计能力
雅基尔·A·雷舍夫,大卫·N·雷舍夫,帕迪斯·萨贝蒂,迈克尔·米赞马赫
统计师。科学。 35(2): 202-217 (2020年5月)。 内政部:10.1214/19-STS719

摘要

新兴的高维数据集通常包含许多非平凡的关系,并且,在现代样本规模下,使用独立性测试筛选这些关系有时可能会产生太多的关系,无法成为有用的探索性方法。我们提出了一个框架来解决这一局限性,该框架以依赖性度量的属性为中心,称为公平性。考虑到关系强度的一些衡量标准,公平的依赖性衡量标准是将相似的分数分配给不同类型的同等牢固的关系。我们根据关系强度的区间估计形式化了半参数推理框架中的公平性,然后,我们使用这些区间估计与假设检验的对应关系来证明,在适度假设下,公平性等同于要求依赖性度量不仅能产生有效的检验,以区分非平凡关系和平凡关系,而且能区分更强的关系和较弱的。然后,我们表明,公平性在一定程度上意味着统计数据能够很好地检测出家庭中不同关系类型中具有某种最小强度的所有关系。因此,公平性是一种对抗独立性的力量的增强,它允许探索具有少量强而有趣关系和大量弱而不太有趣关系的数据集。

引用

下载引文

亚基尔·雷谢夫(Yakir A.Reshef)。 大卫·N·雷舍夫(David N.Reshef)。 帕迪斯·萨贝蒂。 迈克尔·米赞马赫(Michael Mitzenmacher)。 “公平性、区间估计和统计能力。” 统计师。科学。 35 (2) 202 - 217, 2020年5月。 https://doi.org/10.1214/19-STS719

问询处

发布日期:2020年5月
欧几里德项目首次提供:2020年6月3日

数学科学网:MR4106601型
数字对象标识符:10.1214/19-STS719

关键词:公平性,独立性测试,依赖性度量,半参数推断,统计能力

版权所有©2020数学统计研究所

第35卷•第2期•2020年5月
返回页首