Equitability, Interval Estimation, and Statistical Power

Yakir A. Reshef; David N. Reshef; Pardis C. Sabeti; Michael Mitzenmacher

doi:10.1214/19-STS719

2020年5月公平性、区间估计和统计能力

雅基尔·A·雷舍夫,大卫·N·雷舍夫,帕迪斯·萨贝蒂,迈克尔·米赞马赫

统计师。科学。 35(2): 202-217 （2020年5月）。内政部：10.1214/19-STS719

摘要

新兴的高维数据集通常包含许多非平凡的关系，并且，在现代样本规模下，使用独立性测试筛选这些关系有时可能会产生太多的关系，无法成为有用的探索性方法。我们提出了一个框架来解决这一局限性，该框架以依赖性度量的属性为中心，称为公平性。考虑到关系强度的一些衡量标准，公平的依赖性衡量标准是将相似的分数分配给不同类型的同等牢固的关系。我们根据关系强度的区间估计形式化了半参数推理框架中的公平性，然后，我们使用这些区间估计与假设检验的对应关系来证明，在适度假设下，公平性等同于要求依赖性度量不仅能产生有效的检验，以区分非平凡关系和平凡关系，而且能区分更强的关系和较弱的。然后，我们表明，公平性在一定程度上意味着统计数据能够很好地检测出家庭中不同关系类型中具有某种最小强度的所有关系。因此，公平性是一种对抗独立性的力量的增强，它允许探索具有少量强而有趣关系和大量弱而不太有趣关系的数据集。

引用

下载引文

亚基尔·雷谢夫（Yakir A.Reshef）。大卫·N·雷舍夫（David N.Reshef）。帕迪斯·萨贝蒂。迈克尔·米赞马赫（Michael Mitzenmacher）。 “公平性、区间估计和统计能力。” 统计师。科学。 35 (2) 202 - 217, 2020年5月。 https://doi.org/10.1214/19-STS719