通过相关聚类减少二分实验中的方差

部分神经信息处理系统进展32(NeurIPS 2019)

作者反馈 Bibtex公司 MetaReview公司 元数据 纸类 评论 补充的

作者

Jean Pouget-Abadie、Kevin Aydin、Warren Schudy、Kay Brodersen、Vahab Mirrorkni

摘要

随机实验中的因果推断通常假设随机单位和分析单位是一个相同的单位。然而,在某些应用程序中,这两个角色由由二部图链接的不同实体来扮演。在这样的二方环境中,关键的挑战是如何避免干扰偏见,如果我们简单地在分析单位水平上随机化治疗,通常会出现干扰偏见。在标准实验中最小化干扰偏差的一种有效方法是通过聚类随机化,但这种设计尚未在传统聚类方案可能导致实验效果不佳的二元环境中进行研究。本文介绍了一种新的聚类目标和相应的算法,该算法对二分图进行划分,以最大限度地提高二分实验在该图上的统计能力。虽然以前的工作依赖于平衡划分,但我们的公式建议使用相关聚类目标。我们使用Amazon用户-项目评论的公开图表来验证我们的解决方案,并说明它如何在两部分实验中显著提高统计能力。