Universal Causal Evaluation Engine: An API for empirically evaluating causal inference models

Alexander Lin; Amil Merchant; Suproteem K. Sarkar; Alexander D’Amour

通用因果评估引擎：用于实证评估因果推理模型的API

Alexander Lin、Amil Merchant、Suproteem K.Sarkar、Alexander D'Mour

机器学习研究进展，2019年下午104:50-58。

摘要

预测机器学习成功的一个主要驱动因素是“通用任务框架”，在该框架中，社区范围内的基准被共享，以评估新算法。然而，这种模式很难在因果学习任务中实现，因为这些任务中的基本事实通常是不可观察的。相反，因果推理方法通常在合成或半合成数据集上进行评估，这些数据集包含关于基础数据生成过程的特殊假设。这些评估通常与新的因果推理方法一起提出，因此，许多方法都是在不可比较的基准上进行评估的。为了解决这个问题，我们建立了一个通用因果推理模型评估的API，目的是开发一个平台，让研究人员在明确知道治疗方法的情况下部署和评估新的模型类。该API为其每个组件使用一个通用接口，并允许评估和保存新的方法和数据集，以供将来进行基准测试。

引用本文

BibTeX公司

@会议记录{pmlr-v104-lin19a，title={通用因果评估引擎：一个用于实证评估因果推理模型的API}，author={Lin，Alexander and Merchant，Amil and Sarkar，Suproteem K.and D'Amour，亚历山大}，booktitle={机器学习研究论文集}，页数={50--58}，年份={2019}，编辑器＝｛｝，体积={104}，series={机器学习研究论文集}，月={8月5日}，publisher={PMLR}，pdf={http://proceedings.mlr.press/v104/lin19a/lin19a.pdf},url={https://proceedings.mlr.press/v104/lin19a.html},abstract={预测机器学习成功的一个主要驱动因素是“通用任务框架”共享社区基准以评估新算法。然而，这种模式很难在因果学习任务中实现，因为这些任务中的基本事实通常是不可观察的。相反，因果推理方法通常在合成或半合成数据集上进行评估，这些数据集包含关于基础数据生成过程的特殊假设。这些评估通常与新的因果推理方法一起提出，因此，许多方法都是在不可比较的基准上进行评估的。为了解决这个问题，我们建立了一个通用因果推理模型评估的API，目的是开发一个平台，让研究人员在明确知道治疗方法的情况下部署和评估新的模型类。该API为其每个组件使用一个通用接口，并允许评估和保存新的方法和数据集，以备将来进行基准测试。}}

尾注

%0会议论文%通用因果评估引擎：一个用于实证评估因果推理模型的API%亚历山大·林%阿米尔商人%最高法院法官K.Sarkar%亚历山大·达穆尔%机器学习研究论文集%C机器学习研究进展%D 2019年%E类%F pmlr-v104-lin19a型%我PMLR%第50-58页%U型https://proceedings.mlr.press/v104/lin19a.html%104伏%X预测机器学习成功的一个主要驱动因素是“通用任务框架”，在该框架中，社区范围内的基准被共享，以评估新算法。然而，这种模式很难在因果学习任务中实现，因为这些任务中的基本事实通常是不可观察的。相反，因果推理方法通常在合成或半合成数据集上进行评估，这些数据集包含了关于底层数据生成过程的特殊假设。这些评估通常与新的因果推理方法一起提出，因此，许多方法都是在不可比较的基准上进行评估的。为了解决这个问题，我们建立了一个通用因果推理模型评估的API，目的是开发一个平台，让研究人员在明确知道治疗方法的情况下部署和评估新的模型类。该API为其每个组件使用一个通用接口，并允许评估和保存新的方法和数据集，以供将来进行基准测试。

亚太地区

Lin，A.，Merchant，A.，Sarkar，S.K.&D'Amour，A.（2019年）。通用因果评估引擎：用于实证评估因果推理模型的API。机器学习研究进展，英寸机器学习研究进展104:50-58网址：https://proceedings.mlr.press/v104/lin19a.html。

通用因果评估引擎：用于实证评估因果推理模型的API

摘要

引用本文

相关材料