通用因果评估引擎:用于实证评估因果推理模型的API

Alexander Lin、Amil Merchant、Suproteem K.Sarkar、Alexander D'Mour
机器学习研究进展,2019年下午104:50-58。

摘要

预测机器学习成功的一个主要驱动因素是“通用任务框架”,在该框架中,社区范围内的基准被共享,以评估新算法。然而,这种模式很难在因果学习任务中实现,因为这些任务中的基本事实通常是不可观察的。相反,因果推理方法通常在合成或半合成数据集上进行评估,这些数据集包含关于基础数据生成过程的特殊假设。这些评估通常与新的因果推理方法一起提出,因此,许多方法都是在不可比较的基准上进行评估的。为了解决这个问题,我们建立了一个通用因果推理模型评估的API,目的是开发一个平台,让研究人员在明确知道治疗方法的情况下部署和评估新的模型类。该API为其每个组件使用一个通用接口,并允许评估和保存新的方法和数据集,以供将来进行基准测试。

引用本文


BibTeX公司
@会议记录{pmlr-v104-lin19a,title={通用因果评估引擎:一个用于实证评估因果推理模型的API},author={Lin,Alexander and Merchant,Amil and Sarkar,Suproteem K.and D'Amour,亚历山大},booktitle={机器学习研究论文集},页数={50--58},年份={2019},编辑器={},体积={104},series={机器学习研究论文集},月={8月5日},publisher={PMLR},pdf={http://proceedings.mlr.press/v104/lin19a/lin19a.pdf},url={https://proceedings.mlr.press/v104/lin19a.html},abstract={预测机器学习成功的一个主要驱动因素是“通用任务框架”共享社区基准以评估新算法。然而,这种模式很难在因果学习任务中实现,因为这些任务中的基本事实通常是不可观察的。相反,因果推理方法通常在合成或半合成数据集上进行评估,这些数据集包含关于基础数据生成过程的特殊假设。这些评估通常与新的因果推理方法一起提出,因此,许多方法都是在不可比较的基准上进行评估的。为了解决这个问题,我们建立了一个通用因果推理模型评估的API,目的是开发一个平台,让研究人员在明确知道治疗方法的情况下部署和评估新的模型类。该API为其每个组件使用一个通用接口,并允许评估和保存新的方法和数据集,以备将来进行基准测试。}}
尾注
%0会议论文%通用因果评估引擎:一个用于实证评估因果推理模型的API%亚历山大·林%阿米尔商人%最高法院法官K.Sarkar%亚历山大·达穆尔%机器学习研究论文集%C机器学习研究进展%D 2019年%E类%F pmlr-v104-lin19a型%我PMLR%第50-58页%U型https://proceedings.mlr.press/v104/lin19a.html%104伏%X预测机器学习成功的一个主要驱动因素是“通用任务框架”,在该框架中,社区范围内的基准被共享,以评估新算法。然而,这种模式很难在因果学习任务中实现,因为这些任务中的基本事实通常是不可观察的。相反,因果推理方法通常在合成或半合成数据集上进行评估,这些数据集包含了关于底层数据生成过程的特殊假设。这些评估通常与新的因果推理方法一起提出,因此,许多方法都是在不可比较的基准上进行评估的。为了解决这个问题,我们建立了一个通用因果推理模型评估的API,目的是开发一个平台,让研究人员在明确知道治疗方法的情况下部署和评估新的模型类。该API为其每个组件使用一个通用接口,并允许评估和保存新的方法和数据集,以供将来进行基准测试。
亚太地区
Lin,A.,Merchant,A.,Sarkar,S.K.&D'Amour,A.(2019年)。通用因果评估引擎:用于实证评估因果推理模型的API。机器学习研究进展,英寸机器学习研究进展104:50-58网址:https://proceedings.mlr.press/v104/lin19a.html。

相关材料