评估临床研究中生存分析的领域泛化
弗洛里安·普菲斯特勒、克里斯·哈布伦、冈瑟·詹森、陶旭
健康、推理和学习会议记录,PMLR 174:32-472022年。
摘要
机器学习模型通常被要求推广到训练过程中看不见的新群体(领域),这可能导致模型表现不佳。到目前为止,大多数研究都集中在图像分类任务的域泛化方法上,该方法通过学习域不变量预测器来解决这个问题。在本研究中,我们评估了领域泛化方法在生存分析中的功效。其目标是根据接受医疗的个人的基线人口统计学和临床变量预测时间-事件,如死亡或疾病进展。我们对临床实践中遇到的真实场景中的四种领域泛化方法和几种传统/既定方法进行了基准测试。这包括将随机对照试验推广到现实世界数据、识别预后模型(无论治疗或疾病亚型如何)等任务。我们发现,泛化问题通常没有合成场景中报告的那么严重。此外,我们的结果证实了先前的研究结果,即在低维数据上,领域泛化通常并不总是优于经典的经验风险最小化基线。最后,为了更好地理解领域泛化方法何时可以带来性能提升,从而为患者带来更好的结果,我们量化了数据中发生的不同类型变化的影响。
引用本文
相关材料