个性化参数分布EHR数据的动态生存分析
普雷斯顿·普泽尔、现代道、亚历克斯·博伊德、华中、帕德拉克·斯迈思
第六届医疗保健机器学习会议记录,PMLR 149:648-6732021年。
摘要
高维电子医疗记录(EHR)数据集的广泛可用性使得人们对使用此类数据来获得临床见解和进行风险预测产生了浓厚兴趣。更具体地说,机器学习技术正越来越多地应用于动态生存分析问题,在动态生存分析中,根据EHR数据集的全协变量轨迹来学习更新的事件风险预测时间。EHR数据在动态生存分析中提出了独特的挑战,涉及到关于数据表示、建模、可解释性和临床意义评估的各种决策。在本文中,我们提出了一种新的动态生存分析方法,解决了其中的一些挑战。我们的建模方法是基于学习全局参数分布来表示种群特征,然后根据个体的历史在该分布的时间轴上动态定位个体。为了进行评估,我们还提出了一种新版本的动态C指数,用于动态生存模型的临床意义评估。为了验证我们的方法,我们对三个真实数据集进行了动态风险预测,包括新冠肺炎严重结局、心血管疾病(CVD)发病和原发性胆汁性肝硬化(PBC)移植时间。我们发现,在动态风险预测方面,我们提出的建模方法与其他众所周知的统计和机器学习方法具有竞争力,同时在个人层面的预测交互性方面提供了潜在的优势。
引用本文
相关材料