×

动态治疗方案的惩罚Q学习。 (英语) Zbl 1415.62054号

总结:动态治疗方案结合了从专门设计的临床试验中获得的累积信息和治疗的长期效果。随着这些试验与临床研究的纵向数据一起越来越受欢迎,开发最佳动态治疗方案的统计推断是一个高度优先事项。本文提出了一种新的机器学习框架,称为惩罚Q-学习,在此框架下建立了有效的统计推断。我们还提出了一种新的统计方法:个体选择和相应的方法,用于将个体选择纳入惩罚Q学习。通过大量的数值研究,将所提出的方法与现有方法在各种场景下进行了比较,并证明了所提出方法在推理和计算上都是优越的。这是通过抑郁症临床试验研究来说明的。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
2012年12月62日 参数估计量的渐近性质
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用