张巴群;Tsiatis,阿纳斯塔西奥斯A。;埃里克·B·拉伯(Eric B.Laber)。;玛丽·戴维安 序列治疗决策的最佳动态治疗方案的稳健估计。 (英语) 兹比尔1284.62508 生物特征 100,第3期,681-694(2013). 总结:动态治疗方案是根据患者病史分配治疗的顺序决策规则列表。Q学习和A学习是评估最佳方案的两种主要方法,即使用临床试验或观察性研究的数据,在患者群体中产生最有益的结果。Q-learning需要对结果建立假设的回归模型,而A-learning需要对结果回归的这一部分建立模型,以表示治疗对比和治疗分配。我们提出了一种Q-和A-学习的替代方法,该方法最大化了一个双重鲁棒的增强逆概率加权估计,用于在一类受限的状态下计算总体平均结果。仿真结果表明了该方法的性能和对模型错误指定的鲁棒性,这是一个关键问题。 引用于48文件 MSC公司: 62升10 顺序统计分析 62C99个 统计决策理论 第62页第10页 统计学在生物学和医学中的应用;元分析 68T05型 人工智能中的学习和自适应系统 62G35型 非参数稳健性 65立方厘米60 统计中的计算问题(MSC2010) 关键词:A级学习;双重稳健性;结果回归;倾向得分;增强学习 软件:q学习 PDF格式BibTeX公司 XML格式引用 \textit{B.Zhang}等人,Biometrika 100,No.3,681--694(2013;Zbl 1284.62508) 全文: 内政部 链接