文件Zbl 1284.62508-zbMATH打开

张巴群；Tsiatis，阿纳斯塔西奥斯A。；埃里克·B·拉伯（Eric B.Laber）。；玛丽·戴维安

序列治疗决策的最佳动态治疗方案的稳健估计。（英语）兹比尔1284.62508

生物特征 100，第3期，681-694（2013）.

总结：动态治疗方案是根据患者病史分配治疗的顺序决策规则列表。Q学习和A学习是评估最佳方案的两种主要方法，即使用临床试验或观察性研究的数据，在患者群体中产生最有益的结果。Q-learning需要对结果建立假设的回归模型，而A-learning需要对结果回归的这一部分建立模型，以表示治疗对比和治疗分配。我们提出了一种Q-和A-学习的替代方法，该方法最大化了一个双重鲁棒的增强逆概率加权估计，用于在一类受限的状态下计算总体平均结果。仿真结果表明了该方法的性能和对模型错误指定的鲁棒性，这是一个关键问题。

引用于48文件

MSC公司：

62升10	顺序统计分析
62C99个	统计决策理论
第62页第10页	统计学在生物学和医学中的应用；元分析
68T05型	人工智能中的学习和自适应系统
62G35型	非参数稳健性
65立方厘米60	统计中的计算问题（MSC2010）

关键词：

A级学习；双重稳健性；结果回归；倾向得分；增强学习

软件：

q学习

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

序列治疗决策的最佳动态治疗方案的稳健估计。（英语）兹比尔1284.62508

MSC公司：

关键词：

软件：

示例

领域

操作员

序列治疗决策的最佳动态治疗方案的稳健估计。 （英语） 兹比尔1284.62508

MSC公司：

关键词：

软件：

序列治疗决策的最佳动态治疗方案的稳健估计。（英语）兹比尔1284.62508