文件Zbl 1415.62054-zbMATH Open

动态治疗方案的惩罚Q学习。（英语） Zbl 1415.62054号

统计正弦。 25，第3期，901-920（2015）.

总结：动态治疗方案结合了从专门设计的临床试验中获得的累积信息和治疗的长期效果。随着这些试验与临床研究的纵向数据一起越来越受欢迎，开发最佳动态治疗方案的统计推断是一个高度优先事项。本文提出了一种新的机器学习框架，称为惩罚Q-学习，在此框架下建立了有效的统计推断。我们还提出了一种新的统计方法：个体选择和相应的方法，用于将个体选择纳入惩罚Q学习。通过大量的数值研究，将所提出的方法与现有方法在各种场景下进行了比较，并证明了所提出方法在推理和计算上都是优越的。这是通过抑郁症临床试验研究来说明的。

引用于1审查

引用于27文件

MSC公司：

62J07型	岭回归；收缩估计器（拉索）
2012年12月62日	参数估计量的渐近性质
62页第10页	统计学在生物学和医学中的应用；元分析

关键词：

动态治疗方案；个人选择；多阶段；缺陷Q学习；增强学习；收缩；两阶段程序

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司链接

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

动态治疗方案的惩罚Q学习。（英语） Zbl 1415.62054号

MSC公司：

关键词：

示例

领域

操作员

动态治疗方案的惩罚Q学习。 （英语） Zbl 1415.62054号

MSC公司：

关键词：

动态治疗方案的惩罚Q学习。（英语） Zbl 1415.62054号