×

评估最佳共享参数动态方案并应用于多阶段抑郁症临床试验。 (英语) Zbl 1390.62239号

总结:动态治疗方案由决策规则组成,这些决策规则根据可用治疗和协变量病史向患者推荐如何个性化治疗。在许多科学领域,这些决策规则是在干预的各个阶段共享的。作为一个示例,我们讨论了STAR*D,一项治疗抑郁症的多阶段随机临床试验。估计这些共享决策规则通常相当于估计参数,以索引跨阶段共享的决策规则。在本文中,我们提出了一种新的基于Q学习的共享参数同时估计方法。我们提供了一项广泛的模拟研究,以说明该方法相对于简单竞争对手的优点,即该程序与“预言”程序的治疗分配匹配,该程序定义为根据真实参数值而非其估计值提出治疗建议。我们还将个别参数估计的偏差和均方误差视为次要指标。最后,我们使用该方法分析了STAR*D数据。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62C12号机组 经验决策程序;经验贝叶斯程序
62J02型 一般非线性回归

软件:

q学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Antos,使用基于贝尔曼残差最小化的拟合策略迭代和单样本路径学习近似最优策略,机器学习71第89页–(2008)·Zbl 1470.68072号 ·doi:10.1007/s10994-007-5038-2
[2] 凯恩,什么时候开始治疗?《使用观测数据比较动态机制的系统方法》,《国际生物统计学杂志》6(2010)·doi:10.2202/1557-4679.1212
[3] Chakraborty,使用自适应m-out-of-n引导方案推断最佳动态治疗方案,生物计量学69第714页–(2013)·Zbl 1418.62182号 ·doi:10.1111/biom.12052
[4] Chakraborty,B.Moodie,E.2013动态治疗方案的统计方法:强化学习、因果推理和个性化医学·兹比尔1278.62169 ·doi:10.1007/978-1-4614-7428-9
[5] Ernst,基于树的批处理模式强化学习,《机器学习研究杂志》,第6页,503–(2005)·Zbl 1222.68193号
[6] Gordon,G.J.1999马尔可夫决策过程的近似解
[7] 拉古达基斯(Lagoudakis),最小平方政策迭代,《机器学习研究杂志》(Journal of Machine Learning Research)4第1107页–(2003)·Zbl 1094.68080号
[8] Lizotte,D.2011年神经信息处理系统第二十五届年会(NIPS)线性函数逼近收敛拟合值迭代
[9] 穆迪(Moodie),《估计最佳动态机制:在零条件下修正偏差》(Estimating optimal dynamic systems:Correcting bias under the null),《斯堪的纳维亚统计杂志》(Scandinavian Journal of Statistics)37第126页–(2010·Zbl 1224.62139号 ·文件编号:10.1111/j.1467-9469.2009.00661.x
[10] 墨菲,最佳动态治疗方案(含讨论),《皇家统计学会杂志》,B辑65 pp 331–(2003)·Zbl 1065.62006号 ·doi:10.1111/1467-9868.00389
[11] 墨菲,Q学习的泛化错误,《机器学习研究杂志》,第6页,1073–(2005)·Zbl 1222.68271号
[12] Nahum-Shani,《Q-learning:构建适应性干预的数据分析方法》,《心理学方法》17,第478页–(2012)·doi:10.1037/a0029373
[13] Robins,J.2004最优序列决策的最优结构嵌套模型第二届西雅图生物统计学研讨会论文集189 326
[14] Rosthoj,《从观测数据估算最佳动态抗凝方案:基于回归的方法》,《医学统计学》25页4197–(2006)·数字对象标识代码:10.1002/sim.2694
[15] Rush,缓解抑郁的顺序治疗替代方案(STAR*D):原理和设计,对照临床试验25,第119页–(2004)·doi:10.1016/S0197-2456(03)00112-0
[16] Rush,抑郁症状16项快速清单(QIDS)、临床医生评分(QIDS-C)和自我报告(QIDS-SR):慢性重度抑郁症患者的心理测量评估,《生物精神病学》54,第573页–(2003)·doi:10.1016/S0006-3223(02)01866-8
[17] Shortreed,《评估最佳动态抗精神病药物治疗方案:来自连续多次分配随机CATIE精神分裂症研究的证据》,《皇家统计学会杂志》,C系列61第577页–(2012)·文件编号:10.1111/j.1467-9876.2012.01041.x
[18] Sutton,R.Barto,A.1998强化学习:简介
[19] 肖,边缘结构cox模型权重截断方法的比较,流行病学方法2,第1页–(2013)·Zbl 1359.92010年9月 ·doi:10.1515/em-2012-0006
[20] 赵,估计最佳动态治疗方案的新统计学习方法,《美国统计协会杂志》110 pp 583–(2015)·兹比尔1373.62557 ·doi:10.1080/01621459.2014.937488
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。