Chakraborty,比巴斯;埃里克·B·拉伯(Eric B.Laber)。;赵英奇 使用自适应自举方案推断最佳动态治疗方案。 (英语) Zbl 1418.62182号 生物计量学 69,第3期,714-723(2013). 总结:动态治疗方案由一组决策规则组成,这些规则规定了如何根据可用治疗和协变量历史对患者进行个性化治疗。从数据中估计最佳动态治疗方案的一种常见方法是(Q)-学习,它涉及数据的非光滑操作。这种非光滑性会导致标准的渐进推理方法(如bootstrap或Taylor级数参数)在没有修正的情况下失效。这里,我们考虑用(m)-out-of-(n)bootstrap构造参数的置信区间,以索引最优动态状态。我们提出了(m)的一种自适应选择,并证明了它在固定方案下产生了渐近正确的置信集。此外,与具有相同理论性质的竞争方法相比,该方法具有概念和计算简单的优点。我们提供了一个广泛的仿真研究,以将所提出的方法与当前可用的推理程序进行比较。结果表明,所提出的方法提供了名义覆盖率,但比其他方法保守度更低。建议的方法在q学习R-并已在综合对-存档网络(http://cran.r-project.org/). 作为一个说明性的例子,分析了缓解抑郁症的顺序治疗方案(STAR)研究。 引用于25文件 MSC公司: 62G09号 非参数统计重采样方法 62G05型 非参数估计 62E20型 统计学中的渐近分布理论 62G15年 非参数容差和置信区域 65立方厘米60 统计中的计算问题(MSC2010) 关键词:动态处理制度;\(m\)-out-of-\(n\)引导;不规则性;\(Q\)-学习 软件:对;CRAN(起重机);q学习;引导库;引导数据库 PDF格式BibTeX公司 XML格式引用 \textit{B.Chakraborty}等人,《生物统计学》69,第3期,第714--723页(2013年;Zbl 1418.62182) 全文: 内政部 参考文献: [1] Bellman,R.1957动态编程·Zbl 0077.13605号 [2] Bickel,bootstrap的一些渐近理论,《统计年鉴》第9卷第1196页–(1981)·兹比尔0449.62034 ·doi:10.1214/aos/1176345637 [3] Bickel,《重新抽样少于n个观察值:收益、损失和损失补救措施》,《中国统计》第7卷第1页–(1997年)·Zbl 0927.62043号 [4] Bickel,《关于m in the m of n bootstrap和极值置信限中m的选择》,《统计》,第18页,967–(2008)·Zbl 05361940号 [5] Bretagnolle,J.1983 Lois limites du bootstrap de certaines functionnelles布列塔尼诺尔,J.,1983年,《确定功能的限制》281 296·Zbl 0535.62046号 [6] Chakraborty,最佳动态治疗方案中非常规参数的推断,《医学研究统计方法》19,第317页–(2010年)·Zbl 1365.62411号 ·doi:10.1177/0962280209105013 [7] 张,在非规则光滑函数模型中迭代n中取m的自举,《统计》,15页,945–(2005)·兹比尔1086.62058 [8] A.C.戴维森。D.V.欣克利。1997 Bootstrap方法及其应用·Zbl 0886.62001号 [9] Dawson,《评估新的心理健康治疗的无安慰剂设计:适应性治疗策略的使用》,《医学统计》第3249页–(2004)·doi:10.1002/sim.1920 [10] Dümbgen,关于不可微函数和bootstrap,概率论及相关领域,pp 125–(1993)·Zbl 0811.62050号 ·doi:10.1007/BF01197342 [11] 埃夫隆(Efron),《Bootstrap methods:Annual at the jackknife》,《统计学年鉴》(Annals of Statistics)第7页第1页–(1979)·Zbl 0406.62024号 ·doi:10.1214/aos/1176344552 [12] Efron,B.Tibshirani,R.1993《Bootstrap简介》 [13] Fava,缓解抑郁症的顺序治疗替代方案的背景和基本原理(星号*d)研究,北美精神病临床26第457页–(2003)·doi:10.1016/S0193-953X(02)00107-7 [14] Friedman,《关于装袋和非线性估计》,《统计规划与推断杂志》137 pp 669–(2007)·Zbl 1104.62047号 ·doi:10.1016/j.jspi.2006.06.002 [15] Hall,《关于使用相关数据引导的阻塞规则》,Biometrika 82 pp 561–(1995)·Zbl 0830.62082号 ·doi:10.1093/biomet/82.3561 [16] Hirano,K.Porter,J.2012计量经济学 [17] 黄,密度有跳跃时样本分位数的自举,《中国统计》第6卷第299页–(1996)·Zbl 0839.62052号 [18] Laber,分类测试误差的自适应置信区间,《美国统计协会杂志》106页,第904页–(2011年)·Zbl 1229.62085号 ·doi:10.1198/jasa.2010.tm10053 [19] Laber,E.Qian,M.Lizotte,D.Murphy,S.2012年 [20] Lavori,《临床策略测试设计:受试者内有偏自适应随机化》,《皇家统计学会杂志》,A辑163,第29页–(2000)·兹比尔04558314 ·doi:10.1111/1467-985X.00154 [21] Lavori,动态治疗方案:实际设计考虑,临床试验1,第9页–(2004)·doi:10.1191/1740774S04cn002oa [22] Lee,关于m of n bootstrap置信区间的类,《皇家统计学会杂志》,B系列61页,第901页–(1999)·Zbl 0940.62041号 ·doi:10.1111/1467-9868.00209 [23] 穆迪(Moodie),《估计最佳动态机制:在零条件下修正偏差》(Estimating optimal dynamic systems:correcting bias under the null),《斯堪的纳维亚统计杂志》(Scandinavian Journal of Statistics)37第126页–(2010)·Zbl 1224.62139号 ·文件编号:10.1111/j.1467-9469.2009.00661.x [24] 墨菲,最佳动态治疗方案(含讨论),《皇家统计学会杂志》,B辑65 pp 331–(2003)·Zbl 1065.62006号 ·doi:10.111/1467-9868.00389 [25] 墨菲,适应性治疗策略开发的实验设计,《医学统计学》24页1455–(2005a)·doi:10.1002/sim.2022 [26] 墨菲,q学习的泛化错误,《机器学习研究杂志》,第6页,1073–(2005b)·Zbl 1222.68271号 [27] Pineau,使用计算机科学的方法构建循证治疗策略,药物和酒精依赖88 pp S52–(2007)·doi:10.1016/j.drugaldep.2007.01.05 [28] Politis,D.Romano,J.Wolf,M.1999次采样·Zbl 0931.62035号 [29] Pötscher,B.2007 Arxiv预印本Arxiv:071.1036 [30] Pötscher,B.M。施耐德,U.2008 [31] 罗宾斯J.M.2004 [32] Rush,《抑郁症状(QIDS)、临床医生评分(QIDS-C)和自我报告(QIDS-SR)的16项快速清单:慢性重度抑郁症患者的心理测量评估》,《生物精神病学》第54页573–(2003)·doi:10.1016/S0006-3223(02)01866-8 [33] Rush,缓解抑郁的顺序治疗替代方案(star*d):原理和设计,对照临床试验25,第119页–(2004)·doi:10.1016/S0197-2456(03)00112-0 [34] Schulte,P.J.Tsiatis,A.A.Laber,E.B.Davidian,M.2012 Arxiv预印本Arxiv:1202.4177 [35] Shao,非常规案例中的Bootstrap样本量,《美国数学学会学报》122页1251–(1994)·Zbl 04525454号 ·doi:10.1090/S0002-9939-1994-1227529-8 [36] 邵,折刀方差估计的一般理论,《统计年鉴》第1176页–(1989)·兹比尔0684.62034 ·doi:10.1214/aos/1176347263 [37] Shortreed,《通过强化学习为序贯临床决策提供信息:一项实证研究》,《机器学习》84 pp 109–(2011)·Zbl 06031592号 ·doi:10.1007/s10994-010-5229-0 [38] Song,R.Wang,W.Zeng,D.Kosorok,M.2012年 [39] Sutton,R.Barto,A.1998强化学习:简介 [40] Swanepoel,关于证明(修改后的)bootstrap有效的注释,《统计学中的通信——理论和方法》,第15页,3193–(1986)·Zbl 0623.62041号 ·doi:10.1080/03610928608829303 [41] 沃特金斯,C.1989剑桥大学博士论文 [42] 赵,癌症临床试验强化学习设计,《医学统计学》28页3294–(2009)·doi:10.1002/sim.3720 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。