×

使用协变量知情随机分区模型发现相互作用。 (英语) Zbl 1475.62263号

总结:为儿童急性淋巴细胞白血病患者创建的联合化疗方案在提高治愈率方面取得了巨大成功。不幸的是,患者使用这些类型的治疗方案,显示出对骨坏死发病的敏感性。一些人认为,这是由于治疗方案中两种药物(天冬酰胺酶和地塞米松)之间的药代动力学相互作用以及其他生理变量所致。在这样的场景中搜索交互作用时,如果没有先验指导,确定要考虑的生理变量是一个具有挑战性的问题,特别是当交互作用影响响应分布的方式超出了预期或分散的变化时。在本文中,我们提出了一种探索性技术,能够以一般方式发现协变量和响应之间的关联。该过程通过相关随机分区分布灵活地将协变量与响应联系起来,然后使用机器学习技术突出每个簇中发现的潜在关联。我们提供了一项模拟研究,以展示该方法的实用性,并将其应用于一项研究中产生的数据,该研究致力于了解哪些生理预测因素会对骨坏死的严重程度产生多重影响。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62G05型 非参数估计
62甲12 多元分析中的估计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agrawal,R.、Mannila,H.、Srikant,R.,Toivonen,H.和Verkamo,A.I.(1996年)。快速发现关联规则。知识发现和数据挖掘的进展(U.M.Fayyad、G.Piatetsky-Shapiro、P.Smyth和R.Uthurusamy编辑)307-328。美国人工智能协会,美国加利福尼亚州门罗公园。
[2] Agrawal,R.、Trippe,B.、Huggins,J.和Broderick,T.(2019年)。内核交互技巧:高维成对交互的快速贝叶斯发现。会议记录36第十届国际机器学习会议(K.Chaudhuri和R.Salakhutdinov编辑)。机器学习研究进展97 141-150. 加利福尼亚州长滩PMLR。
[3] 美国癌症协会(2018)。儿童白血病的存活率。https://www.cancer.org/cancer/leukemia-in-children/detection-diagnosis-staging/survival-rates.html[访问日期:2018年3月18日]。
[4] Bao,J.和Hanson,T.E.(2015)。贝叶斯非参数多元序数回归。加拿大。J.统计学家。43 337-357. ·Zbl 1321.62033号 ·doi:10.1002/js.11253
[5] Barcella,W.、De Iorio,M.、Favaro,S.和Rosner,G.L.(2018年)。急性淋巴细胞白血病分析的相关广义Dirichlet过程。生物统计学19 342-358. ·doi:10.1093/biostatistics/kxx042
[6] Barrera-Gómez,J.、Agier,L.、Portengen,L.,Chadeau-Hyam,M.、Giorgis-Allemand,L.和Siroux,V.、Robinson,O.、Vlaanderen,J.和González,J.R.等人(2017年)。系统比较统计方法,以检测暴露-健康关联中的相互作用。环境。健康16 74.
[7] Berger,J.O.、Wang,X.和Shen,L.(2014)。子群识别的贝叶斯方法。生物制药杂志。统计师。24 110-129. ·doi:10.1080/10543406.2013.856026
[8] Bien,J.、Taylor,J.和Tibshirani,R.(2013)。用于分层交互的LASSO。安。统计师。41 1111-1141. ·兹比尔1292.62109 ·doi:10.1214/13-AOS1096
[9] Chen,T.和Guestrin,C.(2016)。XGBoost:一个可扩展的树增强系统。会议记录22第二届ACM SIGKDD知识发现和数据挖掘国际会议.杜兰特16 785-794. 美国纽约州纽约市计算机协会·doi:10.1145/2939672.29339785
[10] Chen,Y.和Hanson,T.E.(2014)。删失和未删失数据的贝叶斯非参数样本检验。计算。统计师。数据分析。71 335-346. ·Zbl 1471.62041号 ·doi:10.1016/j.csda.2012.11.003
[11] Chen,T.,He,T.、Benesty,M.、Khotilovich,V.、Tang,Y.、Cho,H.、Chen,K.、Mitchell,R.、Cano,I.等人(2019年)。xgboost:极限梯度增强。R包版本0.90.0.2。
[12] Chung,Y.和Dunson,D.B.(2009年)。带变量选择的非参数贝叶斯条件分布建模。J.Amer。统计师。协会。104 1646-1660. ·兹比尔1205.62039 ·doi:10.1198/jasa.2009.tm08302
[13] Dahl,D.B.(2020年)。salso:顺序分配的潜在结构优化。R包版本0.1.11。
[14] De Iorio,M.、Müller,P.、Rosner,G.L.和MacEachern,S.N.(2004)。相依随机测度的方差分析模型。J.Amer。统计师。协会。99 205-215. ·Zbl 1089.62513号 ·doi:10.1198/016214500000205
[15] Du,J.和Linero,A.R.(2018年)。贝叶斯决策树集成的交互检测。arXiv:1809.08524。
[16] Dunson,D.B.,Pillai,N.和Park,J.-H(2007年)。贝叶斯密度回归。J.R.统计社会服务。B.统计方法。69 163-183. ·Zbl 1120.62025号 ·文件编号:10.1111/j.1467-9868.2007.00582.x
[17] Fan,J.、Yao,Q.和Tong,H.(1996)。非线性动力系统中条件密度和灵敏度测度的估计。生物特征83 189-206. ·Zbl 0865.62026号 ·doi:10.1093/biomet/83.1.189
[18] Ferrari,F.和Dunson,D.B.(2019年)。交互推理的贝叶斯因子分析。arXiv:1904.11603v1。
[19] Gabri,J.、Simpson,D.、Vehtari,A.、Betancourt,M.和Gelman,A.(2019年)。贝叶斯工作流中的可视化。J.罗伊。统计师。Soc.序列号。A类182 389-402. ·doi:10.1111/rssa.12378
[20] George,E.I.和McCulloch,R.E.(1997)。贝叶斯变量选择方法。统计师。西尼卡7 339-374. ·Zbl 0884.62031号
[21] Hahsler,M.、Buchta,C.、Gruen,B.和Hornik,K.(2015年)。arules:挖掘关联规则和频繁项集。R软件包版本1.3-1。
[22] Han,J.、Kamber,M.和Pei,J.(2012年)。数据挖掘概念和技术《爱思唯尔》第1版·Zbl 1230.68018号
[23] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。统计学习的要素:数据挖掘、推断和预测,第2版。统计学中的斯普林格系列纽约州施普林格·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[24] Heba,I.、Amany,A.、Ahmed,S.E.和Amr,S.(2014)。检测药物相互作用的新型数据挖掘方法:药物警戒文献综述。环境科学、发展与化学进展(W.L.Staff编辑)301-314。Wseas有限责任公司。
[25] Henderson,N.C.、Louis,T.A.、Rosner,G.L.和Varadhan,R.(2020年)。通过完全非参数贝叶斯加速失效时间模型,使用删失数据进行个体化治疗效果。生物统计学21 50-68之间·doi:10.1093/biostatistics/kxy028
[26] Hu,J.、Joshi,A.和Johnson,V.E.(2009年)。基因关联的对数线性模型。J.Amer。统计师。协会。104 597-607. ·Zbl 1388.62219号 ·doi:10.1198/jasa.2009.0025
[27] Ishwaran,H.和Rao,J.S.(2005年)。尖峰和平板变量选择:频繁和贝叶斯策略。安。统计师。33 730-773. ·Zbl 1068.62079号 ·doi:10.1214/009053604000001147
[28] Ishwaran,H.、Rao,J.S.和Kogalur,U.B.(2013年)。spiceslab:使用spike和slab回归进行预测和变量选择。R包版本1.1.5。
[29] Kapelner,A.和Bleich,J.(2016)。bartMachine:使用贝叶斯加性回归树的机器学习。J.统计软件。70 4. ·Zbl 1328.62243号
[30] Karbowiak,E.和Biecek,P.(2019年)。EIX:解释“XGBoost”中的交互。R软件包版本1.0。
[31] Kawedia,J.D.、Kaster,S.C.、Pei,D.、Panetta,J.C.、Cai,X.、Cheng,C.、Neale,G.、Howard,S.C、Evans,W.E.等人(2011年)。急性淋巴细胞白血病儿童骨坏死的药代动力学、药效学和药物遗传学决定因素。血液117 2340-2347.
[32] Kottas,A.、Müller,P.和Quintana,F.(2005年)。多元序数数据的非参数贝叶斯建模。J.计算。图表。统计师。14 610-625. ·doi:10.1198/106186005X63185
[33] Lim,M.和Hastie,T.(2015)。通过分层组套索正则化学习交互。J.计算。图表。统计师。24 627-654. ·doi:10.1080/10618600.2014.938812
[34] Lim,M.和Hastie,T.(2019年)。glinternet:通过层次化的群-群正则化学习交互。R包版本1.0.10。
[35] Liu,J.、Sivaganesan,S.、Laud,P.W.和Müller,P.(2017)。使用ANOVA模型集合进行贝叶斯亚组分析。生物。J。59 746-766. ·Zbl 1369.62297号 ·doi:10.1002/bimj.201600064
[36] MacEachern,S.N.(2000年)。相关的Dirichlet过程。技术报告,俄亥俄州立大学统计系。
[37] Mitra,R.、Müller,P.和Ji,Y.(2017)。多图的贝叶斯多重性控制。加拿大。J.统计学家。45 44-61. ·Zbl 1462.62365号 ·doi:10.1002/cjs.11305
[38] Müller,P.、Quintana,F.和Rosner,G.L.(2011年)。协变量回归的产品分割模型。J.计算。图表。统计师。20 260-278. 在线提供补充材料。 ·doi:10.1198/jcgs.2011.09066
[39] Müller,P.、Quintana,F.A.、Jara,A.和Hanson,T.(2015)。贝叶斯非参数数据分析.统计学中的斯普林格系列查姆施普林格·Zbl 1333.62003年 ·doi:10.1007/978-3-319-18968-0
[40] Neal,R.M.(2000)。狄利克雷过程混合模型的马尔可夫链抽样方法。J.计算。图表。统计师。9 249-265. ·doi:10.2307/1390653
[41] Page,G.L.和Quintana,F.A.(2018年)。校准协变量知情产品划分模型。统计计算。28 1009-1031. ·Zbl 1405.62123号 ·数字对象标识代码:10.1007/s11222-017-9777-z
[42] Page,G.L.,Quintana,F.A.和Rosner,G.L(2021a)。补充“使用协变量知情随机分区模型发现相互作用”https://doi.org/10.1214/20-AOAS1372SUPA网站
[43] Page,G.L.,Quintana,F.A.和Rosner,G.L(2021b)。“使用协变量通知的随机分区模型发现交互作用”的源代码https://doi.org/10.1214/20-AOAAS1372SUPPB
[44] R核心团队(2017)。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[45] Reich,B.J.、Kalendra,E.、Storlie,C.B.、Bondell,H.D.和Fuentes,M.(2012)。高维贝叶斯密度估计的变量选择:在人体暴露模拟中的应用。J.R.统计社会服务。C.申请。斯达。61 47-66. ·doi:10.1111/j.1467-9876.2011.00772.x
[46] Schnell,P.M.、Tang,Q.、Offen,W.W.和Carlin,B.P.(2016)。一种贝叶斯可信亚组方法,用于识别治疗效果良好的患者亚组。生物计量学72 1026-1036. ·Zbl 1390.62306号 ·doi:10.1111/biom.12522
[47] Scott,J.G.和Berger,J.O.(2010年)。变量选择问题中的贝叶斯和经验贝叶斯多重性调整。安。统计师。38 2587-2619. ·Zbl 1200.62020年 ·doi:10.1214/10-AOS792
[48] Shen,W.和Ghosal,S.(2016)。高维数据的自适应贝叶斯密度回归。伯努利22 396-420. ·Zbl 1388.62115号 ·doi:10.3150/14-BEJ663
[49] Simon,R.(2002年)。贝叶斯子集分析:应用于研究两性互动。统计医学。21 2909-2916.
[50] Smith,M.和Kohn,R.(1996年)。使用贝叶斯变量选择的非参数回归。J.计量经济学75 317-343. ·Zbl 0864.62025号
[51] Su,X.,Peña,a.T.,Liu,L.和Levine,R.a.(2018年)。用于估计随机试验中个体化治疗效果的交互树的随机森林。统计医学。37 2547-2560·doi:10.1002/sim.7660
[52] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B58 267-288. ·Zbl 0850.62538号
[53] Tokdar,S.T.、Zhu,Y.M.和Ghosh,J.K.(2010年)。基于logistic高斯过程和子空间投影的贝叶斯密度回归。贝叶斯分析。5 319-344. ·Zbl 1330.62182号 ·doi:10.1214/10-BA605
[54] Varadhan,R.和Wang,S.-J.(2014)。随机对照试验中亚组分析的标准化。生物制药杂志。统计师。24 154-167. ·doi:10.1080/10543406.2013.856023
[55] Venables,W.N.和Ripley,B.D.(2002年)。现代应用统计学与S第四版,纽约施普林格出版社,ISBN 0-387-95457-0·Zbl 1006.62003号 ·doi:10.1007/9781-4899-2819-1
[56] Wade,S.和Ghahramani,Z.(2018年)。贝叶斯聚类分析:点估计和可信球(讨论)。贝叶斯分析。13 559-626. 经作者讨论和回复·Zbl 1407.62241号 ·doi:10.1214/17-BA1073
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。