×

因果中介效应的大规模假设检验及其在全基因组表观遗传学研究中的应用。 (英语) Zbl 1506.62445号

摘要:在全基因组表观遗传学研究中,评估暴露对临床结果的影响是否是通过DNA甲基化介导的,具有重要的科学意义。然而,因果中介效应的统计推断受到了一个挑战,即需要在整个表观基因组中测试大量复合零假设。两种流行的测试,Wald-type Sobel测试和使用传统零分布的联合显著性测试,动力不足,因此可能会错过重要的科学发现。在本文中,我们证明了Sobel检验的零分布不是标准正态分布,在无中介效应的复合零下,联合显著性检验的零分配是不均匀的,特别是在有限样本和奇点为零的情况下,暴露对中介没有影响,中介对结果没有影响。我们的结果解释了为什么这两个测试的能力不足,更重要的是,它促使我们通过利用表观基因组数据,为无中介效应的复合零假设开发一个更强大的分裂聚集复合完整测试(DACT)。我们采用Efron的经验零框架来评估DACT测试的统计显著性。我们的分析表明,所提出的DACT方法提高了功率,能够很好地控制I型错误率。我们的广泛模拟研究表明,在有限样本中,DACT方法正确控制了I型错误率,在检测中介效应方面优于Sobel检验和联合显著性检验。我们将DACT方法应用于美国退伍军人事务部规范性老龄化研究,这是一项正在进行的前瞻性队列研究,研究对象为入学时年龄在21至80岁的男性。我们确定了多个DNA甲基化CpG位点,这些位点可能介导吸烟对肺功能的影响,影响大小从-0.18到-0.79,错误发现率控制在0.05水平,包括AHRR和F2RL3基因中的CpG部位。我们的敏感性分析发现,结果和中介回归之间的误差项的残差相关性很小(小于0.01),这表明我们的结果对未测量的混杂因素是稳健的。本文的补充材料,包括可用于复制作品的材料的标准化描述,可以作为在线补充提供。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H15型 多元分析中的假设检验
62J15型 配对和多重比较;多次测试
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Anthonisen,N.R。;康奈特,J.E。;Murray,R.P.,“11年后吸烟与肺健康研究参与者的肺功能”,《美国呼吸与危重病医学杂志》,166675-679(2002)·doi:10.1164/rccm.2112096
[2] 巴菲尔德,R。;沈杰。;只是,A.C。;沃科纳斯,P.S。;施瓦茨,J。;Baccarelli,A.A。;VanderWeele,T.J。;Lin,X.,“全基因组介导分析在零条件下的间接效应测试,遗传流行病学,41824-833(2017)·doi:10.1002/gepi.22084
[3] 巴伦,R.M。;Kenny,D.A.,“社会心理学研究中的中庸-中介变量区分:概念、战略和统计考虑”,《人格与社会心理学杂志》,51,1173(1986)·doi:10.1037/0022-3514.51.6.1173
[4] 贝尔,B。;Rose,C.L。;Damon,A.,“规范老龄化研究:健康与老龄化、老龄化与人类发展的跨学科纵向研究”,3,5-17(1972)·doi:10.2190/GGVP-XLB5-PC3N-EF0G
[5] 比比科娃,M。;巴恩斯,B。;Tsan,C。;Ho,V。;Klotzle,B。;Le,J.M。;德拉诺,D。;张,L。;Schroth,G.P。;Gunderson,K.L。;风扇,J-B。;Shen,R.,“具有单CPG位点分辨率的高密度DNA甲基化阵列,基因组学,98,288-295(2011)·doi:10.1016/j.ygeno.2011.07.007
[6] 绑定,M.-A。;Lepeule,J。;Zanobetti,A。;Gasparini,A。;Baccarelli,A.A。;库尔,B.A。;塔伦蒂尼,L。;沃科纳斯,P.S。;库特拉基斯,P。;Schwartz,J.,“正常衰老研究中的空气污染和基因特异性甲基化:关联、效应修正和中介分析”,表观遗传学,9,448-458(2014)·doi:10.4161/epi.27584
[7] 百年灵,L.P。;萨尔兹曼,K。;Rothenbacher,D。;伯文克尔,B。;Brenner,H.,“吸烟、f2rl3甲基化与稳定型冠心病的预后,欧洲心脏杂志,33,2841-2848(2012)·doi:10.1093/eurheartj/ehs091
[8] 百年灵,L.P。;Yang,R。;Korn,B。;伯文克尔,B。;Brenner,H.,“烟草相关的差异DNA甲基化:27k的发现和复制,美国人类遗传学杂志,88,450-457(2011)·doi:10.1016/j.ajhg.2011.03.003
[9] 塞西尔,C.A。;Lysenko,L.J。;贾菲,S.R。;Pingault,J.-B。;史密斯,R.G。;Relton,C.L。;伍德沃德,G。;麦卡德尔,W。;Mill,J。;Barker,E.D.,“环境风险,催产素受体基因(oxtr)甲基化和青少年Callous-unemotion特征:一项为期13年的纵向研究,分子精神病学,19,1071(2014)·doi:10.1038/mp.2014.95
[10] 杜,P。;张,X。;Huang,C.-C。;北卡罗来纳州贾法里。;Kibbe,W.A。;Hou,L。;Lin,S.M.,“通过微阵列分析定量甲基化水平的β值和M值方法的比较,BMC生物信息学,11,587(2010)·doi:10.1186/1471-2105-11-587
[11] Dudoit,S。;van der Laan,M.,《基因组学应用的多重测试程序》。Springer统计学系列(2007),纽约:Springer,纽约
[12] Efron,B.,“大规模同步假设检验:零假设的选择”,《美国统计协会杂志》,99,96-104(2004)·Zbl 1089.62502号 ·doi:10.1198/0162145000000089
[13] Efron,B.,“相关z值和大尺度统计估计的准确性”,《美国统计协会杂志》,105,1042-1055(2010)·Zbl 1390.62139号 ·doi:10.1198/jasa.2010.tm09129
[14] 埃夫隆,B。;Tibshirani,R。;Storey,J.D。;Tusher,V.,“微阵列实验的经验贝叶斯分析”,《美国统计协会杂志》,96,1151-1160(2001)·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[15] Elliott,H.R。;蒂林,T。;McArdle,W.L。;Ho,K。;Duggirala,A。;弗雷林,T.M。;戴维·史密斯,G。;A.D.休斯。;查图尔维迪,N。;Relton,C.L.,“南亚人和欧洲人吸烟相关DNA甲基化模式的差异,临床表观遗传学,6,1-10(2014)·doi:10.1186/1868-7083-6-4
[16] Fasanelli,F。;巴格里托,L。;庞齐,E。;吉达,F。;坎帕内拉,G。;约翰逊,M。;Grankvist,K。;约翰逊,M。;Assumma,M.B。;Naccarati,A.,“在四个前瞻性队列中,吸烟相关基因的低甲基化与未来肺癌相关,自然通讯,6,1-9(2015)·doi:10.1038/ncomms10192
[17] 盖诺,S.M。;施瓦茨,J。;Lin,X.,“常见二元结果的中介分析,医学统计学,38,512-529(2019)·doi:10.1002/sim.7945
[18] Genovese,C。;Wasserman,L.,《错误发现控制的随机过程方法》,《统计年鉴》,1035-1061(2004)·Zbl 1092.62065号
[19] 豪斯曼,E.A。;雅各曼多,W.P。;科斯特勒特区。;克里斯滕森(Christensen,B.C.)。;Marsit,C.J。;Nelson,H.H。;Wiencke,J.K。;Kelsey,K.T.,DNA甲基化阵列作为细胞混合物分布的替代措施,BMC生物信息学,13,86(2012)·doi:10.1186/1471-2105-13-86
[20] Huang,Y.-T.,“复合零假设下稀疏中介效应的全基因组分析”,《应用统计年鉴》,第13期,第60-84页(2019年)·Zbl 1417.62311号 ·doi:10.1214/18-AOAS1181
[21] Imai,K。;基尔,L。;Yamamoto,T.,“因果中介效应的识别、推断和敏感性分析,统计科学,25,51-71(2010)·兹比尔1328.62478 ·doi:10.1214/10-STS321
[22] Jin,J。;Cai,T.T.,“在大规模多重比较中估计零效应和非零效应的比例”,美国统计协会杂志,102495-506(2007)·Zbl 1172.62319号 ·doi:10.1198/0162145000000167
[23] 约翰逊,W.E。;李,C。;Rabinovic,A.,“使用经验贝叶斯方法调整微阵列表达数据中的批量效应,生物统计学,8118-127(2007)·Zbl 1170.62389号 ·doi:10.1093/biostatistics/kxj037
[24] Joubert,B.R。;Háberg,S.E。;尼尔森,R.M。;王,X。;沃尔塞特,S.E。;Murphy,S.K。;Huang,Z。;Hoyo,C。;Midttun,Ø。;Cupul-加州大学洛杉矶分校。;Ueland,P.M。;吴,P.M。;Nystad,W。;贝尔,D.A。;佩德达达,S.D。;London,S.J.,450k表观基因组全扫描确定与孕期吸烟相关的新生儿差异DNA甲基化,环境健康展望,1201425-1431(2012)·doi:10.1289/ehp.1205412
[25] Kang,J.,“微阵列研究中真零假设比例的方法比较,统计应用和方法的通信,27141-148(2020)·doi:10.29220/CSAM.2020.27.141
[26] Lepeule,J。;Baccarelli,A。;塔伦蒂尼,L。;莫塔,V。;坎通纳,L。;Litonjua,A.A。;麻雀,D。;沃科纳斯,P.S。;Schwartz,J.,基因启动子甲基化与老年人肺功能相关:正常年龄研究,表观遗传学,7261-269(2012)·doi:10.1164/ajrccm-conference.2012.185.1_会议摘要。A5290型
[27] 李,S。;Wong,E.M。;Bui,M。;Nguyen,T.L。;Joo,J.-H.E。;斯通,J。;迪特,G.S。;Giles,G.G。;Saffery,R。;Southey,M.C。;Hopper,J.L.,“吸烟对外周血DNA甲基化的因果影响:一项双胞胎和家族研究,临床表观遗传学,10,18(2018)·doi:10.1186/s13148-018-0452-9
[28] 刘,Y。;Aryee,M.J。;帕久科夫。;法林,医学博士。;Hesselberg,E。;Runarsson,A。;雷尼乌斯,L。;阿塞韦多,N。;Taub,M。;Ronninger,M。;Shchetynsky,K。;Scheynius,A。;凯尔,J。;阿尔弗雷德松。;Klareskog,L。;Ekström,T.J。;Feinberg,A.P.,“表观基因组范围的关联数据表明DNA甲基化是类风湿关节炎遗传风险的中介,自然生物技术,31142-147(2013)·doi:10.1038/nbt.2487
[29] MacKinnon,D.P。;Lockwood,C。;霍夫曼,J.,《调解测试的新方法》(1998年)
[30] MacKinnon,D.P。;洛克伍德,C.M。;霍夫曼,J.M。;西,S.G。;Sheets,V.,“测试调解和其他干预变量效应的方法比较,心理学方法,783-104(2002)·doi:10.1037/1082-989x.7.1.83
[31] Pearl,J.,《第十七届人工智能不确定性会议论文集,直接和间接影响》,411-420(2001),Morgan Kaufmann Publishers Inc
[32] Philibert,R.A。;比奇,南部。;雷,M.-K。;Brody,G.H.,“芳基烃受体阻遏物DNA甲基化的变化可能是吸烟的新生物标志物,临床表观遗传学,5,19(2013)·doi:10.1186/1868-7083-5-19
[33] Philibert,R.A。;S.R.比奇。;Brody,G.H.,“芳香烃受体阻遏物的脱甲基化作为新生吸烟者的生物标记物,表观遗传学,71331-1338(2012)·doi:10.4161/epi.22520
[34] 新南威尔士州皮莱。;Meng,X.-L.,“与Cauchy和Lévy的意外相遇,统计年鉴,442089-1997(2016)·Zbl 1349.62036号 ·doi:10.1214/15-OS1407
[35] 雷诺兹,L.M。;Wan,M。;丁,J。;泰勒,J.R。;Lohman,K。;苏·D。;贝内特,B.D。;波特,D.K。;Gimple,R。;皮特曼,G.S。;王,X。;T.D.霍华德。;Siscovick,D。;Psaty,B.M。;谢伊,S。;Burke,G.L。;雅各布斯,D.R.Jr;Rich,S.S。;希克森,J.E。;Stein,J.H。;Stunnenberg,H。;巴尔·R·G。;考夫曼,J.D。;邮政,W.S。;Hoeschele,I。;Herrington,D.M。;贝尔,D.A。;Liu,Y.,“芳香烃受体阻遏物的DNA甲基化与吸烟和亚临床动脉粥样硬化的关系”,《循环:心血管遗传学》,8,707-716(2015)
[36] 罗宾斯,J.M。;格陵兰,S.,“直接和间接影响的可识别性和可交换性”,《流行病学》,3143-155(1992)
[37] 施瓦茨曼,A。;多尔蒂,R.F。;Lee,J。;Ghahremani,D。;Taylor,J.E.,“神经成像中的经验零发现率和假发现率分析,神经成像,44,71-82(2009)·doi:10.1016/j.neuroimage.2008.04.182
[38] 新南威尔士州申克。;波利多罗,S。;van Veldhoven,K。;Sacerdote,C。;Ricceri,F。;Birrell,硕士。;贝尔维西,M.G。;布朗,R。;葡萄藤,P。;Flanagan,J.M.,“欧洲癌症和营养前瞻性研究中的全表观基因组关联研究(Epic-turin)确定与吸烟相关的新基因位点,人类分子遗传学,dds488(2012)·doi:10.1093/hmg/dds488
[39] Sobel,M.E.,“结构方程模型间接效应的渐近置信区间,社会学方法论,13,290-312(1982)·doi:10.2307/270723
[40] Storey,J.D.,“错误发现率的直接方法,皇家统计学会期刊,B辑,64,479-498(2002)·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[41] Teschendorff,A.E。;马拉比塔,F。;Lechner,M。;Bartlett,T。;Tegner,J。;Gomez-Cabrero,D。;Beck,S.,“一种修正无限Illumina Infinium 450k DNA甲基化数据中探针设计偏差的贝塔混合物分位数归一化方法,生物信息学,29,189-196(2012)·doi:10.1093/bioinformatics/bts680
[42] Tingley,D.、Yamamoto,T.、Keele,L.和Imai,K.(2013),“调解:因果调解分析的R包(R包版本4.4)”
[43] 托莫拉,M。;伊利马林,P。;托米斯托,L.E。;Haanpää,J。;Kankaanranta,T。;O.尼美拉。;Kankaanranta,H.,“吸烟对肺功能的影响:成人哮喘的临床研究”,《欧洲呼吸杂志》,48,1298-1306(2016)·doi:10.1183/13993003.00850-2016年
[44] 瓦莱里,L。;VanderWeele,T.J.,“允许暴露-中介互动和因果解释的中介分析:SAS和SPSS宏的理论假设和实现,心理学方法,18,137(2013)·doi:10.1037/0031034
[45] van der Vaart,A.,《渐进统计》(2000),纽约:剑桥大学出版社,纽约·Zbl 0943.6202号
[46] van Iterson,M。;van Zwet,E.W。;联合体,B。;Heijmans,B.T.,“利用经验零分布控制表观基因组和转录组全关联研究中的偏差和膨胀,基因组生物学,18,19(2017)·doi:10.1186/s13059-016-1131-9
[47] VanderWeele,T。;Vanstelandt,S.,“关于调解、干预和组成的概念问题,统计及其接口,2,457-468(2009)·Zbl 1245.62177号 ·doi:10.4310/SII.2009.v2.n4.a7
[48] Wasserman,L.,《所有非参数统计》,Springer Texts in Statistics(2006),纽约:Springer,New York·Zbl 1099.62029号
[49] 吴,H。;Zhang,Y.,“逆转DNA甲基化:机制、基因组学和生物功能,细胞,156,45-68(2014)·doi:10.1016/j.cell.2013.12.019
[50] 张,H。;郑毅。;张,Z。;高,T。;乔伊斯,B。;Yoon,G。;张伟。;施瓦茨,J。;只是,A。;大肠杆菌。;沃科纳斯,P。;赵,L。;吕杰。;Baccarelli,A。;Hou,L。;Liu,L.,“在表观遗传学研究中评估和测试高维中介效应,生物信息学,32,3150-3154(2016)·doi:10.1093/bioinformatics/btw351
[51] Zhang,Y。;肖特克,B。;Florath,I。;库存,C。;Butterbach,K。;霍勒切克,B。;蒙斯,美国。;Brenner,H.,“吸烟相关DNA甲基化生物标记物及其对全死因和心血管死亡率的预测价值,环境健康展望,124,67-74(2016)·doi:10.1289/ehp.1409020
[52] Zhang,Y。;Yang,R。;伯文克尔,B。;百年灵,L.P。;Brenner,H.,“F2RL3甲基化作为当前和终身吸烟暴露的生物标志物,环境健康展望,122,131(2014)·doi:10.1289/ehp.1306937
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。