×

使用稳健调整后的轮廓得分在两样本汇总数据孟德尔随机化中进行统计推断。 (英语) Zbl 1465.62050号

摘要:孟德尔随机化(MR)是一种利用遗传变异在存在无法测量的混杂因素的情况下无条件地估计因果效应的方法。MR广泛应用于流行病学和人口科学的其他相关领域。本文研究了日益流行的两样本汇总数据磁共振设计中的统计推断。我们表明,当所有遗传变异满足排除限制假设时,或在遗传条件下,当不存在多效性时,观察到的关联的线性模型在广泛的环境中近似成立。在这种情况下,我们导出了具有可证明一致性和渐近正态性的最大轮廓似然估计量。然而,通过分析真实数据集,我们发现了MR中系统性和特异性多效性的有力证据,这与最近在遗传学中提出的复杂性状的全基因模型相呼应。我们采用随机效应模型对系统的多效性进行建模,其中没有任何遗传变异精确满足排除限制条件。在这种情况下,我们通过调整剖面得分提出了一个一致的渐近正态估计量。然后,我们通过对调整后的个人资料得分进行稳健性分析来解决特质多效性问题。我们使用几个模拟和实际数据集证明了所提方法的鲁棒性和效率。

MSC公司:

62F03型 参数假设检验
2012年12月62日 参数估计量的渐近性质
62层35 鲁棒性和自适应程序(参数推理)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 1000基因组项目联盟,Auton,A.、Brooks,L.D.、Durbin,R.M.、Garrison,E.P.、Kang,H.M.,Korbel,J.O.、Marchini,J.L.、McCarthy,S.等人(2015)。人类遗传变异的全球参考。自然526 68-74。
[2] Anderson,T.W.和Rubin,H.(1949年)。完整随机方程组中单个方程的参数估计。安。数学。统计数据20 46-63·Zbl 0033.08002号 ·doi:10.1214/aoms/1177730090
[3] Baiocchi,M.、Cheng,J.和Small,D.S.(2014)。因果推断的工具变量方法。统计医学33 2297-2340。
[4] Barndorff Nielsen,O.(1983年)。关于极大似然估计量分布的一个公式。生物特征70 343-365·Zbl 0532.62006号 ·doi:10.1093/biomet/70.2.343
[5] Bekker,P.A.(1994年)。工具变量估计量分布的替代近似。计量经济学62 657-681·Zbl 0795.62102号 ·doi:10.2307/2951662
[6] Bound,J.、Jaeger,D.A.和Baker,R.M.(1995)。当工具与内生解释变量之间的相关性较弱时,工具变量估计存在问题。J.Amer。统计师。协会90 443-450。
[7] Bowden,J.、Davey Smith,G.和Burgess,S.(2015)。使用无效工具的孟德尔随机化:通过Egger回归进行效果估计和偏差检测。国际流行病学杂志。44 512-525.
[8] Bowden,J.、Davey Smith,G.、Haycock,P.C.和Burgess,S.(2016)。孟德尔随机化中使用加权中值估计器的一些无效工具的一致估计。遗传学。流行病。40 304-314.
[9] Bowden,J.、Del Greco M.,F.、Minelli,C.、Davey Smith,G.、Sheehan,N.和Thompson,J.(2017)。孟德尔随机化两样本汇总数据多效性研究框架。《Stat.Med.36 1783-1802》。
[10] Bowden,J.、Fabiola Del Greco,M.、Minelli,C.、Lawlor,D.、Sheehan,N.、Thompson,J.和Smith,G.D.(2019年)。提高两样本汇总数据孟德尔随机化的准确性:超越NOME假设。国际流行病学杂志。48 728-742.
[11] Bowden,J.、Spiller,W.、Del-Greco,F.、Sheehan,N.、Thompson,J.,Minelli,C.和Smith,G.D.(2018年)。通过径向图和径向回归改进两样本汇总数据孟德尔随机化的可视化、解释和分析。国际流行病学杂志。47 1264-1278.
[12] Boyle,E.A.、Li,Y.I.和Pritchard,J.K.(2017)。复杂性状的扩展观点:从多基因到全基因。手机169 1177-1186。
[13] Burgess,S.、Butterworth,A.和Thompson,S.G.(2013年)。使用总结数据对多个遗传变异进行孟德尔随机化分析。遗传学。流行病。37 658-665.
[14] Burgess,S.、Scott,R.A.、Timpson,N.J.、Smith,G.D.、Thompson,S.G.和Consortium,E.-I.(2015)。使用孟德尔随机化中公布的数据:有效识别因果风险因素的蓝图。欧洲流行病学杂志。30 543-552.
[15] Carroll,R.J.、Ruppert,D.、Stefanski,L.A.和Crainiceanu,C.M.(2006)。非线性模型中的测量误差:现代观点,第二版,统计学和应用概率专著105。佛罗里达州博卡拉顿CRC出版社/CRC·Zbl 1119.62063号
[16] Clarivate Analytics(2017)。网络科学主题:孟德尔随机化。可在http://www.webofknowledge.com。
[17] Cox,D.R.和Reid,N.(1987年)。参数正交性和近似条件推理。J.罗伊。统计师。Soc.系列。B 49 1-39·Zbl 0616.62006号 ·doi:10.1111/j.2517-6161.1987.tb01422.x
[18] Davey Smith,G.和Ebrahim,S.(2003年)。“孟德尔随机化”:基因流行病学是否有助于了解疾病的环境决定因素?国际流行病学杂志。32 1-22.
[19] Davey Smith,G.和Hemani,G.(2014)。孟德尔随机化:流行病学研究中因果推断的遗传锚。嗯,分子遗传学。23 R89-R98。
[20] Davey Smith,G.、Lawlor,D.A.、Harbord,R.、Timpson,N.、Day,I.和Ebrahim,S.(2007年)。集群环境和随机基因:传统流行病学和遗传流行病学的基本区别。《公共科学图书馆·医学》4 e352。
[21] Didelez,V.和Sheehan,N.(2007年)。孟德尔随机化作为因果推断的工具变量方法。统计方法医学研究16 309-330·Zbl 1122.62343号 ·doi:10.1177/0962280206077743
[22] Fisher,R.A.(1930年)。自然选择的遗传学理论。牛津大学出版社,牛津。
[23] Guo,Z.、Kang,H.、Cai,T.T.和Small,D.S.(2018)。使用带投票的两阶段硬阈值法确定无效仪器因果效应的置信区间。J.R.统计社会服务。B.统计方法。80 793-815. ·Zbl 1398.62114号 ·doi:10.1111/rssb.12275
[24] Hampel,F.R.(1974年)。影响曲线及其在稳健估计中的作用。J.Amer。统计师。协会69 383-393·兹比尔0305.62031 ·doi:10.1080/01621459.1974.10482962
[25] Hansen,C.、Hausman,J.和Newey,W.(2008年)。使用许多工具变量进行估计。J.总线。经济。统计师。26 398-422。
[26] Hartwig,F.P.、Davey Smith,G.和Bowden,J.(2017年)。通过零模态多效性假设在总结数据孟德尔随机化中进行稳健推断。国际流行病学杂志。46 1985-1998.
[27] Haycock,P.C.、Burgess,S.、Wade,K.H.、Bowden,J.、Relton,C.和Smith,G.D.(2016)。最佳实践:孟德尔随机化研究的设计、分析和解释。美国临床医学杂志。螺母。103 965-978.
[28] Hemani,G.、Zheng,J.、Elsworth,B.、Wade,K.H.、Haberland,V.、Baird,D.、Laurin,C.、Burgess,S.、Bowden,J.等人(2018年)。MR-Base平台支持跨人类现象的系统因果推断。eLife 7 e34408。
[29] Hernán,M.A.和Robins,J.M.(2006年)。因果推理工具:流行病学家的梦想?流行病学17 360-372。
[30] Huber,P.J.(1964年)。位置参数的稳健估计。安。数学。统计数字35 73-101·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[31] Ioannidis,J.P.、Trikalinos,T.A.和Khoury,M.J.(2006)。个体遗传变异的小效应大小对复杂疾病遗传关联研究的设计和解释的影响。美国流行病学杂志。164 609-614.
[32] Kang,H.、Zhang,A.、Cai,T.T.和Small,D.S.(2016)。一些无效仪器的仪器变量估计及其在孟德尔随机化中的应用。J.Amer。统计师。协会111 132-144。
[33] Katan,M.(1986年)。载脂蛋白E亚型、血清胆固醇和癌症。柳叶刀327 507-508。
[34] Li,S.(2017)。许多工具无效时的孟德尔随机化:分层经验贝叶斯估计。可从arXiv:1706.01389获取。
[35] Locke,A.E.、Kahali,B.、Berndt,S.I.、Justice,A.E.,Pers,T.H.、Day,F.R.、Powell,C.、Vedantam,S.、Buchkovich,M.L.等人(2015年)。体重指数的遗传学研究为肥胖生物学提供了新的见解。自然518 197-206。
[36] Maronna,R.A.、Martin,R.D.和Yohai,V.J.(2006)。稳健统计学:理论与方法。概率统计威利级数。奇切斯特·威利·兹比尔1094.62040
[37] McCullagh,P.和Tibshirani,R.(1990年)。调整剖面可能性的简单方法。J.罗伊。统计师。Soc.序列号。乙52 325-344·兹比尔0716.62039 ·doi:10.1111/j.2517-6161.1990.tb01790.x
[38] Murphy,S.A.和Van Der Vaart,A.W.(1996)。误差-变量模型中的似然推理。《多元分析杂志》。59 81-108. ·兹比尔0865.62032 ·doi:10.1006/jmva.1996.0055
[39] Neyman,J.和Scott,E.L.(1948年)。基于部分一致观察结果的一致估计。计量经济学16 1-32·Zbl 0034.07602号 ·doi:10.2307/1914288
[40] Pacini,D.和Windmeijer,F.(2016)。两样本2SLS估计的稳健推断。经济。莱特。146 50-54. ·Zbl 1398.62183号 ·doi:10.1016/j.econlet.2016.06.033
[41] Park,J.-H.、Wacholder,S.、Gail,M.H.、Peters,U.、Jacobs,K.B.、Chanock,S.J.和Chatterjee,N.(2010年)。全基因组关联研究的效应大小分布估计及其对未来发现的影响。自然遗传学。42 570-575.
[42] Pearl,J.(2009)。因果关系:模型、推理和推理,第二版,剑桥大学出版社,剑桥·Zbl 1188.68291号
[43] Purcell,S.PLINK(软件V1.07)。http://pngu.mgh.harvard.edu/purcell/plink/。
[44] Purcell,S.、Neale,B.、Todd-Brown,K.、Thomas,L.、Ferreira,M.A.、Bender,D.、Maller,J.、Sklar,P.、De Bakker,P.I.等人(2007年)。PLINK:用于全基因组关联和基于人群的连锁分析的工具集。Am.J.Hum.遗传学。81 559-575.
[45] Rothenberg,T.J.(1971)。参数模型中的标识。《计量经济学》39 577-591·兹比尔0231.62081 ·doi:10.2307/1913267
[46] Shi,H.、Kichaev,G.和Pasaniuc,B.(2016)。对比总结关联数据中30个复杂性状的遗传结构。Am.J.Hum.遗传学。99 139-153。
[47] Solovieff,N.、Cotsapas,C.、Lee,P.H.、Purcell,S.M.和Smoller,J.W.(2013)。复杂性状的多效性:挑战和策略。Nat.Rev.基因。14 483-495.
[48] Stearns,F.W.(2010)。多效性的一百年:回顾。遗传学186 767-773。
[49] Stock,J.H.和Yogo,M.(2005年)。许多工具的工具变量统计的渐近分布。计量经济学模型109-120的识别和推断。剑桥大学出版社,剑桥·Zbl 1119.62015号 ·doi:10.1017/CBO9780511614491
[50] Tchetgen-Tchetgen,E.J.、Sun,B.和Walter,S.(2017年)。稳健孟德尔随机化推断的GENIUS方法。可从arXiv:1709.07779获取。
[51] van Kippersluis,H.和Rietveld,C.A.(2017年)。多效性稳健孟德尔随机化。国际流行病学杂志。新闻界。
[52] Verbanck,M.、Chen,C.-Y.、Neale,B.和Do,R.(2018年)。从孟德尔随机化的复杂性状与疾病之间的因果关系中发现广泛的水平多效性。自然遗传学。50 693.
[53] Wald,A.(1940年)。如果两个变量都有误差,则拟合直线。安。数学。统计11 285-300·doi:10.1214/aoms/1177731868
[54] Wright,P.G.(1928)。动植物油关税。纽约州麦克米兰。
[55] Wright,S.(1968年)。进化与种群遗传学,第1卷:遗传与生物计量基础1。芝加哥大学出版社,芝加哥。
[56] 尤海,V.J.(1987)。回归的高分解点和高效稳健估计。安。统计师。15 642-656. ·兹比尔062462037 ·doi:10.1214/aos/1176350366
[57] 赵,Q。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。