×

不完全连锁不平衡下全基因组扫描的稳健测试。 (英语) Zbl 1329.62440号

摘要:在完全连锁不平衡(LD)条件下,稳健检验在病例对照遗传关联研究的分析中通常比皮尔逊的齐方检验和趋势检验具有更大的功效。当遗传模型未知时,稳健统计已用于候选基因和全基因组关联研究(GWAS)。我们在这里考虑了一个更普遍的不完全LD模型,并在疾病基因座定义遗传模型时检查了标记基因座外显率的影响。然后回顾了稳健统计,并通过在不完全LD模型下对300000个标记的GWAS进行模拟,比较了它们的效率和稳健性。几个稳健测试在威康信托病例控制联盟[《七种常见疾病14000例和3000例共同对照的全基因组关联研究》,Nature 447,661-678(2007)]。

MSC公司:

62页第10页 统计学在生物学和医学科学中的应用;元分析
62G10型 非参数假设检验
92D10型 遗传学和表观遗传学
62G35型 非参数稳健性

软件:

拉斯科
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrews,D.F.、Bickel,P.J.、Hampel,F.R.、Huber,P.J、Rogers,W.H.和Tukey,J.W(1965)。稳健的位置估计。普林斯顿大学出版社,新泽西州普林斯顿·Zbl 0254.62001号 ·数字对象标识代码:10.1515/9781400867011
[2] Balding,D.J.(2006)。人口关联研究的统计方法教程。Genet国家牧师。7 781-791.
[3] Conneely,K.N.和Boehnke,M.(2007年)。这么多相关测试,这么少时间!快速调整多个相关测试的P值。Am.J.Hum.遗传学。81 1158-1168.
[4] Davies,R.B.(1977年)。仅在备选方案下存在干扰参数时进行假设测试。生物特征64 247-254。JSTOR公司:·Zbl 0362.62026号 ·doi:10.2307/2335690
[5] Davies,R.B.(1987)。假设——测试仅在备选方案下存在干扰参数的情况。生物特征74 33-43。JSTOR公司:·Zbl 0612.62023号
[6] Elston R.C.、Lin,D.Y.和Zheng,G.(2007)。遗传研究的多阶段抽样。Ann.Rev.Gen.Hum.Genet.安牧师。8 327-342。
[7] Freidlin,B.、Zheng,G.、Li,Z.和Gastwirth,J.L.(2002)。遗传标记病例对照研究的趋势检验:功效、样本量和稳健性。哼,来了。53 146-152(勘误表68(2009)220)。
[8] 盖尔。M.H.、Pfeiffer。R.M.,惠勒。W.和Pee,D.(2008)。病例对照全基因组关联研究中检测疾病相关单核苷酸多态性的概率。生物统计9 201-215·Zbl 1143.62348号 ·doi:10.1093/biostatistics/kxm032
[9] Gastwirth,J.L.(1966年)。关于稳健的程序。J.Amer。统计师。协会61 929-948。JSTOR公司:·Zbl 0144.19004号 ·doi:10.2307/2283190
[10] Gastwirth,J.L.(1985)。在结合列联表和生存分析中使用最大最小效率稳健检验。J.Amer。统计师。协会80 380-384·Zbl 0573.62042号 ·doi:10.2307/2287901
[11] González,J.R.、Carrasco,J.L.、Dudbridge,F.、Armengol,L.、Estivill,X.和Moreno,V.(2008)。最大化遗传模型上的关联统计。遗传学。流行病。32 246-254.
[12] Guedj,M.、Nuel,G.和Prum,B.(2008年)。病例对照关联研究中的等位基因检测。安。嗯。遗传学。72 407-409.
[13] Hanson,R.L.、Looker,H.C.、Ma,L.、Muller,Y.L.、Baier,L.J.和Knowler,W.C.(2006)。设计和分析遗传关联研究,以精细绘制通过连锁分析确定的基因座:样本大小和功率计算。安。嗯。遗传学。70 332-349.
[14] Hoh,J.和Ott,J.(2003)。数学多基因座方法定位复杂的人类特征基因。Genet国家牧师。4 701-709。
[15] Joo,J.、Kwak,M.、Ahn,K.和Zheng,G.(2009年)。Wellcome Trust病例控制联盟的稳健全基因组扫描统计。生物统计学65 1115-1122·Zbl 1180.62171号 ·doi:10.1111/j.1541-0420.2009.01185.x
[16] Klein,R.J.、Zeiss,C.、Chew,E.Y.、Tsai,J.Y.、Sackler,R.S.、Haynes,C.、Henning,A.K.、SanGiovanni,J.P.、Mane,S.M.、Mayne,S.T.、Bracken,M.B.、Ferris,F.L.、Ott,J.、Barnstable,C.和Hoh,J.(2005)。老年性黄斑变性患者补体因子H多态性。科学308 385-389。
[17] Kraft,P.、Zeggini,E.和Ioanidis,J.P.A.(2009年)。全基因组关联研究中的复制。统计师。科学。24 561-573. ·Zbl 1329.62429号 ·doi:10.1214/09-STS290
[18] Lettre,G.、Lange,C.和Hirschorn,J.N.(2007年)。数量性状基于人群的关联研究中的遗传模型检验和统计能力。遗传学。流行病。31 358-362.
[19] Lewontin,R.C.(1964年)。选择和联系的相互作用。一、一般考虑;杂合模型。遗传学49 49-67。
[20] Li,Q.,Zheng,G.,Li,Z.和Yu,K.(2008a)。相关测试最大值的P值的有效近似,并应用于全基因组关联研究。安。嗯。遗传学。72 397-406.
[21] Li,Q.,Yu,K.,Li,Z.和Zheng,G.(2008b)。MAX-rank:用于病例对照关联研究的简单而稳健的全基因组扫描。嗯,遗传学。123 617-623.
[22] Marchini,J.、Donnelly,P.和Cardon,L.R.(2005)。检测影响复杂疾病的多个基因座的全基因组策略。自然遗传学。37 413-417.
[23] Nielsen,D.M.、Ehm,M.G.和Weir,B.S.(1998年)。通过检测一个标记位点的Hardy-Weinberg不平衡来检测标记与疾病的相关性。Am.J.Hum.遗传学。63 1531-1540.
[24] Nielsen,D.M.和Weir,B.S.(1999)。影响数量性状的标记和基因座之间关联的经典设置。遗传学。第74 271-277号决议。
[25] Pfeiffer,R.M.、Gail,M.H.和Pee,D.(2009年)。结合全基因组关联研究的数据以发现疾病相关SNP。统计师。科学。24 547-560. ·Zbl 1329.62434号 ·doi:10.1214/09-STS286
[26] Roeder,K.和Wasserman,L.(2009年)。全基因组显著性水平和加权假设检验。统计师。科学。24 398-413. ·Zbl 1329.62435号 ·doi:10.1214/09-STS289
[27] Sasieni,P.D.(1997年)。从基因型到基因:样本量加倍。生物统计学53 1253-1261。JSTOR公司:·Zbl 0931.62099号 ·doi:10.2307/2533494
[28] Schaid,D.J.、McDonnell,S.K.、Hebbring,S.J.、Cunningham,J.M.和Thibodeu,S.N.(2005)。多基因与人类疾病相关性的非参数检验。Am.J.Hum.遗传学。76 780-793.
[29] Sladek,R.、Rocheleau,G.、Rung,J.、Dina,C.、Shen,L.Serre,D.、Boutin,P.、Vincent,D.、Belisle,A.、Hadjadj,S.、Balkau,B.、Heude,B.等人(2007年)。一项全基因组关联研究确定了2型糖尿病的新风险位点。自然445 881-885。
[30] Song,K.和Elston,R.C.(2006年)。在病例对照研究中,将关联测量和Hardy-Weinberg不平衡结合起来进行精细绘制的有力方法。统计医学25 105-126·doi:10.1002/sim.2350
[31] Thomas,D.C.、Casey,G.、Conti,D.、Haile,R.W.、Lewinger,J.P.和Stram,D.O.(2009年)。多阶段全基因组关联研究中的方法学问题。统计师。科学。24 414-429. ·Zbl 1329.62439号 ·doi:10.1214/09-STS288
[32] Tukey,J.W.(1965年)。样本的哪个部分包含信息?程序。国家。阿卡德。科学。美国53 127-134。JSTOR公司:·Zbl 0168.40205号 ·doi:10.1073/pnas.53.1.127
[33] Van Steen,K.、McQueen,M.B.、Herbert,A.、Raby,B.、Lyon,H.、DeMeo,D.L.、Murphy,A.、Su,J.、Datta,S.、Rosenow,C.、Christman,M.、Silverman,E.K.、Laird,N.M.、Weiss,S.T.和Lange,C.(2005)。在基于家族的关联测试中使用相同数据集进行基因组筛选和复制。自然遗传学。37 683-691之间。
[34] Wang,K.和Sheffield,V.C.(2005)。标记-性状关联研究的约束-似然方法。Am.J.Hum.遗传学。77 768-780.
[35] Weir,B.S.(1996)。遗传数据分析II:离散群体遗传数据的方法。马萨诸塞州桑德兰西诺尔。
[36] Wittke-Thompson,J.K.、Pluzhnikov,A.和Cox,N.J.(2005)。关于偏离哈代-温伯格均衡的理性推断。Am.J.Hum.遗传学。76 967-986.
[37] 威康信托案例控制联盟(WTCCC)(2007年)。对7种常见疾病的14000例病例和3000例共享对照进行全基因组关联研究。自然447 661-678。
[38] Yamada,R.和Okada,Y.(2009年)。SNP基因型表的最佳剂量效应模式趋势检验。遗传学。流行病。33 114-127.
[39] Zang,Y.、Fung,W.K.和Zheng,G.(2010)。R.J.Stat.软件33 1-24中用于计算病例对照遗传关联研究中稳健检验的渐近零分布的简单算法。
[40] Zaykin,D.V.和Nielsen,D.M.(2000)。病例对照样本的Hardy-Weinberg不平衡(HWD)精细绘图。Am.J.Hum.遗传学。67 1238补遗。
[41] Zaykin,D.V.和Zhivotovsky,L.A.(2005年)。全基因组扫描中真实关联的等级。遗传学171 813-823。
[42] Zheng,G.和Ng,H.K.T.(2008)。病例对照关联研究两阶段分析中的遗传模型选择。生物统计学9 391-399·Zbl 1143.62088号 ·doi:10.1093/biostatistics/kxm039
[43] Zheng,G.,Joo,J.和Yang,Y.(2009)。皮尔逊测验、趋势测验和MAX都是不同类型分数的趋势测验。安。嗯。遗传学。73 133-140.
[44] Zheng,G.、Song,K.和Elston,R.C.(2007)。病例对照设计中遗传关联的自适应两阶段分析。哼,来了。63 175至186页。
[45] Zheng,G.、Meyer,M.、Li,W.和Yang,Y.(2008)。病例对照遗传关联研究的两阶段分析比较。统计医学27 5054-5075·数字对象标识代码:10.1002/sim.3336
[46] Zheng,G.,Joo,J.,Tian,X.,Wu,C.O.,Lin,J.-P.,Stylianou,M.,Waclawtw,M.A.和Geller N.L.(2009)。使用病例对照设计进行稳健的全基因组扫描和遗传模型选择。Stat.Interface(纪念Joseph Gastwirth的特刊)2 145-151·Zbl 1245.62167号 ·doi:10.4310/SII.2009.v2.n2.a4
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。