×

数量性状遗传关联研究的稳健无分布检验。 (英语) 兹比尔1330.92011

摘要:在数量性状的关联研究中,每个遗传标记与感兴趣性状的关联通常采用假设加性遗传模型的F检验进行检验。实际上,真正的模型很少为人所知,指定不正确的模型可能会导致功率损失。对于病例对照研究,加性模型、显性模型和隐性模型的最优检验统计量的最大值已被证明对模型错误指定具有鲁棒性。该方法后来被扩展到数量性状。然而,现有的程序假设特征是正态分布的,可能不会保持正确的I型错误率,并且当违反正态假设时,也可能会降低功率。这里,我们介绍了一种基于秩的最大值(MAX3)测试,因此它是无分布的。我们使用蒙特卡罗模拟对正态和非正态数据进行了检验,并将结果与常用参数程序和其他非参数替代方法进行了比较。我们表明,基于秩的最大值检验相对于其他检验具有良好的性能,特别是在对称分布具有重尾的情况下。我们用对称二甲基精氨酸(SDMA)实际关联研究的数据说明了该方法。

MSC公司:

92B15号机组 普通生物统计学
62F03型 参数假设检验
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abelson,R.P.和J.W.Tukey(1963):“定量分析中非数值信息的有效利用:一般理论和简单顺序的情况”,《数学年鉴》。统计,34,1347-1369·Zbl 0121.13907号
[2] Akritas,M.G.,S.F.Arnold和E.Brunner(1997):“不平衡析因设计的非参数假设和秩统计”,《美国统计协会杂志》,92,258-265·Zbl 0890.62038号
[3] Armitage,P.(1955):“比例和频率的线性趋势测试”,《生物计量学》,第11375-386页。;
[4] Bagos,P.G.(2013):“全基因组关联研究中的遗传模型选择:稳健方法和荟萃分析的使用”,《统计应用》。遗传学。分子生物学。,12, 285-308.;
[5] Balding,D.J.(2006):《人口关联研究的统计方法教程》,《自然评论遗传学》。,7, 781-791.;
[6] Barlow,R.E.,D.J.Bartholomew,J.M.Bremner和H.D.Brunk(1972):次序限制下的统计推断。等张回归的理论与应用,纽约:Wiley·兹比尔0246.62038
[7] Beasley,T.M.,S.Erickson和D.B.Allison(2009):“基于秩的反正规变换越来越多地被使用,但它们值得吗?”Behav。遗传学。,39, 580-595.;
[8] Blom,G.(1958):《统计估计和转换贝塔变量》,纽约:威利出版社·Zbl 0086.34501号
[9] Bode-Böger,S.M.,F.Scalera,J.T.Kielstein,J.Martens-Lobenhoffer,G.Breithardt,M.Fobker和H.Reinecke(2006):“对称二甲基精氨酸:肾功能和冠状动脉疾病程度的新组合参数”,J.Am.Soc.Nephrol。,17, 1128-1134.;
[10] Box,G.E.P.和D.R.Cox(1964):“转换分析”,J.R.Stat.Soc.B,26,211-252·兹伯利0156.40104
[11] Chacko,V.J.(1963):“有序替代品的同质性测试”,《数学年鉴》。统计人员。,34, 945-956.; ·Zbl 0116.11104号
[12] Chernoff,H.和I.R.Savage(1958):“某些非参数检验统计的渐近正态性和效率”,《数学年鉴》。统计,29972-994·Zbl 0092.36501号
[13] Cochran,W.G.(1954年):“加强普通四分法测试的一些方法”,《生物统计学》,第10417-451页·Zbl 0059.12803号
[14] Cordell,H.J.(2009):“检测人类疾病背后的基因-基因相互作用”,《自然评论遗传学》。,10, 392-404.;
[15] Fligner,M.A.和D.A.Wolfe(1982):“比较几种治疗方法与对照的无分布试验”,《国家统计》。,36, 119-127.; ·Zbl 0487.62035号
[16] Freidlin,B.、M.J.Podgor和J.L.Gastwirth(1999):“生存率或有序分类数据的有效稳健测试”,《生物计量学》,55,883-886·Zbl 1059.62604号
[17] Freidlin,B.、G.Zheng、Z.Li和J.L.Gastwirth(2002):“遗传标记病例对照研究的趋势检验:功效、样本量和稳健性”,Hum.Hered。,53, 146-152.;
[18] Gastwirth,J.L.(1985):“在结合列联表和生存分析中使用最大最小效率稳健检验”,《美国统计协会期刊》,80,380-384·Zbl 0573.62042号
[19] González,J.R.,J.L.Carrasco,F.Dudbridge,L.Armengol,X.Estivill和V.Moreno(2008):“最大化遗传模型的关联统计”,Genet。流行病。,32, 246-254.;
[20] Hindorff,L.A.、P.Sethupathy、H.A.Junkins、E.M.Ramos、J.P.Mehta、F.S.Collins和T.A.Manolio(2009):“人类疾病和特征全基因组关联位点的潜在病因学和功能意义”,Proc。国家。阿卡德。科学。美国,1069362-9367。;
[21] Hodges,J.L.,Jr.和E.L.Lehmann(1960):“正常分数和Wilcoxon测试的比较”,Proc。伯克利第四交响乐团。数学方面。统计师。以及Probe。,第1卷(加州大学出版社,1961年),307-317。;
[22] Illig,T.,C.Gieger,G.Zhai,W.Römisch-Margl,R.Wang-Sattler,C,Prehn,E,Altmaier,G.Kastenmüller,B.S.Kato,H.W.Mewes,T.Meitinger,M.H.de Angelis,F.Kronenberg,N.Soranzo,H.E.Wichmann,T.D.Spector,J.Adamski和K.Suhre(2010):“人类代谢中遗传变异的全基因组视角”,《自然遗传学》。,42, 137-141.;
[23] Jonckheere,A.R.(1954):“有序替代品的无分布k样本检验”,《生物特征》,41,133-145·Zbl 0058.35304号
[24] Joo,J.,M.Kwak,K.Ahn和G.Zheng(2009):“威康信托病例控制联盟的一项稳健的全基因组扫描统计数据”,生物计量学,6511115-1122·Zbl 1180.62171号
[25] Joo,J.、M.Kwak、Z.Chen和G.Zheng(2010):“遗传模型不确定性下遗传连锁和关联研究的效率稳健统计”,《统计医学》,29,158-180。;
[26] Kettunen,J.、T.Tukiainen、A.P.Sarin、A.Ortega-Alonso、E.Tikkanen、L.P.Lyytikäinen、A.J.Kangas、P.Soininen、P.Würtz、K.Silander、D.M.Dick、R.J.Rose、M.J.Savolainen、J.Viikari、M.Kähönen、T.Lehtimäki、K.h.Pietiläineon、M.Inouye、M.I.McCarthy、A.Jula、J.Eriksson、O.T.Raitakakabari、V.Salomaa、J.Kaprio、M.R。Järvelin,L.Peltonen,M.Perola,N.B.Freimer,M.Ala-Korpela,A.Palotie和S.Ripatti(2012):“基因组关联研究确定了影响人类血清代谢物水平的多个位点,”《自然遗传学》。,第44269-276页。;
[27] Knoke,J.D.(1991):“比较随机研究中的变化与基线值可能存在误差的协方差的非参数分析”,《生物计量学》,47(2),523-533。;
[28] Kozlitina,J.(2008):“遗传关联研究分析趋势测试”,南方卫理公会大学未发表论文。;
[29] Kozlitina,J.、C.Xing、A.Pertsemlidis和W.R.Schucany(2010):“固定和随机基因型频率的遗传关联研究的力量”,《人类遗传学年鉴》。,74, 429-438.;
[30] Lehmann,E.L.(1975):非参数:基于等级的统计方法,霍登·戴伊:旧金山·Zbl 0354.62038号
[31] Lettre,G.、C.Lange和J.N.Hirschorn(2007):“数量性状基于人群的关联研究中的遗传模型测试和统计能力”,《遗传学》。流行病。,31, 358-362.;
[32] Li,Q.,G.Zheng,Z.Li和K.Yu(2008):“相关检验最大值P值的有效近似,及其在全基因组关联研究中的应用”,《人类遗传学年鉴》。,72, 397-406.;
[33] Maher,B.(2008):“个人基因组:缺失遗传力的案例”,《自然》,456,18-21。;
[34] Manolio,T.A.,F.S.Collins,N.J.Cox,D.B.Goldstein,L.A.Hindorff,D.J.Hunter,M.I.McCarthy,E.M.Ramos,L.R.Cardon,A.Chakravarti,J.H.Cho,A.E.Guttmache,A.Kong,L.Kruglyak,E.Mardis,C.N.Rotimi,M.Slatkin,D.Valle,A.S.Whittemore,M.Boehnke,A.G.Clark,E.Eichler,G.Gibson,J.L.Haines,T.F.Mackay,S.A。McCarroll和P.M.Visscher(2009):“寻找复杂疾病的缺失遗传力”,《自然》,461747-753。;
[35] Neuhäuser,M.、P.-Y.Liu和L.A.Hothorn(1998):“趋势的非参数检验:Jonckheere检验、修正和最大值检验”,《生物》。J.,第40页,第899-909页·Zbl 0942.62053号
[36] Noether,G.E.(1955):“关于皮特曼定理”,《数学年鉴》。统计,26,64-68·Zbl 0066.12001
[37] O'Donnell,C.J.,M.Kavousi,A.V.Smith,S.L.Kardia,M.F.Feitosa,S.J.Hwang,Y.V.Sun,M.A.Province,T.Aspelund,A.Dehhan,U.Hoffmann,L.F.Bielak,Q.Zhang,G.Eiriksdottir,C.M.van Duijn,C.S.Fox,M.de Andrade,A.T.Kraja,S.Sigurdsson,S.E.Elias-Smale,J.Murabito,L.J.Launer,A.van der Lugt,S.Ka;心血管造影协会,G.P.Krestin,D.M.Herrington,T.D.Howard,Y.Liu,W.Post,B.D.Mitchell,J.R.O'Connell,H.Shen,A.R.Shuldiner,D.Altshuler,R.Elosua,V.Salomaa,S.M.Schwartz,D.S.Siscovick,B.F.Voight,J.C.Bis,N.L.Glazer,B.M.Psaty,E.Boerwinkle,G.Heiss,S.Blankenberg,T.Zeller,P.S.Wild,R.B.Schnabel,A.Schillert、A.Ziegler、T.F.Münzel、C.C.White、J.I.Rotter、M.Nalls、M.Oudkerk、A.D.Johnson、A.B.Newman、A.G.Uitterlinden、J.M.Massaro、J.Cunningham、T.B.Harris、A.Hofman、P.A.Peyser、I.B.Borecki、L.A.Cupples、V.Gudnason和J.C.Witteman(2011):“心肌梗死患者冠状动脉钙化与随访的全基因组关联研究”,《循环》,1242855-2864。;
[38] Pratt,J.W.(1964):“两样本位置问题的一些程序的稳健性”,《美国统计协会期刊》,第59期,第665-680页。;
[39] Purcell,S.,B.Neale,K.Todd-Brown,L.Thomas,M.A.Ferreira,D.Bender,J.Maller,P.Sklar,P.I.de Bakker,M.J.Daly和P.C.Sham(2007年):“PLINK:全基因组关联和基于群体的连锁分析的工具集”,《美国遗传学杂志》。,81, 559-575.;
[40] Qu,L.(2014):“在遗传模型不确定性下,将依赖性F检验结合起来,实现数量性状的稳健关联,”Stat.Appl。遗传学。分子生物学。,13, 123-139.; ·Zbl 1296.92067号
[41] Sasieni,P.D.(1997):“从基因型到基因:样本量加倍”,《生物计量学》,第53期,第1253-1261页·Zbl 0931.62099号
[42] 斯库特里,A.,S.Sanna,W.M.Chen,M.Uda,G.Albai,J.Strait,S.Najjar,R.Nagaraja,M.Orru,G.Usala,M.Dei,S.Lai,A.Maschio,F.Busonero,A.Mulas,G.B.Ehret,A.A.Fink,A.B.Weder,R.S.Cooper,P.Galan,A.Chakravarti,D.Schlesinger,A.Cao,E.Lakatta和G.R.Abecasis(2007)《公共科学图书馆·遗传学》。,3:e115。;
[43] Seppälä,I.、M.E.Kleber、l.P.Lyytikäinen、J.A.Hernesniemi、K.M.Mäkelä、N.Oksala、R.Laaksonen、S.Pilz、A.Tomaschitz、G.Silbernagel、B.O.Boehm、T.B.Grammer、T.Koskinen、M.Juonala、N.Hutri-Kähönen、G.Alfthan、J.S.Viikari、M.Kähonen、O.T.Raitakari、W.März、A.Meinitzer、T.Lehtimäki;AtheroRemo Consortium(2014):“二甲基精氨酸的全基因组关联研究揭示了与心率变异性相关但与总死亡率无关的新型AGXT2变体,”《欧洲心脏杂志》,35,524-531。;
[44] Shorack,G.R.(1967):“在模型I方差分析中对有序备选方案的检验;正态理论和非参数,”Ann.Math。统计人员。,38, 1740-1752.; ·Zbl 0157.48304号
[45] Sladek,R.、G.Rocheleau、J.Rung、C.Dina、L.Shen、D.Serre、P.Boutin、D.Vincent、A.Belisle、S.Hadjadj、B.Balkau、B.Heude、G.Charpentier、T.J.Hudson、A.Montpetit、A.V.Pshezhetsky、M.Prentki、B.I.Posner、D.J.Balding、D.Meyre、C.Polychronakos和P.Froguel(2007):“一项全基因组关联研究确定了2型糖尿病的新风险位点”,《自然》,445881-885。;
[46] 因此,H.C.和P.C.Sham(2011):“不同遗传模型下的稳健关联测试,考虑到二元或数量性状和协变量,”Behav。遗传学。,41, 768-775.;
[47] Suhre,K.,S.Y.Shin,A.K.Petersen,R.P.Mohney,D.Meredith,B.Wägele,E.Altmaier;心血管造影,P.Deloukas,J.Erdmann,E.Grundberg,C.J.Hammond,M.H.de Angelis,G.Kastenmüller,A.Köttgen,F.Kronenberg,M.Mangino,C.Meisinger,T.Meitinger,H.W.Mewes,M.V.Milburn,C.Prehn,J.Raffler,J.S.Ried,W.Römisch-Margl,N.J.Samani,K.S.Small,H.E.Wichmann,G.Zhai,T.Illig,T.D.Spector,J.Adamski,N。Soranzo和C.Gieger(2011):“生物医学和药物研究中的人类代谢个体”,《自然》,47754-60。;
[48] Terpstra,T.J.(1952):“当在一个排名中出现平局时,Kendall检验对趋势的渐近正态性和一致性”,Indagat。数学。,14, 327-333.; ·Zbl 0046.36304号
[49] Tryon,P.V.(1972):“两个样本秩和统计的协方差”,J.Res.Nat.标准局-B.数学。科学。,76B,51-52·Zbl 0302.62023号
[50] van der Waerden,B.L.(1952):“双样本问题及其功效的顺序测试”,Proc。Koninklijke Nederlandse Akademie van Wetenschappen(荷兰)。序列A,55,453-458·Zbl 0048.11802号
[51] Van Eeden,C.(1963):“两种测试的Pitman渐近相对效率与测试统计数据之间的相关系数之间的关系”,《数学年鉴》。统计人员。,34, 1442-1451.; ·Zbl 0128.38505号
[52] Victor,R.G.、R.W.Haley、D.L.Willet、R.M.Peshock、P.C.Vaeth、D.Leonard、M.Basit、R.S.Cooper、V.G.Iannacchione、W.A.Visscher、J.M.Staab和H.H.Hobbs(2004):“达拉斯心脏研究:心血管健康种族差异多学科研究的基于人群的概率样本”,《美国心脏病杂志》。,93, 1473-1480.;
[53] Wang,K.和V.C.Sheffield(2005):“标记-性状关联研究的约束-似然方法”,《美国遗传学杂志》。,77, 768-780.;
[54] Wang,Z.,W.H.Tang,L.Cho,D.M.Brennan和S.L.Hazen(2009):“精氨酸甲基化和心血管风险的靶向代谢组学评估:一氧化氮合酶抑制之外的潜在机制,”Arterioscler。血栓。瓦斯克。《生物学》,第29期,1383-1391页。;
[55] Wellcome Trust Case Control Consortium(2007年):“七种常见疾病14000例和3000例共享控制的全基因组关联研究”,《自然》,447661-678。;
[56] Zang,Y.,W.K.Fung和G.Zheng(2010):“在R的病例对照遗传关联研究中计算稳健检验的渐近零分布的简单算法”,《统计软件》,33,1-24。;
[57] Zheng,G.和Z.Chen(2005):“当干扰参数仅存在于替代项下时,假设检验的最大统计值比较”,《生物计量学》,61,254-258。;
[58] Zheng,G.,B.Freidlin,Z.Li和J.L.Gastwirth(2003):“候选基因关联病例对照研究趋势测试中的分数选择”,生物。J.,第45页,第335-348页·Zbl 1441.62553号
[59] Zheng,G.,B.Freidlin和J.L.Gastwirth(2006):“使用病例对照研究对基因关联的稳健测试进行比较”,IMS演讲稿-专题系列,第二届莱曼研讨会-最优化,49,253-265·Zbl 1268.62145号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。