×

存在外部协变量时基于树的数量性状映射。 (英语) Zbl 1360.92015年

摘要:生物和生物医学科学的一个中心目标是确定形态和行为特征变异的分子基础。在过去的十年中,测序技术的改进以及关联映射方法的积极发展使得将单核苷酸多态性(SNP)与数量性状联系起来成为可能。然而,现有方法的一个主要局限性是,它们通常无法考虑复杂但生物真实的场景。先前的工作表明,通过使用每个SNP内的进化历史来估计随机样本个体之间的协方差结构,可以提高关联映射方法的性能。在这里,我们提出了一种方法,该方法可以用于分析各种数据类型,例如包括外部协变量的数据,同时考虑SNP之间的进化历史,从而提供了比现有方法更好的优势。现有的方法要么以计算成本为代价,要么无法完全建模这些关系。通过考虑SNP之间的宽尺度关系,该方法在计算上是可行的,并且受SNP之间进化历史的影响。我们表明,在分析复杂数据集时加入近似协方差结构可以提高数量性状映射的性能,并将该方法应用于鹿-小鼠数据。

MSC公司:

92B15号机组 普通生物统计学
第62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Balding,D.J.(2006):《人口关联研究的统计方法教程》,《自然评论遗传学》。,7, 781-791.; Balding,D.J.,《人口关联研究统计方法教程》,《自然遗传学评论》。,7, 781-791 (2006)
[2] Besenbacher,S.,T.Mailund和M.H.Schierup(2009):“数量性状的局部系统发育图:在全基因组扫描中比单标记关联更高的准确性和更好的排名”,《遗传学》,181,747-753。;贝森巴赫,S。;梅隆,T。;Schierup,M.H.,数量性状的局部系统发育图:在全基因组扫描中比单标记关联更高的准确性和更好的排名,遗传学,181,747-753(2009)
[3] Browning,S.R.和B.L.Browning(2007):“使用局部单倍型聚类对全基因组关联研究进行快速准确的单倍型定相和缺失数据推断”,《美国遗传学杂志》。,81, 1084-1097.; Browning,S.R。;Browning,B.L.,《使用局部单倍型聚类进行全基因组关联研究的快速准确单倍型定相和缺失数据推断》,美国人类遗传学杂志。,81, 1084-1097 (2007) ·Zbl 0960.92021号
[4] Domingues,V.S.,Y.-P.Poh,B.K.Peterson,P.S.Pennings,J.D.Jensen和H.E.Hoekstra(2012):“海滩鼠年轻种群祖先变异适应的证据”,《进化》,66,3209-3223。;多明格斯,V.S。;波,Y.-P。;彼得森,B.K。;彭宁斯,P.S。;Jensen,J.D。;Hoekstra,H.E.,海滩鼠年轻种群祖先变异适应的证据,进化,663209-3223(2012)
[5] González,J.R.,L.Armengol,X.Solé,E.Guinó,J.M.Mercader,X.Estivill和V.Moreno(2007):“SNPassoc:执行全基因组关联研究的R包”,生物信息学,23644-645。;González,J.R。;Armengol,L。;Solé,X。;Guinó,E。;Mercader,J.M。;Estivill,X。;Moreno,V.,SNPassoc:进行全基因组关联研究的R包,生物信息学,23444-645(2007)
[6] Guan,Y.和M.Stephens(2011):“全基因组关联研究和其他大规模问题的贝叶斯变量选择回归”,Ann.Appl。统计,1780-1815年。;关,Y。;Stephens,M.,《全基因组关联研究和其他大规模问题的贝叶斯变量选择回归》,Ann.Appl。统计,51780-1815(2011)·Zbl 1229.62145号
[7] Hirschhorn,J.N.和M.J.Daly(2005):“常见疾病和复杂性状的全基因组关联研究”,《自然评论遗传学》。,6, 95-108.; Hirschorn,J.N。;Daly,M.J.,《常见疾病和复杂性状的全基因组关联研究》,《国家遗传学评论》。,6, 95-108 (2005)
[8] Hudson,R.R.(2002):“在赖特-菲舍遗传变异中性模型下生成样本”,《生物信息学》,第18337-338页。;Hudson,R.R.,在赖特-菲舍遗传变异中性模型下生成样本,生物信息学,18337-338(2002)
[9] Kang,H.M.,J.H.Sul,S.K.Service,N.A.Zaitlen,S.Kong,N.B.Freimer,C.Sabatti和E.Eskin(2010):“解释全基因组关联研究中样本结构的方差分量模型,”自然遗传学。,42, 348-354.; Kang,H.M。;Sul,J.H。;服务,S.K。;Zaitlen,N.A。;孔,S。;Freimer,N.B。;萨巴蒂,C。;Eskin,E.,《解释全基因组关联研究中样本结构的方差分量模型》,《自然遗传学》。,42348-354(2010年)
[10] Kass,R.E.和A.E.Raftery(1995):“贝叶斯因素”,《美国统计杂志》。协会,90,773-795。;Kass,R.E。;Raftery,A.E.,Bayes factors,J.Am.Statist。协会,90,773-795(1995)·Zbl 0846.62028号
[11] King,C.R.、P.J.Rathouz和D.L.Nicolae(2010):“重新排序研究中关联测试的进化框架”,《公共科学图书馆·遗传学》。,6,e1001202。;金,C.R。;Rathouz,P.J。;Nicolae,D.L.,《重新排序研究中关联测试的进化框架》,《公共科学图书馆·遗传学》。,6,e1001202(2010)
[12] Laird,N.、S.Horvath和X.Xu(2000):“对基于家庭的关联测试实施统一方法”,Genet。流行病。,19,S36-S42。;莱尔德,N。;Horvath,S。;Xu,X.,实施基于家庭的联合测试的统一方法,Genet。流行病。,19,S36-S42(2000)
[13] Linnen,C.R.,E.P.Kingsley,J.D.Jensen和H.E.Hoekstra(2009):“关于鹿鼠中适应性等位基因的起源和传播”,《科学》,3251095-1098。;Linnen,C.R。;Kingsley,E.P。;詹森,J.D。;Hoekstra,H.E.,《关于鹿鼠适应性等位基因的起源和传播》,《科学》,3251095-1098(2009)
[14] Linnen,C.R.,Y.-P.Poh,B.K.Peterson,R.D.H.Barrett,J.G.Larson,J.D.Jensen和H.E.Hoekstra(2013):“通过单个基因的多重突变实现多性状的适应性进化”,《科学》,339,1312-1316。;Linnen,C.R。;波,Y.-P。;彼得森,B.K。;Barrett,R.D.H。;拉尔森·J·G。;Jensen,J.D。;Hoekstra,H.E.,通过单个基因的多个突变实现多个性状的适应性进化,科学,339,1312-1316(2013)
[15] Lynch,M.和B.Walsh(Ed.)(1998年):遗传学和数量性状分析,第26章。美国马萨诸塞州桑德兰:Sinauer Associates,Inc。;林奇,M。;Walsh,B.,《遗传学与数量性状分析》,第26章(1998年)
[16] Mailund,T.、S.Besenbacher和M.H.Schierup(2006):“通过不相容性和局部完美系统发育进行全基因组关联绘图”,BMC Bioninform。,7, 454.; 梅隆,T。;贝森巴赫,S。;Schierup,M.H.,通过不亲和性和局部完美系统发育进行全基因组关联绘图,BMC Bioninform。,7, 454 (2006)
[17] Moore,J.H.,F.W.Asselbergs和S.M.Williams(2010):“全基因组关联研究的生物信息学挑战”,生物信息学,26,445-455。;摩尔,J.H。;阿瑟伯格,F.W。;Williams,S.M.,《全基因组关联研究的生物信息学挑战》,生物信息学,26,445-455(2010)
[18] Naylor,M.G.,S.T.Weiss和C.Lange(2010):“用贝叶斯方法对基于家庭的设计进行遗传关联研究”,《遗传学》。流行病。,34, 569-574.; Naylor,M.G。;Weiss,S.T。;Lange,C.,用贝叶斯方法对基于家族的设计进行遗传关联研究,Genet。流行病。,34, 569-574 (2010)
[19] Newton,M.A.和A.E.Raftery(1994):“加权似然自举的近似贝叶斯推断”,J.R.Stat.Soc.系列B Methodol。,56, 3-48.; 牛顿,医学硕士。;Raftery,A.E.,带加权似然自举的近似贝叶斯推断,J.R.Stat.Soc.B系列方法。,56, 3-48 (1994) ·Zbl 0788.62026号
[20] Ott,J.、Y.Kamatani和M.Lathrop(2011):“全基因组关联研究的基于家族的设计”,《自然遗传学评论》。,12, 465-474.; 奥特·J。;Kamatani,Y。;Lathrop,M.,《全基因组关联研究的基于家族的设计》,《自然遗传学评论》。,12, 465-474 (2011)
[21] Pan,F.、L.McMillan、F.Pardo-Manuel de Villena、D.Threadgill和W.Wang(2009):“TreeQA”:使用局部完美系统发育树进行定量基因组关联映射,Pac。交响乐团。生物成分。,415-426.; 潘,F。;麦克米兰,L。;巴多·马努埃尔·德维莱纳(Pardo-Manuel de Villena),F。;Threadgill,D。;Wang,W.,“TreeQA”:使用局部完美系统发育树进行定量全基因组关联绘图,Pac。交响乐团。生物计算。,415-426 (2009)
[22] Patterson,N.、A.L.Price和D.Reich(2006):“人口结构和特征分析”,《公共科学图书馆·遗传学》。,2,e190。;帕特森,N。;价格,A.L。;Reich,D.,人口结构和特征分析,公共科学图书馆遗传学。,2,e190(2006)
[23] Purcell,S.,B.Neale,K.Todd-Brown,L.Thomas,M.A.Ferreira,D.Bender,J.Maller,P.Sklar,P.I.de Bakker,M.J.Daly和P.C.Sham(2007):“PLINK”:全基因组关联和基于群体的连锁分析的工具集,美国人类遗传学杂志。,81, 559-575.; Purcell,S。;Neale,B。;托德·布朗,K。;托马斯。;费雷拉,硕士。;本德,D。;Maller,J。;Sklar,P。;de Bakker,P.I。;Daly,M.J。;Sham,P.C.,“PLINK”:全基因组关联和基于人群的连锁分析的工具集,美国人类遗传学杂志。,81, 559-575 (2007)
[24] Ried,J.S.,A.Döring,K.Oexle,C.Meisinger,J.Winkelmann,N.Klopp,T.Meitinger,A.Peters,K.Suhre,H.-E.Wichmann和C.Gieger(2012):“PSEA:”表型集富集分析——多表型分析的新方法,遗传流行病学。,36, 244-252.; Ried,J.S。;Döring,A。;Oexle,K。;梅辛格,C。;温克尔曼,J。;北卡罗来纳州科洛普。;梅廷格,T。;彼得斯,A。;苏赫里,K。;Wichmann,H.-E。;Gieger,C.,“PSEA:”表型集富集分析——一种分析多种表型的新方法,《遗传流行病学》。,36, 244-252 (2012)
[25] Rogers,J.S.和D.L.Swofford(1998):“从核苷酸序列近似系统发育树最大可能性的快速方法”,系统。生物学,47,77-89。;罗杰斯,J.S。;Swofford,D.L.,从核苷酸序列近似系统发育树最大可能性的快速方法,系统。《生物学》,47,77-89(1998)
[26] Schaid,D.J.,C.M.Rowland,D.E.Tines,R.M.Jacobson和G.A.Poland(2002):“连锁阶段不明确时性状和单倍型之间关联的得分测试”,《美国遗传学杂志》。,70, 425-434.; 沙伊德·D·J。;罗兰,C.M。;Tines,D.E。;雅各布森,R.M。;Poland,G.A.,当连锁阶段不明确时,性状和单倍型之间关联的评分测试,Am.J.Hum.Genet。,70, 425-434 (2002)
[27] Sinnwell,J.P.和D.J.Schaid(2009):单倍型统计分析:连锁阶段不明确时,带有性状和协变量的单倍型,r包版本1.4.4。;辛维尔,J.P。;Schaid,D.J.,单倍体统计:连锁阶段不明确时具有性状和协变量的单倍体的统计分析(2009年)
[28] Solé,X.、E.Guino、J.Valls、R.Iniesta和V.Moreno(2006):“SNPStats”:关联研究分析的网络工具,生物信息学,221928-1929年。;Solé,X。;吉尼奥,E。;瓦尔斯,J。;伊涅斯塔,R。;Moreno,V.,“SNPStats”:关联研究分析的网络工具,生物信息学,221928-1929(2006)
[29] Stephens,M.和D.J.Balding(2009):“遗传关联研究的贝叶斯统计方法”,《自然评论遗传学》。,10, 681-690.; 斯蒂芬斯,M。;Balding,D.J.,遗传关联研究的贝叶斯统计方法,《自然遗传学评论》。,10, 681-690 (2009)
[30] Stranger,B.E.、E.a Stahl和T.Raj(2011):“人类复杂性状遗传学全基因组关联研究的进展和前景”,《遗传学》,187367-383。;《陌生人》,B.E。;a斯塔尔,E。;Raj,T.,人类复杂性状遗传学全基因组关联研究的进展和前景,遗传学,187367-383(2011)
[31] Thompson,K.L.和L.S.Kubatko(2013):“利用祖先信息在全基因组关联研究中检测和定位数量性状位点”,BMC Bioninform。,14, 200.; 汤普森,K.L。;Kubatko,L.S.,《利用祖先信息在全基因组关联研究中检测和定位数量性状位点》,BMC Bioninform。,14, 200 (2013)
[32] Tzeng,J.-Y.,C.-H.Wang,J.-T.Kao和C.K.Xiao(2006):“通过使用基因型对聚集单倍型进行基于回归的关联分析”,《美国遗传学杂志》。,78, 231-242.; Tzeng,J.-Y。;Wang,C.-H。;Kao,J.-T。;Hsiao,C.K.,通过使用基因型对聚类单倍型进行基于回归的关联分析,Am.J.Hum.Genet。,78, 231-242 (2006)
[33] van der Sluis,S.、D.Posthuma和C.V.Dolan(2013):“TATES:全基因组关联研究的有效多元基因型-表型分析”,《公共科学图书馆·遗传学》。,9,e1003235。;van der Sluis,S。;Posthuma,D。;Dolan,C.V.,TATES:全基因组关联研究的高效多元基因型-表型分析,公共科学图书馆遗传学。,9,e1003235(2013)
[34] Wood,S.(Ed.)(2006):广义加性模型:R引言,第6章。美国佛罗里达州博卡拉顿:查普曼和霍尔/CRC。;Wood,S.,《广义加性模型:R简介》,第6章(2006)·Zbl 1087.62082号
[35] Yan,Q.,D.E.Weeks,J.C.Celedón,H.K.Tiwari,B.Li,X.Wang,W.Y.Lin,X.Y.Lou,G.Gao,W.Chen和n.Liu(2015):“用新的核机器回归方法将多变量数量表型与家族样本中的遗传变异相关联”,遗传学,201,1329-1339。;严,Q。;周,D.E。;Celedón,J.C。;香港蒂瓦里。;李,B。;王,X。;Lin,W.-Y。;卢,X.-Y。;高,G。;Chen,W。;Liu,N.,用新的核机器回归方法将家庭样本中的多变量定量表型与遗传变异相关联,遗传学,2011329-1339(2015)
[36] Yu,J.,G.Pressoir,W.H.Briggs,I.V.Bi,M.Yamasaki,J.F.Doebley,M.D.McMullen,B.S.Gaut,D.M.Nielsen,J.B.Holland,S.Kresovich和E.S.Buckler(2006):“一种解释多个相关水平的关联映射的统一混合模型方法,”自然遗传学。,38, 203-208.; Yu,J。;Pressoir,G。;Briggs,W.H。;Bi、I.V。;山崎,M。;Doebley,J.F。;医学博士麦克马伦。;Gaut,B.S。;尼尔森,D.M。;Holland,J.B。;克雷索维奇,S。;Buckler,E.S.,《解释多层次关联性的关联映射统一混合模型方法》,《自然遗传学》。,38, 203-208 (2006)
[37] Zhang,W.,R.Korstanje,J.Thaisz,F.Staedtler,N.Harttman,L.Xu,M.Feng,L.Yanas,H.Yang,W.Valdar,G.A.Churchill和K.DiPetrillo(2012a):“远育小鼠数量性状的基因组关联图”,G3(Bethesda),2167-174。;张伟。;Korstanje,R。;Thaisz,J。;斯塔德勒,F。;北卡罗来纳州哈特曼。;徐,L。;冯,M。;亚纳斯,L。;Yang,H。;瓦尔达尔,W。;丘吉尔,G.A。;DiPetrillo,K.,远交小鼠数量性状的全基因组关联映射,G3(Bethesda),2167-174(2012)
[38] Zhang,Z.,X.Zhang和W.Wang(2012b):“HTreeQA:在基因型数据的数量性状位点研究中使用半完美系统发育树”,G3(Bethesda),2175-189。;张,Z。;张,X。;Wang,W.,HTreeQA:使用半完美系统发育树对基因型数据的数量性状位点进行研究,G3(Bethesda),2175-189(2012)
[39] Zhu,X.,S.Li,R.S.Cooper和R.C.Elston(2008):“家庭和无关样本校正分层的统一关联分析方法”,《美国遗传学杂志》。,82, 352-365.; 朱,X。;李,S。;库珀,R.S。;Elston,R.C.,《家庭和无关样本校正分层的统一关联分析方法》,《美国遗传学杂志》。,82352-365(2008)
[40] Zöllner,S.和J.K.Pritchard(2005):“基于联合的关联映射和复杂性状位点的精细映射”,《遗传学》,1691071-1092。;Zöllner,S。;Pritchard,J.K.,《基于联合的关联映射和复杂性状位点的精细映射》,《遗传学》,1691071-1092(2005)
[41] Zöllner,S.,X.Wen和J.K.Pritchard(2005):“与TreeLD的关联映射和精细映射”,生物信息学,213168-3170。;Zöllner,S。;文,X。;Pritchard,J.K.,与TreeLD的关联映射和精细映射,生物信息学,213168-3170(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。