×

关于使用密集SNP标记数据识别远亲对。 (英语) Zbl 1343.92369号

摘要:最近人们对利用现成的密集基因组扫描标记数据来鉴定亲属产生了兴趣。然而,关于这些数据在实际情况中的信息量有多大,存在着相互矛盾的发现,尤其是在没有具体理由证明所选间距的情况下,经常使用稀疏标记集。我们探讨了密集单核苷酸多态性(SNP)阵列在该应用中的潜在用途,重点是推断远亲对。我们区分关系估计(由连接两个感兴趣的个体的系谱定义)和一般关联性估计(由亲属关系系数或关联性系数提供)。由于我们主要关注的是前一个案例,所以我们采用了系谱似然法。我们考虑了附加SNP和数据对附加类型亲属的影响,以及该亲属的选择对关系推断的影响。我们还考虑了联系不平衡的影响。当总体相关性而非具体关系足够时,我们提出了一种易于实现的近似方法,似乎与流行的基于矩的估计量和最近基于染色体共享的最大似然方法有很好的竞争。我们的结论是,密集的标记数据对远亲来说信息更丰富。然而,联系不平衡不容忽视,它将成为实际数据应用的主要限制因素。

MSC公司:

92D15型 与进化有关的问题
92D10型 遗传学和表观遗传学
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abecasis,G.R。;Cherny,S.S。;世界卫生组织库克森。;Cardon,L.R.,Merlin使用稀疏基因流树快速分析密集遗传图,《自然遗传学》。,30, 97-101 (2002)
[2] 阿贝卡西斯,G.R。;Wigginton,J.E.,《处理标记-标记连锁不平衡:用聚集标记进行系谱分析》,美国人类遗传学杂志。,77, 754-767 (2005)
[3] Almudevar,A.,用于最大似然谱系重建的模拟退火算法,Theor。大众。《生物学》,63,63-75(2003)·兹比尔1104.62115
[4] 巴雷特,J.C。;Fry,B。;Maller,J。;Daly,M.J.,Haploview:LD和单倍型图谱的分析和可视化,生物信息学,21,263-265(2005)
[5] Berkovic,S.F。;迪本斯,L.M。;Oshlack,A。;西尔弗,J.D。;Katereos,M。;Vears,D.F。;吕尔曼·劳赫,R。;布兰兹,J。;张,K.W。;斯坦科维奇,J。;Kalnins,R.N。;道林,J.P。;安德曼,E。;安德曼,F。;Faldini,E。;D’Hooge,R。;瓦德拉穆迪,L。;麦克唐奈尔(R.M.Macdonnell)。;霍奇森,B.L。;Bayly,医学硕士。;Savige,J。;Mulley,J.C。;Smyth,G.K。;功率,D.A。;Saftig,P。;Bahlo,M.,《三名无关受试者基于阵列的基因发现显示SCARB2/LIMP-2缺陷会导致肌阵挛性癫痫和肾小球硬化》,《美国遗传学杂志》。,82, 673-684 (2008)
[6] Blouin,M.S.,基于DNA的自然种群系谱重建和亲属关系分析方法,Trends Ecol。演变。,18, 503-511 (2003)
[7] 伯斯汀,C。;莫林,N.,突变和/或近亲?6个案例工作示例,其中49个常染色体SNP被用作补充标记,法医科学。国际基因。,5, 236-241 (2011)
[8] 布朗宁,B.L。;Browning,S.R.,一种快速、强大的通过血统检测身份的方法,美国人类遗传学杂志。,88, 173-182 (2011)
[9] 布朗宁,S.R。;Browning,B.L.,《无关个体血统身份的高分辨率检测》,《美国遗传学杂志》。,86, 526-539 (2010)
[10] Browning,S.R。;Browning,B.L.,《远亲血统身份识别:检测和应用》,年。修订版Genet。,46, 617-633 (2012)
[11] Choi,Y。;Wijsman,E.M。;Weir,B.S.,未知关系下的病例对照试验,Genet。流行病。,33, 668-678 (2009)
[12] Cirulli,E.T。;Goldstein,D.B.,《通过全基因组测序揭示罕见变异在常见疾病中的作用》,《自然评论:遗传学》。,11, 415-425 (2010)
[13] Cowell,R.G.,高效最大似然系谱重建,Theor。大众。《生物学》,76,4,285-291(2009)·Zbl 1403.92135号
[14] Cowell,R.G.,重建谱系的简单贪婪算法,Theor。大众。生物学,83,55-63(2013)
[15] 库森,J。;Bartlett,M。;琼斯,E.M。;Sheehan,N.A.,使用整数线性规划的最大似然系谱重建,Genet。流行病。,37, 69-83 (2013)
[16] Day-Williams,A.G。;布兰格罗,J。;戴尔,T.D。;兰格,K。;Sobel,E.M.,《没有明确家谱的连锁分析》,遗传学。流行病。,35, 360-370 (2011)
[17] Donnelly,K.P.,Theor,相关个体共享按血统相同的基因组部分的概率。大众。《生物学》,23,34-63(1983)·Zbl 0521.92011号
[18] 埃格兰,T。;莫斯塔德,P.F。;梅沃格,B。;Stenersen,M.,《超越传统亲子关系和身份识别案例》。选择最可能的血统,法医学。国际,110,47-59(2000)
[19] 埃格兰,T。;Sheehan,N.,《关于需要链接标记的识别问题》,《法医学》。国际遗传学。,2, 219-225 (2008)
[20] 法尔基,M。;Fuchsberger,C.,Jenti:挖掘复杂自交系系谱的有效工具,生物信息学,24724-726(2008)
[21] 加布里埃尔,S.B。;沙夫纳,S.F。;Nguyen,H。;摩尔,J.M。;罗伊·J。;Blumenstiel,B。;希金斯,J。;DeFelice,M。;Lochner,A。;费加特,M。;Liu-Cordero,S.N。;Rotimi,C。;阿德耶莫,A。;库珀,R。;Ward,R。;兰德,E.S。;Daly,M.J。;Altshuler,D.,《人类基因组中单倍型块的结构》,《科学》,2962225-2229(2002)
[22] Gazal,S。;Sahbatou,M。;Perdry,H。;莱托,S。;Génin,E。;Leutenger,A.L.,利用desense SNP数据进行诱导系数测定:策略比较和应用于HapMap III,Hum.Hered。,77, 49-62 (2014)
[23] 格拉兹纳,C。;Thompson,E.A.,《通过估计家族间的共同祖先来改进基于家系的连锁分析》,Stat.Appl。遗传学。分子生物学。,11、2(2012),第11条
[24] 古塞夫,A。;Lowe,J.K。;斯托菲尔,M。;Daly,M.J。;Altschuler,D。;布雷斯洛,J.L。;弗里德曼,J.M。;佩尔,I.,《全人群,隐相关的全基因组绘图》,《基因组研究》,19,318-326(2009)
[25] 希尔,W.G。;Weir,B.S.,《孟德尔取样和连锁导致的实际关系变化》,Genet。研究,93,47-74(2011)
[26] 希尔,W.G。;怀特,I.M.S.,从基因组共享中鉴定系谱关系,基因基因组。遗传学。,3, 1553-1571 (2013)
[27] 赫夫,C.D。;威瑟斯彭,D.J。;Simonson,T.S。;Xing,J。;Watkins,W.S。;Zhang,Y。;图希,T.M。;内克拉森,D.W。;伯特·R·W。;Guthery,S.L.公司。;Woodward,S.R。;Jorde,L.B.,最近共同祖先的最大似然估计(ERSA),基因组研究,21768-774(2011)
[28] 扬科维奇,A。;冯霍尔特,B.M。;罗森博格,N.A.,黄石狼的杂合性,摩尔生态。,19, 3246-3249 (2010)
[29] 克林,D。;韦兰德,J。;蒂尔玛,A。;斯卡尔,Ø。;Egeland,T.,DNA微阵列作为建立遗传相关现状和未来前景的工具,《法医学》。国际遗传学。,6, 322-329 (2012)
[30] 埃里克·兰德(Eric S.Lander)。;Green,Philip,《人类多点遗传连锁图的构建》,Proc。国家。阿卡德。科学。美国,84,2363-2367(1987)
[31] 兰格,K。;Papp,J.C。;辛希默,J.S。;Sripracha,R。;周,H。;Sobel,E.M.,Mendel:基因分析程序的瑞士军刀,生物信息学,291568-1570(2013)
[32] 拉鲁,M.V。;加西亚·马加里尼奥斯,M。;菲利普斯,C。;昆特拉,I。;阿拉巴马州卡拉西多。;Salas,A.,利用高密度SNP数据分析缺陷家系中声称的远亲,法医科学。国际遗传学。,6, 350-353 (2012)
[33] Leutenger,A.L。;普鲁姆,B。;Génin,E。;Verny,C。;Lemainque,A。;Clerget-Darpoux,F。;Thompson,E.A.,通过使用基因组数据估计近亲繁殖系数,美国人类遗传学杂志。,73, 516-523 (2003)
[34] 李,H。;Giusman,G。;胡,H。;山蛛形目;卡巴列罗,J。;Hubley,R。;威瑟斯彭,D。;Guthery,S.L。;Mauldin,D.E。;Jorde,L.B。;胡德·L。;罗奇,J.C。;Huff,C.D.,全基因组序列数据的关系估计,PLos遗传学。,10、1、e1004144(2014)
[35] 林奇,M。;Ritland,K.,用分子标记评估成对相关性,遗传学,1521753-1766(1999)
[36] L.R.市长。;Balding,D.J.,《已知母亲基因型时同父异母兄弟姐妹的歧视》,《法医学》。国际,159141-147(2006)
[37] Milligan,B.G.,关联性的最大似然估计,遗传学,1631153-1167(2003)
[38] 宫泽,H。;加藤,M。;阿瓦塔,T。;科达,M。;艾瓦萨,H。;小山,N。;田中,T。;胡群;Kyo,S。;Y.冈崎。;Hagiwara,K.,《纯合子单倍型允许全基因组搜索患者之间共享的常染色体片段》,《美国遗传学杂志》。,80, 1090-1102 (2007)
[39] Morrison,J.,具有种群结构的样本全基因组IBD估计值的特征化和误差校正,Genet。流行病。,37, 635-641 (2013)
[40] 奥特·J。;Kamatani,Y。;Lathrop,M.,《全基因组关联研究的基于家族的设计》,《自然遗传学评论》。,12, 465-474 (2011)
[41] 帕塔罗,C。;马罗尼,F。;Riegler,A。;Mascalzoni博士。;皮克勒,I。;沃尔帕托,C.B。;Dal Cero,美国。;De Grandi,A。;艾格,C。;艾森德尔,A。;富克斯伯格,C。;戈盖尔,M。;佩德罗蒂,S。;平格拉,G.D。;Stefanov,S.A。;Vogl,F.D。;魏德曼,C.J。;梅廷格,T。;Pramstaller,P.P.,《南蒂罗尔MICROS三个群体微分离物的遗传研究:研究设计和流行病学视角》,BMC医学遗传学。,8, 29 (2007)
[42] 彭伯顿,T.J。;王,C。;李,J。;罗森博格,N A,HapMap第三阶段个体间意外遗传关系的推断,美国遗传学杂志。,87, 457-464 (2010)
[43] 菲利普斯,C。;Fondevila,M。;Garcia-Magariños,M。;罗德里格斯,A。;萨拉斯,A。;卡拉西多,A。;Lareu,M.V.,《使用常染色体单核苷酸多态性作为辅助标记,解决显示模糊STR结果的关系测试》,《法医科学》。国际遗传学。,2, 198-204 (2008)
[44] 菲利普斯,C。;加西亚·马加里尼奥斯,M。;萨拉斯,A。;卡拉西多,A.’;Lareu,M.V.,SNP作为简单亲属关系分析的补充或作为远距离配对关系测试的核心标记:SNP何时增加价值或取代公认的强大STR测试?,特兰弗斯。《内科血液疗法》,39,202-210(2012)
[45] 里斯特,M。;Stadler,P.F。;Klemm,K.,FRANz:野生多代系谱的重建,生物信息学,25,2134-2139(2009)
[46] 新泽西州希恩。;巴特利特,M。;Cussens,J.,《改进复杂多代系谱的最大似然重建》,Theor。大众。生物学,97,11-19(2014)·兹比尔1303.92085
[47] 新泽西州希恩。;Egeland,T.,关系识别问题中先验信息的结构化整合,Ann.Hum.Genet。,71, 501-518 (2007)
[48] Sieberts,S.K。;Wijsman,E.M。;汤普森,E.A.,在存在打字错误的情况下从三个人中进行的关系推断,《美国遗传学杂志》。,70, 170-180 (2002)
[49] 斯卡尔,Ø。;Sheehan,N。;埃格兰,T.,《远距离家族关系的识别》,生物信息学,252376-2382(2009)
[50] 速度,D。;Balding,D.J.,《后基因组时代的相关性:它仍然有用吗?》?,自然版本:Genet。,16, 33-44 (2015)
[51] 史泰普斯,J。;Nickerson,D.A。;下面,J.E.,利用图论选择最大的无关个体集进行遗传分析,Genet。流行病。,37, 136-141 (2013)
[52] Taliun,D。;Gamper,J。;Pattaro,C.,非常长和密集遗传序列的高效单倍型块识别,BMC生物信息学,15(2014),第10条
[53] 汤普森,E.A.,家谱结构推断,社会科学。Inf.,15,477-526(1976)
[54] Thompson,E.A.,《按血统鉴定:减数分裂中的变异,跨基因组和群体》,《遗传学》,194,301-326(2013)
[55] 汤普森,E.A。;Meagher,T.R.,成对关系估计中的遗传连锁,Theor。申请。遗传学。,97, 857-864 (1998)
[56] 桑顿,T。;McPeek,M.S.,ROADTRIPS:部分或完全未知人群和系谱结构的病例对照关联测试,美国遗传学杂志。,86, 172-184 (2010)
[57] Wang,J.,三元IBD系数及其在估计两两相关性中的应用,Genet。Res.弧度。,89, 135-153 (2007)
[58] Wang,J.,基于标记的亲缘关系和近亲繁殖系数估计:作为当前方法的评估,J.Evol。生物学,27118-530(2014)
[59] Weir,B.S。;安德森,A.D。;Hepler,A.B.,《遗传相关性分析:现代数据和新挑战》,自然科学出版社。,7, 771-780 (2006)
[60] Wijsman,E.M.,《大谱系在高通量测序时代的作用》,Hum.Genet。,131, 1555-1563 (2012)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。