×

个体单倍型问题MEC/GI的实用精确算法。 (英语) Zbl 1191.68841号

摘要:单倍体在复杂疾病的遗传关联研究中发挥着重要作用。最近,有助于确定人类单倍型的计算技术得到了广泛研究。考虑到基因型和个体的对齐单核苷酸多态性(SNP)片段,利用基因型信息进行最小误差校正(MEC/GI)是一个重要的计算模型,可以通过校正给定SNP片段中的最小SNP数来推断与基因型兼容的一对单倍型。MEC/GI问题已经被证明是NP-hard问题,目前还没有实用的精确算法。尽管分子生物学技术进步迅速,但现代高通量测序仪无法直接测序含有1200多个核苷酸碱基的DNA片段。在SNP密度较低的情况下,现有数据表明,DNA片段覆盖的SNP位点的数量(k)通常小于10个。基于上述事实,我们开发了一种新的运行时间为(O(mk2^{k}+m\log m+mk)的动态规划算法,其中(m\)是片段数。由于在实际生物应用中,\(k)很小,因此该算法实用高效。

MSC公司:

68周05 非数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Wang,D.G.,Fan,J.B.,Siao,C.J.,:人类基因组中单核苷酸多态性的大规模鉴定、绘图和基因分型。《科学》280(5366),1077–1082(1998)·doi:10.1126/science.280.5366.1077
[2] Stephens,J.C.、Schneider,J.A.、Tanguay,D.A.:313个人类基因的单倍型变异和连锁不平衡。《科学》293(5529),489–493(2001)·doi:10.1212/科学.1059431
[3] Zhang,X.S.,Wang,R.S.,Wu,L.Y.,Chen,L.:单倍型问题的模型和算法。货币。生物信息。1(1), 105–114 (2006) ·doi:10.2174/157489306775330570
[4] Lancia,G.、Bafna,V.、Istrail,S.、Lippert,R.、Schwartz,R.:SNP问题、复杂性和算法。收录人:Meyer,F.(编辑)Proc。欧洲交响乐团。算法(ESA)。计算机科学课堂讲稿,第2191卷,第182-193页。施普林格,柏林(2001)·Zbl 1016.92023号
[5] Gusfield,D.:单倍型推断的组合方法概述。收录:Istrail,S.、Waterman,M.S.、Clark,A.G.(编辑)第一届RECOMB卫星SNP和单倍型推断计算方法研讨会。计算机科学课堂讲稿,第2983卷,第9-25页。施普林格,柏林(2004)·Zbl 1131.92347号
[6] Xie,M.,Chen,J.,Wang,J.:个体单倍型问题的参数化算法研究。J.生物信息。计算。生物学5(3),795–816(2007)·doi:10.1142/S0219720007002710
[7] Xie,M.,Wang,J.:一种改进的(实用的)参数化算法,用于带有mate-pairs的个体单倍型问题MFR。《算法》52(2),250–266(2008)·Zbl 1173.68834号 ·doi:10.1007/s00453-007-9150-2
[8] Lippert,R.、Schwartz,R.,Lancia,G.、Istrail,S.:单核苷酸多态性单倍型组装问题的算法策略。简介。生物信息。3(1), 1–9 (2002) ·doi:10.1093/bib/3.1.23
[9] Wang,R.S.,Wu,L.Y.,Li,Z.P.,Zhang,X.S.:通过最小误差校正从SNP片段进行单体型重建。生物信息学21(10),2456–2462(2005)·doi:10.1093/生物信息学/bti352
[10] Zhang,X.、Wang,R.、Wu,L.、Zhang、W.:来自SNP片段和相关基因型的最小冲突个体单倍型。进化。生物信息。2, 271–280 (2006)
[11] Downey,R.,Fellows,M.:参数化复杂性。柏林施普林格(1999)
[12] Chen,J.:参数化计算和复杂性:处理NP-hardness的新方法。J.计算。科学。Technol公司。20(1), 18–37 (2005) ·Zbl 1258.68065号 ·doi:10.1007/s11390-005-0003-7
[13] 国际SNP图谱工作组:包含142万个单核苷酸多态性的人类基因组序列变异图谱。自然409(6822),928–933(2001)·doi:10.1038/35057149
[14] Sanger,F.、Nicklen,S.、Coulson,A.R.:用链终止抑制剂进行DNA测序。程序。国家。阿卡德。科学。74(12), 5463–5467 (1977) ·doi:10.1073/pnas.74.12.5463
[15] Gabriel,S.B.,Schaffner,S.F.,Nguyen,H.:人类基因组中单倍型块的结构。《科学》296(5576),2225-2229(2002)·数字对象标识代码:10.1126/science.1069424
[16] Hinds,D.A.、Stuve,L.L.、Nilsen,G.B.:三个人类群体中常见DNA变异的全基因组模式。《科学》307(5712),1072-1079(2005)·doi:10.1126/科学.1105436
[17] 国际单体型图联盟:人类基因组的单倍型图。《自然》437(7063),1299–1320(2005)·doi:10.1038/nature04226
[18] Hüffner,F.:最优图两分法的算法工程。收录:Nikoletseas,S.E.(编辑)Proc。美国。计算机科学课堂讲稿,第3503卷,第240-252页。柏林施普林格出版社(2005)·Zbl 1121.68459号
[19] Panconesi,A.,Sozio,M.:快速兔子:单个SNP单倍型重建的快速启发式方法。收录:Jonassen,I.,Kim,J.(编辑)Proc。WABI公司。计算机科学课堂讲稿,第3240卷,第266-277页。施普林格,柏林(2004)
[20] Myers,G.:全基因组鸟枪测序的数据集生成器。收录:Lengauer,T.、Schneider,R.、Bork,P.(编辑)Proc。ISMB,第202-210页。AAAI出版社,门罗公园(1999)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。