×

示例或匹配:用不相等的基因组数据建模DCJ问题。 (英语) Zbl 1356.90131号

小结:DCJ模型下的编辑距离可以用线性时间计算,用于具有相同内容的基因组或使用Indels。但它变成了NP公司-在存在重复的情况下很难解决,这是一个基本上没有解决的问题,尤其是当考虑Indels(即插入和删除)时。本文比较了两种主流的处理重复的方法,并将它们与索引关联起来:一种是通过删除,即DCJ-Indel-Emplar距离;与另一个通过基因匹配,即DCJ-Indel-matching距离。我们使用一组优化方法设计分枝定界算法,以计算两者的精确距离。此外,结合这两种距离方法讨论了中值问题,这两种方法都是为了找到一个中值基因组,使其自身与三个给定基因组之间的距离最小化。Lin-Kernighan启发式被子图分解和搜索空间缩减技术所利用和支持,以处理中值计算。在合成数据集和实际数据集上进行了大量实验,以展示这两个距离度量本身的优缺点,并将其置于中值计算场景中。

理学硕士:

90C27型 组合优化
90C57型 多面体组合学,分支与绑定,分支与切割
90 C59 数学规划中的近似方法和启发式
90 C90 数学规划的应用

软件:

气体
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Angibaud S,Fertin G,Rusu I,Thévenin A,Vialette S(2009)《关于用重复序列比较基因组的近似性》。J.图形算法应用。13(1):19-53 ·兹比尔1170.68049 ·doi:10.7155/jgaa.00175
[2] Bader DA,Moret BME,Yan M(2001)一种线性时间算法,用于计算符号置换之间的反转距离,并进行了实验研究。计算机生物学杂志8:483-491·Zbl 0997.68527号 ·doi:10.1089/106652701753216503
[3] Bafna V,Pevzner PA(1998),《换位排序》。SIAM J离散数学11(2):224-240·Zbl 0973.92014号 ·doi:10.1137/S089548019528280X
[4] Bergeron A,Mixstaki J,Stoye J(2005)《关于易位排序》。摘自:《计算生物学杂志》。施普林格,海德堡,第615-629页·Zbl 1119.92312号
[5] Blin G,Chauve C,Fertin G(2004)有符号序列的断点距离。摘自:《CompBioNets 2004年学报》。算法中的文本。伦敦国王学院,第3-16页
[6] Bourque G,Pevzner PA(2002)《基因组进化:重建祖先物种的基因顺序》。基因组研究12(1):26-36
[7] Braga MDV、Willing E、Stoye J(2010)《DCJ和indels的基因组距离》。摘自:第十届生物信息学算法国际会议论文集,WABI’10。柏林/海德堡施普林格,第90-101页
[8] Brewer C,Holloway S,Zawalnyski P,Schinzel A,FitzPatrick D(1999)畸形的染色体复制图:人类单倍体和三倍体疑似区域和节段非整倍体耐受性。《美国人类遗传学杂志》64卷(6期):1702-1708·doi:10.1086/302410
[9] Caprara A(2003)反转中值问题。信息J计算15(1):93-113·Zbl 1238.90099号 ·doi:10.1287/ijoc.15.1.93.15155
[10] Chauve C、Fertin G、Rizzi R、Vialette S(2006)含有重复序列的基因组很难进行比较。摘自:LNCS生物信息学研究与应用国际研讨会论文集。斯普林格,雷丁,第783-790页·Zbl 1155.68395号
[11] Chen X,Zheng J,Fu Z,Nan P,Zhong Y,Lonardi S,Jiang T(2005)通过基因组重排分配同源基因。IEEE/ACM Trans-Comput生物信息2(4):302-315·doi:10.1109/TCBB.2005.48
[12] Chen Z,Fu B,Zhu B(2012)勘误表:样本断点距离问题的近似性。输入:一汽-美国汽车工业协会。海德堡施普林格,第368页·Zbl 1303.92069号
[13] Compeau PEC(2012)DCJ-indel距离的简化视图。摘自:第12届生物信息学算法国际会议论文集,WABI'12。柏林/海德堡施普林格,第365-377页
[14] Gao N,Yang N,Tang J(2013)使用遗传算法方法进行祖先基因组推断。公共科学图书馆综合课程8(5):e62156·doi:10.1371/journal.pone.0062156
[15] Hu F,Zhou J,Zhow L,Tang J(2014)具有插入和删除的祖先基因序列的概率重建。IEEE/ACM Trans-Comput生物信息11(4):667-672
[16] Lenne,R。;索尔农,C。;Stutzle,T。;Tannier,E。;比拉塔里,M。;Carlos Cotta,JVH(编辑),基因组中值问题的反应随机局部搜索算法,266-276(2008),柏林·doi:10.1007/978-3-540-78604-7_23
[17] Mabrouk NE(2001)通过反转和插入/删除连续段对有符号排列进行排序。J离散算法1(1):105-122
[18] Moret BME,Tang J,san Wang L,Warnow Y(2002)《从基因顺序数据精确重建系统发育的步骤》。计算机系统科学杂志65:508-525·Zbl 1058.68531号 ·doi:10.1016/S0022-0000(02)00007-7
[19] Moret BME,Wang LS,Warnow T,Wyman SK(2001)从基因序列数据重建系统发育的新方法。在:ISMB(生物信息学增补),第165-173页
[20] Nguyen CT,Tay YC,Zhang L(2005)样本断点距离的分而治之方法。生物信息学21(10):2171-2176·doi:10.1093/bioinformatics/bti327
[21] Peer I,Shamir R(1998)断点的中值问题是np-完全的。技术报告71,计算复杂性电子座谈会·Zbl 0973.92014号
[22] Rajan V,Xu AW,Lin Y,Swenson KM,Moret BME(2010)《反演中值问题的启发式》。BMC生物信息11(S-1):30·doi:10.1186/1471-2105-11-S1-S1-S30
[23] Sankoff D(1999)基因家族的基因组重排。生物信息学15(11):909-917·doi:10.1093/bioinformatics/15.11.909
[24] Shao M,Lin Y(2012)DCJ下具有重复基因的基因组编辑距离的近似,插入和删除。BMC生物信息13(S-19):S13·doi:10.1186/1471-2105-13-S19-S13
[25] Shao M,Lin Y,Moret BME(2014)计算重复基因基因组DCJ距离的精确算法。收件人:RECOMB,匹兹堡,第280-292页
[26] Xu AW(2009)线性多染色体基因组上的DCJ中值问题:图形表示和快速精确解。地址:RECOMB-CG,布达佩斯,第70-83页
[27] Xu AW(2009)三个问题中值的快速准确算法:图分解方法。计算机生物学杂志16(10):1369-1381·doi:10.1089/cmb.2009.0087
[28] Xu AW,Moret BME(2011)Gasts:重新安排下的吝啬得分。地址:WABI.Springer,Berlin,第351-363页
[29] Xu AW,Sankoff D(2008)多断点图的分解和中值问题的快速精确解。摘自:第八届生物信息学算法国际研讨会论文集,WABI'08。柏林/海德堡施普林格出版社,第25-37页
[30] Yancopoulos S,Attie O,Friedberg R(2005)通过易位、反转和块交换对基因组排列进行有效排序。生物信息学21(16):3340-3346·Zbl 1369.78570号 ·doi:10.1093/bioinformatics/bti535
[31] Yancopoulos,S。;弗里德伯格,R。;Nelson,CE(编辑);Vialette,S.(编辑),《DCJ对插入、缺失和重复的基因组排序》,第5267、170-183号(2008),柏林
[32] Yin Z,Tang J,Schaeffer SW,Bader DA(2013)用于加速和并行计算三个基因组的DCJ中值的流断点图分析。In:ICCS,第561-570页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。