×

使用PQ树近似搜索新基因组中的已知基因簇。 (英语) Zbl 1518.92093号

Kingsford,Carl(编辑)等人,第20届生物信息学算法国际研讨会。WABI 2020,2020年9月7日至9日,意大利比萨,虚拟会议。诉讼程序。Wadern:达格斯图尔宫——莱布尼茨Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。172,第1条,第24页(2020年)。
小结:我们定义了比较基因组学中的一个新问题,称为PQ-树搜索,它以一个代表感兴趣基因簇的已知基因顺序的PQ-树状结构(T)、一个基因到基因的替代评分函数(h)、整数参数(d_T)和(d_S)以及一个新的基因组(S)作为输入。目的是在(S)中确定基因簇的近似新实例,这些实例可能与已知基因顺序不同,分别受(T)约束的基因组重排,受(h)控制的基因替换,以及受(d_T)和(d_S)约束的基因缺失和插入。我们证明了PQ-Tree搜索问题是NP-hard问题,并提出了一种参数化算法,该算法在(O^*(2^\gamma))时间内求解PQ-Tere搜索的优化变量,其中(gamma。
该算法被实现为一种搜索工具,称为PQFinder,并应用于在1487个原核基因组的数据集中搜索质粒中的染色体基因簇实例。我们报道了29个在质粒中重排的染色体基因簇,其中重排由相应的PQ树引导。其中一个结果是重金属外排泵的编码,为了举例说明如何利用PQFinder揭示已知基因簇的有趣的新结构变体,我们对其进行了进一步分析。
关于整个系列,请参见[Zbl 1445.68019号].

MSC公司:

92D10型 遗传学和表观遗传学
92D20型 蛋白质序列,DNA序列
92-08 生物问题的计算方法

软件:

github
PDF格式BibTeX公司 XML格式引用

参考文献:

[2] 扎基·亚当(Zaky Adam)、莫妮克·特梅尔(Monique Turmel)、克劳德·勒米厄(Claude Lemieux)和大卫·桑科夫(David Sankoff)。无模式系统发育学中的常见间隔和对称差异,以及链霉菌进化的应用。计算生物学杂志,14(4):436-4452007。doi:10.1089/cmb.2007。A005·doi:10.1089/cmb.2007.A005
[3] Farid Alizadeh、Richard M Karp、Deborah K Weisser和Geoffrey Zweig。使用独特探针进行染色体物理绘图。计算生物学杂志,2(2):159-1841995。doi:10.1089/cmb.1995.2.159·Zbl 0870.92005号 ·doi:10.1089/cmb.1995.2.159
[4] Severine Bérard、Anne Bergeron、Cedric Chauve和Christophe Paul。通过反转进行完美排序并不总是困难的。IEEE/ACM计算生物学和生物信息学汇刊,4(1):4-162007。doi:10.1145/1229968.1229972·数字对象标识代码:10.1145/1229968.1229972
[5] 安妮·贝杰伦、马修·布兰切特、安妮·查托和塞德里克·乔夫。使用保守区间重建祖先基因序列。生物信息学算法国际研讨会,第14-25页。斯普林格,2004年。doi:10.1007/978-3-540-30219-32·doi:10.1007/978-3-540-30219-32
[6] 安妮·贝杰伦(Anne Bergeron)、西尔维·科尔蒂尔(Sylvie Corteel)和马修·拉菲诺(Mathieu Raffinot)。基因团队的算法。生物信息学算法国际研讨会,第464-476页。斯普林格,2002年。doi:10.1007/3-540-45784-4_36·Zbl 1016.68618号 ·doi:10.1007/3-540-4784-4_36
[7] 安妮·贝杰伦、扬尼克·金格拉斯和塞德里克·乔夫。基因簇的形式化模型。生物信息学算法:技术与应用,2008年8月177-202日。doi:10.1002/9780470253441.ch8·doi:10.1002/9780470253444.ch8
[8] 安妮·贝杰伦、朱莉娅·米斯塔基和延斯·斯托伊。无障碍和堡垒的反向距离。在组合模式匹配年度研讨会上,第388-399页。斯普林格,2004年。doi:10.1007/978-3-540-27801-6_29·Zbl 1103.68653号 ·doi:10.1007/978-3-540-27801-6_29
[9] 塞巴斯蒂安·博克(Sebastian Böcker)、凯萨琳娜·扬(Katharina Jahn)、朱莉娅·米斯塔基(Julia Mistacki)和延斯·斯托伊(Jens Stoye)。中位数基因簇的计算。计算生物学杂志,16(8):1085-10992009。doi:10.1089/cmb。2009.0098. ·doi:10.1089/cmb.2009.0098
[10] Kellogg S Booth和George S Lueker。使用pq树算法测试连续一的性质、区间图和图的平面性。计算机与系统科学杂志,13(3):335-3791976。doi:10.1016/S0022-0000(76)80045-1·兹伯利0367.68034 ·doi:10.1016/S0022-0000(76)80045-1
[11] 托马斯·克里斯托夫(Thomas Christof)、迈克尔·扬格(Michael Jünger)、约翰·凯西奥格鲁(John Kececioglu)、佩特拉·穆策尔(Petra Mutzel)和格哈德·雷内特(Gerhard Reinelt)。通过独特的末端探针对染色体进行物理定位的一种分叉方法。计算生物学杂志,4(4):433-4471997。doi:10.1089/cmb.1997.4.433·doi:10.1089/cmb.1997.4.433
[12] Marek Cygan、Fedor V.Fomin、Lukasz Kowalik、Daniel Lokshtanov、Dániel Marx、Marcin Pilipczuk、Michal Pilipczzuk和Saket Saurabh。参数化算法。斯普林格,2015年。doi:10.1007/978-3-319-21275-3·Zbl 1334.90001号 ·doi:10.1007/978-3-319-21275-3
[13] 罗德尼·G·唐尼(Rodney G.Downey)和迈克尔·R·费罗斯(Michael R.Fellows)。参数化复杂性基础。计算机科学课文。施普林格,2013年。doi:10.1007/9781-4471-5559-1·Zbl 1358.68006号 ·doi:10.1007/978-1-4471-5559-1
[14] 杜迪军(Dijun Du)、王昭(Zhao Wang)、内森·R·詹姆斯(Nathan R James)、贾罗德·沃斯(Jarrod E Voss)、埃瓦·克里蒙特(Ewa Klimont)、塞尔玛·奥涅·阿吉伊(Thelma Ohene-Agyei)、亨丽埃塔·文特尔(Hen。AcrAB-TolC多药外排泵的结构。《自然》,509(7501):512-5152014年。doi:10.1038/nature13205·doi:10.1038/nature13205
[15] 威廉·埃伯哈德(William G Eberhard)。细菌质粒的进化和选择水平。《生物学季刊》,65(1):3-221990年。doi:10.1086/416582。1:18 ·doi:10.1086/416582
[16] 岳父、张凤鸣和大卫·P·吉德洛克。宿主-细菌-病原体界面的铜运输和贩运。《化学研究账户》,47(12):3605-36132014。doi:10.1021/ar500300n。 ·doi:10.1021/ar500300n
[17] 列夫·古列维奇。pq树构造程序。https://github.com/levgou/pqtrees。
[18] 何苏苏(Susu He)、迈克尔·钱德勒(Michael Chandler)、亚历山德罗·瓦拉尼(Alessandro M Varani)、艾莉森·希克曼(Alison B Hickman)、约翰·德克尔(John P Dekker)和弗雷德·戴达(Fred Dyda)。高后果耐药质粒的进化机制。mBio,7(6):e01987-162016年。doi:10.1128/mBio.01987-16·doi:10.1128/mBio.01987-16
[19] Xin He和Michael H Goldwasser。在同源家族中鉴定保守基因簇。计算生物学杂志,12(6):638-6562005。doi:10.1089/cmb。2005.12.638. ·doi:10.1089/cmb.2005.12.638
[20] 斯特芬·希伯(Steffen Heber)和延斯·斯托伊(Jens Stoye)。寻找基因簇的算法。生物信息学算法国际研讨会,第252-263页。斯普林格,2001年。doi:10.1007/3-540-44696-6_20·Zbl 1129.92305号 ·数字对象标识代码:10.1007/3-540-44696-6_20
[21] J马克·凯尔。具有离散启动时间的调度任务的复杂性。《运营研究快报》,12(5):293-2951992年。doi:10.1016/0167-6377(92)90087-J·兹比尔0759.90045 ·doi:10.1016/0167-6377(92)90087-J
[22] Gad M Landau、Laxmi Parida和Oren Weimann。通过pq树对整个基因组进行基因邻近性分析。计算生物学杂志,12(10):1289-13062005。doi:10.1089/cmb.2005.12289·Zbl 1130.92301号 ·doi:10.1089/cmb.2005.12289
[23] William W Metcalf和Barry L Wanner。大肠杆菌磷酸代谢的十四个基因phnC到phnP位点的证据。基因,129(1):27-321993。doi:10.1016/0378-1119(93)90692-V·doi:10.1016/0378-1119(93)90692-V
[24] 中岛一郎(Kazuo Nakajima)和哈基米(S Louis Hakimi)。具有离散开始时间的调度任务的复杂性结果。算法杂志,3(4):344-3611982。doi:10.1016/0196-6774(82)90030-X·兹伯利0535.68017 ·doi:10.1016/0196-6774(82)90030-X
[25] 迪特里希·H·尼斯。原核生物中外流介导的重金属抗性。FEMS微生物学评论,27(2-3):313-3392003。doi:10.1016/S0168-6445(03)00048-2·doi:10.1016/S0168-6445(03)00048-2
[26] 维克·诺里斯和安娜贝拉·梅里奥。质粒作为操纵子形成和繁殖的书写垫。微生物学研究,164(7):779-7872013。doi:10.1016/j.resmic.2013。04.003. ·doi:10.1016/j.resmic.2013.04.003
[27] Alex Orlek、Nicole Stoesser、Muna F Anjum、Michel Doumith、Matthew J Ellington、Tim Peto、Derrick Crook、Neil Woodford、A Sarah Walker、Hang Phan等。全基因组测序时代的质粒分类:在抗生素耐药性流行病学研究中的应用。微生物前沿,2017年8月182日。doi:10.3389/fmicb.2017.00182·doi:10.3389/fmicb.2017.00182
[28] Laxmi Parida。利用pq结构进行基因组重排系统发育。《竞争生物学杂志》,13(10):1685-17002006。doi:10.1089/cmb.2006.13.1685·doi:10.1089/cmb.2006.13.1685
[29] Gerard Salton、Anita Wong和Chung Shu Yang。用于自动索引的向量空间模型。ACM通讯,18(11):613-6201975。doi:10.1145/361219.361220·Zbl 0313.68082号 ·数字对象标识代码:10.1145/361219.361220
[30] 托马斯·施密特和延斯·斯托伊。在两个或更多序列中寻找公共间隔的二次时间算法。在组合模式匹配中,第347-358页。斯普林格,2004年。doi:10.1007/978-3-540-27801-6_26·Zbl 1104.92025号 ·doi:10.1007/978-3-540-27801-6_26
[31] 熔块CR Spieksma。关于区间调度问题的逼近性。日程安排期刊,2(5):215-2271999。doi:10.1002/(SICI)1099-1425(199909/10)2:5<215::AID-JOS27>3.0.CO;2年·兹比尔0938.90034 ·doi:10.1002/(SICI)1099-1425(199909/10)2:5<215::AID-JOS27>3.0.CO;2年
[32] Frits CR Spieksma和Yves Crama。用很少的启动时间调度短任务的复杂性。林堡国立大学(Rijksuniversiteit Limburg.Vakgroep Wiskunde),1992年·Zbl 0761.90071号
[33] Mark C Sulavik、Chad Houseweart、Christina Cramer、Nilofer Jiwani、Nicholas Murgolo、Jonathan Greene、Beth DiDomenico、Karen Joy Shaw、George H Miller、Roberta Hare等。缺乏多药外排泵基因的大肠杆菌菌株的抗生素敏感性谱。抗菌剂和化疗,45(4):1126-11362001。doi:10.1128/AAC.45。4.1126-1136.2001. ·doi:10.1128/AAC.45.41126-1136.2001
[34] 迪娜·斯维特利茨基(Dina Svetlitsky)、塔尔·达根(Tal Dagan)和米查尔·齐夫·尤克尔森(Michal Ziv-Ukelson)。在微生物基因组中发现多操纵子共线联会区。生物信息学,2020年。doi:10.1093/bioinformatics/btaa503。1:19 ·doi:10.1093/bioinformatics/btaa503
[35] 罗曼·塔图索夫(Roman L Tatusov)、迈克尔·加尔佩林(Michael Y Galperin)、达伦·纳塔莱(Darren A Natale)和尤金·库宁(Eugene V Koonin)。cog数据库:蛋白质功能和进化的基因组尺度分析工具。核酸研究,28(1):33-362000。doi:10.1093/nar/28.133·doi:10.1093/nar/28.1.33
[36] 塔蒂亚娜·塔图索娃(Tatiana Tatusova)、斯泰西·库福(Stacy Ciufo)、鲍里斯·费多罗夫(Boris Fedorov)、凯瑟琳·奥尼尔(Kathleen O'Neill)和伊戈尔·托尔斯泰(Igor Tolstoy)。Refseq微生物基因组数据库:新的表示和注释策略。核酸研究,42(D1):D553-D5592014。doi:10.1093/nar/gkt1274·doi:10.1093/nar/gkt1274
[37] 武木友野和野村村。枚举两个排列的所有公共间隔的快速算法。算法,26(2):290-3092000。doi:10.1007/s004539910014·Zbl 0949.68168号 ·doi:10.1007/s004539910014
[38] 勒内·范·贝文(Renévan Bevern)、马蒂亚斯·姆尼奇(Matthias Mnich)、罗尔夫·尼德迈尔(Rolf Niedermeier)和马蒂亚斯·韦勒(Mathias Weller)。间隔调度和彩色独立集。日程安排期刊,18(5):449-4692015年10月。doi:10.1007/s10951-014-0398-5·Zbl 1328.90065号 ·doi:10.1007/s10951-014-0398-5
[39] Joachim Vandecraen、Michael Chandler、Abram Aertsen和Rob Van Houdt。插入序列对细菌基因组可塑性和适应性的影响。《微生物学评论》,43(6):709-7302017。PMID:28407717。doi:10.1080/1040841X.2017.1303661·doi:10.1080/1040841X.2017.1303661
[40] Alice R Wattam、David Abraham、Oral Dalay、Terry L Disz、Timothy Driscoll、Joseph L Gabbard、JosephJ Gillespie、Roger Gough、Deborah Hix、Ronald Kenyon等。Patric,细菌生物信息学数据库和分析资源。核酸研究,42(D1):D581-D5912014。doi:10.1093/nar/gkt1099·doi:10.1093/nar/gkt1099
[41] Jonathan N Wells、L Therese Bergendahl和Joseph A Marsh。优化了Operon基因顺序以进行有序蛋白质复合物组装。《细胞报告》,14(4):679-6852016。doi:10.1016/j.celrep.2015.12.085·doi:10.1016/j.celrep.2015.12.085
[42] 萨沙·温特(Sascha Winter)、凯萨琳娜·扬(Katharina Jahn)、斯特凡妮·韦纳(Stefanie Wehner)、利昂·库琴贝克(Leon Kuchenbecker)、曼贾·马尔兹(Manja Marz)、延斯·斯托耶(Jens Stoye)和塞巴斯蒂安·博克(。寻找壁虎3的近似基因簇。核酸研究,44(20):9600-96102016。doi:10.1093/nar/gkw843·doi:10.1093/nar/gkw843
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。