{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,3,1]],“日期-时间”:“2024-03-01T20:19:25Z”,“时间戳”:1709324365306},“引用-计数”:22,“出版商”:“牛津大学出版社(OUP)”,“发行”:“10”,“许可证”:[{“开始”:{-“日期-零件”:[2020,11,18]],”日期-时间“:”2020-11-18T00:00:00Z“,”时间戳“:1605657600000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://\/creativecommons.org\/licenses\/by\/4.0\/”}],“资助者”:[{“name”:“BBSRC Institute Strategic Programme Grant”},{“name”:“Rumen Systems Biology”,“award”:[“BB\/E\/W\/10964A01”]},{“name”:“EC via Horizon 2020”,“奖项”:[“818368”]}],“内容域”:{“域”:[],“交叉标记-限制”:false},“短容器-标签”:[].,“发布-打印”:{-“日期-部分”:[[2021,6,16]]}.,“摘要”:“摘要<\/jats:title>\n\n个动机<\/jats:title>\n种群水平的遗传变异使微生物群落具有竞争力和生态位专业化。尽管从环境中培养许多微生物很困难,但我们仍然可以通过直接从环境中分离DNA并测序来研究这些群落(宏基因组学)。在宏基因组样本中,在所有生物体中恢复给定基因的所有亚型的基因组序列,将有助于对微生物生态系统的进化和生态学见解,并为医学和生物技术带来潜在益处。实现这一目标的一个重大障碍是缺乏一个可计算的解决方案,该解决方案可以从已排序的读取片段中恢复这些序列。这带来了一个类似于重建组成二倍体生物体基因组(即单倍体)的两个序列的问题,但对于未知数量的个体和单倍体<\/jats:p>\n<\/jats:sec>\n\n个结果<\/jats:title>\n2001年,Lancia等人首次正式提出了单个个体单倍型问题。近二十年后的今天,我们讨论了2018单倍型2019宏基因组样本的复杂性,Lancia等人对u2019的数据结构进行了新的形式化,使我们能够有效地将单个单倍型问题扩展到微生物群落。这项工作描述并形式化了从复杂社区样本中的所有个体中恢复基因(和其他基因组子序列)的问题,我们称之为元基因组个体单倍型问题。我们还提供了成对单核苷酸变体(SNV)共生矩阵和贪婪图遍历算法的软件实现<\/jats:p>\n<\/jats:sec>\n\n个可用性和实施<\/jats:title>\n我们所描述的成对SNV矩阵(Hansel)和贪婪单倍型路径遍历算法(Gretel)的参考实现是开放源码的,经麻省理工学院授权,并可分别在github.com/samstudio8/Hansel和githubcom/samstudyo8/Gretel上免费在线获取<\/jats:p>\n<\/jats:sec>“,”DOI“:”10.1093\/生物信息学\/btaa977“,”type“:”期刊文章“,”created“:{”日期部分“:[[2020,11,9],”日期时间“:”2020-11-09T12:30:03Z“,”时间戳“:1604925003000},”page“:”1360-1366“,”source“:”Crossref“,”被计数引用“:15,”title“:[”关于微生物群落单倍型的复杂性“],”prefix“:”10.1093“,”卷“:”37“,”作者“:[{”ORCID“:”http://\/ORCID.org\/0000-0003-4081-065X“,”authenticated-ORCID“:false,”给定“:”Samuel M“,”家庭“:”Nicholls“,”sequence“:”first“,”affiliation“:[}”name“:”Aberystwyth University计算机科学系,Aberystwyth SY23 3DB,UK“},”{“name”:“”比利时鲁汶卡托利克大学计算机科学系“},{“name”:“英国阿伯里斯特维思大学生物、农村和环境科学研究所,阿伯里斯特SY23 3DA”},}“name“:英国伯明翰大学生物科学学院微生物与感染研究所,英国伯明罕B15 2TT”}、{“ORCID”:“http:\/\/orcid.org\/00000-0003-3351-1758“,”authenticated-orcid“:false,”given“:”Wayne“,”family“:”Aubrey“,”sequence“:”additional“,”affiliation“:[{”name“:”Aberystwith University,Aberystwyth SY23 3DB,UK“}]},{“given”:“Kurt”,“family”:“De Grave”,“sequence”:“additional”,“affiliance”:[{“name”:“”卡托利耶克大学鲁汶分校计算机科学系,3001比利时鲁汶“},{“name”:“弗兰德斯·马克,3920比利时洛梅尔”}]},}“given”:“Leander”,“family”:“Schietgat”,“sequence”:“additional”,“affiliation”:[{“name”:“比利时卢汶卡托利克大学计算机科学系”,3001鲁汶比利时布鲁塞尔Vrije大学人工智能实验室,1050 Ixelles“}]},{“given”:“Christopher J”,“family”:“Creevey”,“sequence”:“additional”,“affiliation”:[{“name”:“英国阿伯里斯特威斯大学生物、农村和环境科学研究所”}英国贝尔法斯特BT9 5DL皇后大学生物科学学院全球粮食安全研究所“}]},{“given”:“Amanda”,“family”:“Clare”,“sequence”:“additional”,“affiliation”:[{“name”:“Department of Computer Science,Aberystwyth University,Aberyth SY23 3DB,UK”}]}],“member”:“286”,“published on”:{“date-parts”:[2021,13]}reference“:[{”key“:”2023051709343873900_btaa977-B1“,”doi-asserted-by“:”crossref“,”first page“:“i352”,“doi”:“10.1093\/生物信息学\/btt213”,“article-title”:“多倍体基因组中的单倍体组装和通过血统共享区的相同”,“volume”:“29”,“author”:“Aguiar”,“year”:“2013”,“journal-title“:”生物信息学“}”,{“key”:”2023051709343873900_btaa977-B2“,”doi-asserted-by“:”crossref“,“first page”:“89”,“doi”:“10.1016\/S0888-7543(05)80288-5”,“article-title”:“DNA序列的准确性:估计序列质量”,“volume”:”14“,”author“:”Churchill“,”year“1992”,“journal-title“:”Genomics“},{”key“”:“20230517093 43873900 _btaa 977-B3”,“doi-assert-b”y“:”crossref“,”首页“:”128“,”DOI“:”10.1007\/1157067_11“,”卷标题“:”生物信息学中的算法“,”作者“:”Cilibrasi“,”年份“:”2005“},{”键“:”2023051709343873900_btaa977-B4“,”DOI断言“:”crossref“,”首页“:”116“,”DOI“:”10.1186\/s13059-019-1709-0“,”文章标题“:”从嘈杂的长读中识别单倍型的复型“,”卷“:”20“,”作者“:”Ebler”,“年份”:“2019”,“日志标题”:“基因组生物学”},{“关键”:“2023051709343873900_btaa977-B5”,“doi-asserted-by”:“crossref”,“首页”:“186”,”doi“:”10.1038\/s41587-018-0009-7“,”article-title“:”用于改进元基因组分析的人类肠道细菌基因组和培养物收集“,”卷“:”37“,”作者“:”Forster“,”年份“:”2019“,”日志标题“:”国家。生物技术“},{“key”:“2023051709343873900_btaa977-B6”,“doi-asserted-by”:“crossref”,“first page”:《110》,“doi”:“10.1186\/s12864-018-4464-9”,《article-title》:“多倍体单倍体阶段划分的高效算法”,“volume”:”19“author”:“He”,”year“2018”,“journal-title”:“BMC Genomics”},}“key:”20230517093 43873900 _btaa 977-B7“,”doi-asserted-by“:”crossref“,”first page“:“540”,”DOI“:”10.1038\/s41587-019-0072-8“,”article-title“:”Assembly of long,error policy reads using repeat graphs“,”volume“:”37“,”author“:”Kolmogorov“,”year“:”2019“,”journal-title”:“Nat.Biotechol”},{“key”:“2023051709343873900_btaa977-B8”,”DOI-asserted-by“:”crossref.“,”首页“:”64“,”DOI:“10.1038\/nbt.3416”,“article-title“:”合成长阅读测序揭示了人类微生物群的种内多样性“,“volume”:“34”,“author”:“Kuleshov”,“year”:“2016”,“journal-title”:“Nat.Biotechol”},{“key”:”2023051709343873900_btaa977-B9“,”doi-asserted-by“:”crossref“,”first page“:”331“,”doi“:”10.1051\ro\/2015037“,”article-title“单个单倍型问题的算法方法”,“卷”:“50”,“作者”:“Lancia”,“年份”:“2016”,“期刊标题”:“RAIRO Oper。Res“},{“key”:“2023051709343873900_btaa977-B10”,“doi-asserted-by”:“crossref”,“first page”:”182“,”doi“:”10.1007\/3-540-44676-1_15“,”volume-title“:”Algorithms\u2013 ESA 2001“,”author“:”Lancia“,“year”:“2001”},“key“:”20230517093 43873900 _btaa 977-B11“,”doi-assert-by“:”crossref.“,”first page:““e1007843”,“doi”:“10.1371”\/journal.pcbi.1007843“,”article-title“:“Ranbow:一种快速准确的多倍体单倍体重建方法”,“volume”:“16”,“author”:“Moeinzadeh”,“year”:“2020”,“journal-title”:“PLoS Compute”。Biol“},{“key”:“2023051709343873900_btaa977-B12”,“author”:“Nicholls”,“year”:“2018”},}“key:”20230517093 43873900 _btaa 977-B13“,”doi-asserted-by“:”crossref“,”first page“:”giz043“,“doi”:“10.1093”gigascience“,”article-title“:”模拟微生物群落标准的超深、长读纳米孔测序“,”volume“8“,”author“:”Nicholls“,”年份:“2019”,“journal-title”:“Gigascience”},{“key”:“2023051709343873900_btaa977-B14”,“doi-asserted-by”:“crossref”,“首页”:“824”,”doi“:”10.1101\/gr.213959.116“,”article-title“:”metaSPAdes:一个新的通用元基因组组装器“,”volume“:”27“,”author“:”Nurk“,”year“:”2017“,”journal-title“:”Genome Res“},}“密钥”:“2023051709343873900_btaa977-B15”,“doi-asserted-by“:”crossref“,”first page“:”1510“,”doi“:”10.1038\/ismej.2017.34“,”article-title“:”多样功能亚型驱动瘤胃微生物群中营养物质获取和使用的生态位专业化“,”volume“:“11”,”author“:”Rubino“,”year“:”2017“,”journal-title”:“ISME J”},{“key”:“2023051709343873900_btaa977-B16”,“doi-assert-by”:”cross-ref“,“”首页“:”252“,”DOI“:”10.1186\/s13059-020-02158-1“,”article-title“:”单倍体线程:从long reads中精确的多倍体定相“,”volume“:”21“,”author“:”Schrinner“,”year“:”2020“,”journal-title”:“Genome Biol”},{“key”:“2023051709343873900_btaa977-B17”,“DOI-asserted-by”:“crossref”,“first-pages”:“e00190”,“DOI”:“10.1128 \/mSystems.00190-17“,”article-title“:“走向应变-解析比较宏基因组学”,“volume”:“3”,“author”:“Segata”,“year”:“2018”,“journal-title”:“mSystems”},{“key”:”2023051709343873900_btaa977-B18“,”doi-asserted-by“:”crossref“,”first page“:”359“,”doi“:”10.1038\/nbt.4110“,”article-title“Hungate1000系列瘤胃微生物组成员的培养和测序”,“卷”:“36”,“作者”:“Seshadri”,“年份”:“2018”,“期刊标题”:“Nat.Biotechol”},{“key”:“2023051709343873900_btaa977-B19”,“doi-asserted-by”:“crossref”,《首页》:“953”,“doi”:“10.1038\/s41587-019-0202-3”,“article-title”:“《4941瘤胃宏基因组组装基因组用于瘤胃微生物群生物学和酶发现简编》,“卷”:“37”,“作者”:“Stewart”,“年份”:“2019”,“期刊标题”:“Nat.Biotechol”},{“关键”:“2023051709343873900_btaa977-B20”,“doi-asserted-by”:“crossref”,“首页”:“491”,“doi”:“10.1038\/s41579-020-0368-1”,《文章标题》:“物种内多样性:解释微生物群中的菌株”,“卷”:“18”,“作者”:“Van Rossum”,“年份”:“2020年”,“期刊标题”:“Nature Reviews Microbiology”},{“关键”:“2023051709343873900_btaa977-B21”,“doi-asserted-by”:“crossref”,“首页”:“1155”,“doi”:“10.1038\/s41587-019-0217-9”,《文章标题》:“准确的循环共识长读测序改进了人类基因组的变异检测和组装”,“卷”:“37”,“作者”:“温格”,“年份”:“2019年”,“期刊标题”:“Nat.Biotechsol”},{“关键”:“2023051709343873900_btaa977-B22”,“doi-asserted-by”:“crossref”,“首页”:“1920”,“doi”:“10.3390\/md8061920”,”“article-title”:“海洋微生物酶的研究与应用:现状与展望”,“卷”:“8”,“作者”:“张”,“年份”:“2010年”,“期刊标题”:“海洋药物”}],“容器标题”:[“生物信息学”],“原文标题”:[],“语言”:“en”,“链接”:[{“URL”:“http://\/cademicial.oup.com/bioninformatics\/advance-article-pdf\/doi\/10.1093\/bioinformations\/btaa977\/35823962\/btaa97.pdf“,“content-type”:“application\/pdf”,“content-version”:“am”,“intended-application”:“syndication”},{“URL”:“https:\//ademiciate.oup.com\/bio-informatics \/article-pdf\/37\/10\/13600\/50360994\/btaa 977”。pdf“,”内容类型“:”application\/pdf“,”content-version“:”vor“,”intended-application“:”syndication“},{“URL”:“https:\/\/cademicial.oup.com/bioninformatics\/article-pdf\/37\/10\/13600\/50360994\/btaa977.pdf”,“content-type”:“unspecified”,“content-version”:“vor”,“intended-application”:“similarity-checking”}],“ded”:{“date-parts”:[2023,5,17]],“date-time”“:”2023-05-17T09:50:09Z“,”timestamp“:1684317009000},”score“:1,”resource“:{”primary”:{“URL”:“https:\/\/cademicial.oup.com/bioninformations\/article\/37\/10\/1360\/5988481”}},“subtitle”:[],“editor”:[{“given”:“Pier”,“family”:“Luigi Martelli”,“sequence”:“additional”,“affiliation”:[]}],“short title”:[],“issued“:{”日期部分“:[[2021,13]]},”references-count“:22,”journal-issue“:{”issue“:“10”,“published-print”:{“date-parts”:[[2021,6,16]]}},“URL”:“http://\/dx.doi.org\/10.1093\/生物信息学\/btaa977”,“relation”:{“has-preprint”:[{“id-type”:“doi”,“id”:“10.1101\/2020.08.10.244848”,“asserted-by”:“object”}]},”ISSN“:[”1367-4803“,”1367-4811“],”ISSN-type“:[{”value“:”1367-4303“,“type”:“print”},{“值”:“1367-4811”,“类型”:“电子”}],“主题”:[],“发布-其他”:{“日期-部分”:[2021,5,15]]}