{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,3,12],“日期-时间”:“2024-03-12T15:43:55Z”,“时间戳”:1710258235363},“引用-计数”:12,“出版商”:“牛津大学出版社(OUP)”,“发行”:“5”,“许可证”:[{“开始”:{-“日期-零件”:[2016,12,28]],“日期时间”:“2016-12-28T00:00:00Z”,“时间戳”:1482883200000},“内容版本”:“vor”,“延迟天数”:796,“URL”:“http:\/\creativecommons.org/licenses\/by\/4.0\/”}],“内容域”:{“域”:[],“交叉标记限制”:false},“短容器标题”:[],“已发布的印刷品”:{“日期部分”:[[2015,3,1]]},“摘要”:“动机:单核苷酸多态性(SNP)的发现是了解遗传变异的重要前提。利用当前的测序方法,我们可以对基因组进行全面采样。SNPs是通过将序列读数与较长的组装参考比对来发现的。De Bruijn图是高效的数据结构,可以处理来自现代技术的大量数据。最近的工作表明,这些图的拓扑结构捕获了足够的信息,可以检测和表征遗传变异,为基于比对的方法提供了一种替代方法。这种方法依赖于图的深度第一步来识别闭合分支。这些方法是保守的,或者会产生许多假阳性结果,尤其是在遍历图的高度互连(复杂)区域或覆盖率极高的区域时<\/jats:p>\n结果:我们设计了一个算法,通过枚举2k\u2009+\u20092个循环来调用转换的De Bruijn图中的SNP。通过与基于比对方法的SNP列表进行比较,我们评估了预测SNP的准确性。我们使用16个拟南芥生态型的序列数据测试了SNP调用的准确性,发现准确性很高。我们发现SNP调用甚至跨越基因组和基因组特征类型。使用基于序列的图形属性来训练决策树,可以进一步提高SNP调用的准确性。这些结果表明,我们的算法能够在复杂子图中准确地找到SNP,并可能从全基因组图中全面地找到SNPs<\/jats:p>\n可用性和实现:我们算法的C++实现的源代码在GNU公共许可证v3下提供,网址:https:\/\/github.com/danmaclean\/2kplus2。本研究中使用的数据集可在欧洲核苷酸档案馆查阅,参考ERP00565,http://www.ebi.ac.uk\/ena\/data\/view\/ERP000565联系人:\u00a0dan.maclean@tsl.ac.uk<\/jats:p>\n补充信息:\u00a0生物信息学在线提供补充数据<\/jats:p>“,”DOI“:”10.1093\/生物信息学\/btu706“,”type“:”journal-article“,”created“:{”date-parts“:[[2014,10,25]],”date-time“:”2014-10-25T03:54:31Z“,”timestamp“:1414209271000},”page“:“642-646”,“source”:“Crossref”,“is-referenced-by-count”:5,“title”:[“Using 2k<\/i>\u2009+\u20092气泡搜索以发现单核苷酸多态性k<\/i>-mer graphs“],”prefix“:”10.1093“,”volume“:”31“,”author“:[{”given“:“Reda”,”family“:”Younsi“,”sequence“:”first“,”affiliation“:[}”name“:”英国诺威奇NR4 7UH诺威奇研究园塞恩斯伯里实验室1号“}]},{”Givent“:”Dan“,”faily“:“MacLean”,“sequence”:“additional”,“affiliance”:[{'name“:“”英国诺威奇NR4 7UH诺威奇研究园塞恩斯伯里实验室“}]}],“成员”:“286”,“在线发布”:{“日期-部件”:[[2014,10,24]]},“参考”:[{“密钥”:“2023020116162563200_btu706-B1”,“doi-asserted-by”:“crossref”,“首页”:“403”,“doi”:“10.1016\/S0022-2836(05)80360-2”,“文章-标题”:“基本本地对齐搜索工具“,”卷“:”215“,”作者:“Altschul”,“year”:“1990”,“journal title”:“J.Mol.Biol”。“},{”key“:”2023020116162563200_btu706-B3“,”doi-asserted-by“:”crossref“,“first page”:“419”,“doi”:“10.1038\/nature10414”,“article-title”:“拟南芥的多参考基因组和转录本”,“volume”:”477“,”author“:”Gan“,”year“2011”,“journal-title“:”Nature“}”,{“key”:,“doi-asserted-by”:“crossref”,“首页“:”10“,”DOI“:”10.1145\/1656274.1656278“,”article-title“:”WEKA数据挖掘软件:更新“,”volume“:”11“,”author“:”Hall“,”year“:”2009“,”journal-title”:“ACM SIGKDD Explor。新闻。“},{”key“:”2023020116162563200_btu706-B5“,”doi-asserted-by“:”crossref“,”first-page“:”226“,”doi“:”10.1038\/ng.1028“,”article-title“:”De\u00a0novo assembly and genotyping of varians using colored De Bruijn graphs“,”volume“:“44”,“author”:“Iqbal”,“year”:“2012”,“journal-title”:“Nat.Genet.”},”{“key”:“202 3020116162563200_btu706-B6“,”doi-asserted-by“:”crossref“,”first page“:”S10“,”DOI“:”10.1186\/1471-2164-15-S4-S10“;”article-title“:”无参考SNP检测:处理数据洪流“,”volume“:“15”,”author“:”Leggett“,”year“:”2014“,”journal-title”:“BMC Genomics”},{“key”:“2023020116162563200_btu706-B7”,“author”:“Legget”,“year”:“2013”}、{“key”:”20230201161 62563200_btu706-B10“,”doi断言为:“crossref”,“first page”:“147”,“doi”:“10.1007\/978-3-642-16321-0_14”,“文章标题”:“通过比较原始读数识别没有参考基因组的SNPs”,“volume”:“6393”,“author”:“Peterlongo”,“year”:“2010”,“journal title”:“Lect。注释计算。科学。“},{”key“:”2023020116162563200_btu706-B11“,”doi-asserted-by“:”crossref“,”first-page“:”9748“,”doi“:”10.1073\/pnas.171285098“,”article-title“:”DNA片段组装的欧拉路径方法“,”volume“:“98”,”author“:”Pevzner“,”year“:”2001“,”journal-title”:“Proc.Natl.Acad.Sci.USA”},”{“key”:“202302011 6162563200_btu706-B12“,”doi-asserted-by“:”crossref“,”first page“:”81“,”DOI“:”10.1007\/BF00116251“,”article-title“:”决策树归纳“,”volume“:“1”,”author“:”Quinlan“,“year”:“1986”,”journal-title”:“Mach。学习。“},{”key“:”2023020116162563200_btu706-B14“,”doi-asserted-by“:”crossref“,”first-pages“:”1117“,”doi“:”10.1101\/gr.089532.108“,”article-title“:”ABySS:短读序列数据的并行汇编程序“,”volume“:“19”,”author“:”Simpson“,”year“:”2009“,”journal-title”:“Genome Res.”},”{“key”:“20230201162563200-btu706~B15“,”doi-asserted-by“:”crossref“,”首页“:”796“,”DOI“:”10.1038\/35048692“,”article-title“:”开花植物拟南芥基因组序列分析“,”volume“:”408“,”author“:”the Arabidopsis genome Initiative“,”year“:”2000“,”journal title“:“Nature”},{“key”:“2023020116162563200_btu706-B16”,“DOI-asserted-by”:“crossref”,“first page”:”821“,”DOI“:“”10.1101\/gr.074492.107“,”article-title“:”Velvet:使用de Bruijn图进行从头短读汇编的算法“,”volume“:”18“,”author“:”Zerbino“,”year“:”2008“,”journal-title”:“Genome Res.”}],”container-title:[“生物信息学”],”original-title:[],”language“:”en“,”link“:[{”URL“:”https://academy.oup.com\/生物信息学\/article pdf\/31\/5\/642\/49011486\/bioinformatics_31_5_642.pdf”,“内容类型”:“应用程序\/pdf”,“内容版本”:“vor”,“预期应用程序”:“联合”},{“URL”:“https://academy.oup.com\/生物信息学\/article pdf\/31\/5\/642\/49011486\/bioinformatics_31_5_642.pdf”,“内容类型”:“未指定”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,2,2],”date-time“:”2023-02-02T00:27:43Z“,”timestamp“:1675297663000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/academicial.oup.com/bioinformatics\/article\/31\/5\/642\/2748197”}},“subtitle”:[],“short”标题“:[],”发布“:{”date-parts“:[[2014,10,24]]},“references-count”:12,“journal-issue”:{“issue”:“5”,“published-print”:{“date-parts:[[2015,3,1]]}},”URL“:”http://\/dx.doi.org\/10.1093\/bitu706“,”relationship“:{},‘ISSN’:[“1367-4803”,“1367-4811”],“ISSN-type”:[{“value”:“1367-4.83”“,”类型“:”打印“},{”值“:”1367-4811“,”型号“:”电子“}],”主题“:[],“已发布”:{“日期部分”:[[2014,10,24]]}}