{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2024,8,28]],“日期-时间”:“2024-08-28T16:30:47Z”,“时间戳”:1724862647052},“参考-计数”:41,“出版商”:“牛津大学出版社(OUP)”,“问题”:“4”,“许可证”:[{“开始”:{-date-parts“:[[2016,12,5]],”日期-时间我“:”2016-12-05T00:00:00Z“,”时间戳“:1480896000000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“https://ademicial.oup.com/journals\/pages\/about_us\/legal\/notices”}],“出资人”:[{“name”:“SYSCOL”,“award”:[“258236”]},{“名称”:“芬兰癌症遗传学研究院CoE”,“ademy”:[”250345“]}”,{62721“]},{“name”:“冰岛研究基金”,“奖项”:[“152679-051”,“VP12014044”]}],“内容域”:{“域”:[],“交叉标记-限制”:false},“短容器-标签”:[],“发布-打印”:}“日期-部件”:[[2017,2,15]]},”摘要“:”摘要<\/jats:title>\n\n个动机<\/jats:title>\n虽然位置权重矩阵(PWM)是序列模体最流行的模型,但越来越多的证据表明,更高级的模型(如一阶马尔可夫表示法)是有用的,并且这种模型也可以在著名的模体数据库中使用。关于如何从训练数据中学习这些模型,已有很多研究,但通过将模型与新序列进行匹配来预测所学模体的假定位置的问题却很少受到关注。此外,基序位点分析通常关注序列中的不同变体如何影响位点。然而,到目前为止,还缺乏相应的有效的模体匹配软件工具<\/jats:p>\n<\/jats:sec>\n\n个结果<\/jats:title>\n我们为上述任务开发了快速模体匹配算法。首先,我们形式化了一个基于高阶位置权重矩阵的框架,用于具有二核苷酸或一般q-mer依赖的motif模型的通用表示,并将快速PWM匹配算法应用于高阶PWM框架。其次,我们展示了如何合并不同类型的序列变量,如SNP和indels,以及它们的组合效应,形成高效的PWM匹配工作流。基准测试结果表明,我们的算法在基因组大小的序列集上表现良好,并且在多模体搜索方面比基本的滑动窗口算法快得多<\/jats:p>\n<\/jats:sec>\n\n个可用性和实施<\/jats:title>\n实施是GNU通用公共许可证v3.0和Biopython许可证(http://www.cs.helsinki.fi\/group\/pssmfind)下MOODS软件包的一部分<\/jats:p>\n“,”DOI“:”10.1093\/生物信息学\/btw683“,”type“:”journal-article“,”created“:{”date-parts“:[[2016,10,27]],”date-time“:”2016-10-27T19:06:40Z“,”timestamp“:1477595200000}“,”page“:“514-521”,“source”:“Crossref”,“is-referenced-by-count”:31,“title”:[“Fast motif matching reviewed:high order PWM,SNP和索引“]”前缀“:”10.1093“,”volume“:”33“,”author“:[{”给定“:”Janne H“,”family“:”Korhonen“,”sequence“:”first“,”affiliation“:[}”name“:”冰岛雷克雅夫大学计算机科学学院“},{name“:“芬兰赫尔辛基信息技术研究院HIIT”},},“name”:“”芬兰赫尔辛基大学医学院计算机科学系“}]},{“given”:“Kimmo”,“family”:“Palin”,“sequence”:“additional”,“affiliation”:[{“name”:“Genome-Scale Biology Research Program,Research Programs Unit,Faculty of Medicine,Helsinki,Finland”}]}sequence“:”additional“,”affiliation“:[{”name“:”Karolinska Institute生物科学与营养系,芬兰赫尔辛基大学医学院基因组规模生物计划“}]},{”given“:”Esko“,”family“:”Ukkonen“,”sequence”:“additional”,“affiliance”:赫尔辛基信息技术研究所HIIT,芬兰赫尔辛基“},{“name”:“赫尔辛基大学医学院计算机科学系”}]}],“member”:“286”,“published-online”:{“date-parts”:[[2016,12,5]]},“reference”:[{“key”:“2023020204412761400_btw683-B1”,“doi-asserted-by”:“crossref”,“first-pages”:“333”,“DOI“:”10.1145\/360825.360855“,”article-title“:”高效字符串匹配:书目搜索辅助“,”volume“:”18“,”author“:”Aho“,”year“:”1975“,”journal-title”:“Commun。ACM“},{”key“:”2023020204412761400_btw683-B2“,”doi-asserted-by“:”crossref“,“first page”:“12.”,“doi”:“10.1371 \/journal.pcbi.0040005”,“article-title”:“In silico detection of sequence variations modifying transcription regulation”,“volume”:”4“,”author“:”Andersen“,”year“:”2008“,”journal-title“:”PLoS Compute.Biol“}”,{“key”:2023020204412761400_btw683-B3“,“doi-asserted-by”:“crossref”,“first page”:“1”,“doi”:“10.1371\/journal.pone.0020059”,“article-title”:“蛋白质结合微阵列中转录因子结合亲和力预测的线性模型”,“volume”:”6“,“author”:“Annala”,“year”:“2011”,“journal-title“:”PLoS ONE“}”,{“key”:“20230202044 12761400_ btw683-44”,“author“:”Beckstette“,”year“:”2004“},{“key”:“2023020204412761400_btw683-B5”,“doi-asserted-by”:“crossref”,“first-pages”:“1429”,“doi”:“10.1038\/nbt1246”,“article-title”:“紧凑、通用的DNA微阵列,以全面确定转录因子结合位点特异性”,“volume”:”24“,“author”:“Berger”,“year”:“2006”,“journal-title“:”Nat。Biotechnol“},{“key”:“2023020204412761400_btw683-B6”,“author”:“Dorohonceanu”,“year”:“2000”},{“key”:“2023020204412761400_btw683-B7”,“doi asserted by”:“crossref”,“首页”:“621”,“doi”:“10.1089\/cmb.2012.0289”,“文章标题”:“使用广义位置权重矩阵模型快速匹配转录因子基序”,“volume”:“20”,“author”:“贾昆塔“,“年份”:“2013年”,“新闻标题”:“J.Comput。Biol“},{“key”:“2023020204412761400_btw683-B8”,“doi-asserted-by”:“crossref”,“first page”:”1“,“doi”:“10.1016\/j.tcs.2014.06.032”,“article-title”:“使用间隙模式的Motif匹配”,“volume”:《548》,“author”:“Giaquinta”,“year”:“2014”,“journal title”:”Theor.Comput.Sci“}”,{”key“202302204412761400_b tw683-B9“,”doi-asserted-by“:”crossref“,”第一页“:”4355“,”DOI“:”10.1073\/pnas.84.13.4355“、”文章标题“:”剖面分析:检测远相关蛋白“、”体积“:”84“、”作者“:”Gribskov“、”年份“:”1987“、”期刊标题“:“Proc。国家。阿卡德。科学。美国A“},{”key“:”2023020204412761400_btw683-B10“,”doi-asserted-by“:”crossref“,”first page“:“111”,“doi”:“10.1016\/0076-6879(90)83009-X”,“article-title”:“使用核苷酸序列数据库查找蛋白质相似性”,“volume”:“183”,“author”:“Henikoff”,“year”:“1990”,“journal-title“:”Methods Enzymol“}”,{“key”:_btw683-B11“,”doi-asserted-by“:”crossref“,”first page“:”327“,”doi“:”10.1016\/j.cell.2012.009“,”article-title“:”DNA-binding specifitities of human transcription factors“,”volume“:“152”,”author“:”Jolma“,”year“:”2013“,”journal-title”:“cell”},{“key”:“2023020204412761400_btw683-B12”,”doi-assert-by“I“:”10.1093\/生物信息学\/btp554“,”article-title“:”MOODS:快速搜索DNA序列中的位置-权重矩阵匹配“,”volume“:”25“,”author“:”Korhonen“,”year“:”2009“,”journal-title”:“生物信息学”},{“key”:“2023020204412761400_btw683-B13”,“doi-asserted-by”:“crossref”,“doi”:“10.1142\/S021972013400040”,“article-title”从ChIP-Seq数据中的结合基序到转录因子结合位点的改进模型”,“卷”:“11”,“作者”:“Kulakovskiy”,“年份”:“2013年”,“期刊标题”:“J.Bioinf。计算。Biol“},{”key“:”2023020204412761400_btw683-B14“,”doi-asserted-by“:”crossref“,”first page“:“D116”,“doi”:“10.1093\/nar\/gkv1249”,“article-title”:“HOCOMOCO:转录因子结合位点模型集合的扩展和增强”,“volume”:“44”,“author”:“Kulakovskiy”,“year”:“2016”,“journal-title“:”Nucleic Acids Res“}”,{“key”:“2023020204412761400_btw683-B15”,“作者”:“Liefooghe”,“年份”:“2009”},{“密钥”:“2023020204412761400_btw683-B16”,“doi断言”:“crossref”,“首页”:“i524”,“doi”:“10.1093\/生物信息学\/btq378”,“文章标题”:“是rSNP:一种用于计算机调控SNP检测的新技术”,“卷”:“26”,“作者”:“麦金太尔”,“年份”:“2010”,“期刊标题”:”生物信息学“},{”key“:”2023020204412761400_btw683-B17“,”doi-asserted-by“:”crossref“,”first page“:“2471”,”doi“:”10.1093\/nar\/29.12.2471“,”article-title“:”一种新的定量多荧光相对亲和力(QuMFRA)分析确定的mnt阻遏物的非依赖性\u2013操作员相互作用“,”volume“:journal-title“:”Nucleic Acids Res“},{“key”:“2023020204412761400_btw683-B18”,“doi-asserted-by”:“crossref”,“doi”:“10.1371 \/journal.pcbi.1003214”,“article-title”:“The next generation of transcription factor binding site predication”,“volume”:”9“author”:“Mathelier”,“year”:“2013”,“journal-title”:“PLoS Compute.Biol”},}“key:”2023020204412761400_btw683-B19“,”doi-asserted-by“:”crossref“,”first page“:”D116“,”doi“:”10.1093\/nar\/gkv1176“,”article-title“:”Jaspar 2016:转录因子结合谱开放存取数据库的主要扩充和更新“,”volume“:“44”,”author“:”Mathelier“,”year“:”2016“,”journal-title”:“核酸研究”},{“key”:“2023020204412761400_btw683-B20”,“doi断言者”:“crossref”,“第一页”:“i117”,“doi”:“10.1093\/生物信息学\/btt221”,“文章标题”:“转录因子\u2013DNA结合特异性回归模型的稳定性选择”,“卷”:“29”,“作者”:“Mordelet”,“年份”:“2013”,“期刊标题”:“生物信息学”},{“密钥”:“2023020204412761400_btw683-B21“,”doi-asserted-by“:”crossref“,”doi“:”10.1038\/ncomms10050“,”article-title“:”E2F家族转录因子的DNA-结合特异性的结构见解“,”volume“:”6“,”author“:”Morgunova“,“year”:“2015”,”journal-title:“Nat.Comun”},{“key”:“2023020200412761400-btw683-B22”,“doi-assert-by”:”cross-ref“,“DOI“:”10.7554\/eLife.04837“,”article-title“:”在6亿年的双体进化中转录因子结合特异性的保存“,”volume“:”4“,”author“:”Nitta“,”year“:”2015“,”journal-title”:“eLife”},{“key”:“2023020204412761400_btw683-B23”,“DOI-asserted-by”:“crossref”,“first page”:”137“,”DOI“”:“10.1016\/j.tcs.2008.015”,“”article-title“:”快速配置文件匹配算法\u2013 a survey“,”volume“:”395“,”author“:”Pizzi“,”year“:”2008“,”journal-title”:“Theor。计算。Sci“},{”key“:”2023020204412761400_btw683-B24“,”doi-asserted-by“:”crossref“,”first page“:“69”,”doi“:”10.1109\/TCBB.2009.35“,”article-title“:”Finding significant matches of position weight matrix in linear time“,“volume”:“8”,“author”:“Pizzi”,“year”:“2011”,“journal-title”:“IEEE\/ACM Trans.Comput.Biol.Bioinf”},”{“key”:”2023020204412761400_btw683-B25“,”doi-asserted-by“:”crossref“,”first page“:”S7“,”doi“:”10.1186\/1471-2164-13-S4-S7“、”article-title“:”使用rSNP-MAPPER进行调控SNP的大尺度计算识别“,”volume“:由“:”插入crossref“,”first page“:”276“,”DOI“:”10.1007\/978-3-540-75530-2_25“,”volume-title“:”第十四届字符串处理与信息检索国际研讨会(SPIRE 2007)“,”author“:”Salmela“,”year“:”2007“},{“key”:“2023020204412761400_btw683-B27”,“DOI-asserted-by”:“crossrefs”,“first pages”:“e99015”,“DOI”:“10.1371”journal.pone.009915“,”article-title“:”通用成对相互作用模型提供了体内转录因子结合位点的准确描述“,”volume“:”9“,”author“:”Santolini“,”year“:”2014“,”journal-title”:“PLoS ONE”},{“key”:“2023020204412761400_btw683-B28”,“doi-asserted-by”:“crossref”,“first-page”:“e100154”,”doi“:”10.1371 \/journal.pcbi.1000154“,”article-title“:”基于特征的蛋白质-DNA相互作用建模方法“,”volume“:”4“,”author“:”Sharon“,”year“:”2008“,”journal-title”:“PLoS-Comput。Biol“},{“key”:“2023020204412761400_btw683-B29”,“doi-asserted-by”:“crossref”,“doi”:“10.1371\/journal.pone.0009722”,“article-title”:“用于预测转录因子结合位点的二核苷酸权重矩阵:泛化位置权重矩阵”,“volume”:2023020204412761400_btw683-B30“,“首页”:“gkw521.”,“文章标题”:“贝叶斯马尔可夫模型在预测核苷酸序列中的基序方面始终优于PWM”,“作者”:“Siebert”,“年份”:“2016年”,“期刊标题”:《核酸研究》},{“关键词”:“20230202044 12761400_ btw683-B31”,“首版”:“89”,“论文标题”:”计算在序列中发现模式的概率的方法”,“volume”:“5”,“author”:“Staden”,“year”:“1989”,“journal-title”:“Compute”。申请。Biosci公司。(CABIOS)“},{”key“:”2023020204412761400_btw683-B32“,”doi-asserted-by“:”crossref“,”first page“:“16”,”doi“:”10.1093\/生物信息学\/16.16“,”article-title“:”DNA结合位点:表示和发现“,”volume“:16”,“author”:“Stormo”,“year”:“2000”,“journal-title”:“生物信息学”},”{“key”:“20230202044 12761400_ btw683-433”,“doi-asserted-by”:“crossref“,”first page“:”2997“,”DOI“:”10.1093\/nar\/10.9.2997“,”article-title“:”使用\u2018perceptron\u2019算法区分大肠杆菌中的翻译起始位点“,”volume“:“10”,”author“:”Stormo“,”year“:”1982“,”journal-title”:“Nucleic Acids Res”},{“key”:“2023020204412761400_btw683-B34”,“DOI-asserted-by”:“crossrev”,“first page”:“68“,”DOI“:”10.1038\/nature15393“,”article-title“:”人类遗传变异的全球参考“,”volume“:”526“,”author“:”The 1000 Genomes Project Consortium“,”year“:”2015“,”journal-title”:“Nature”},{“key”:“2023020204412761400_btw683-B35”,”DOI-asserted-by“:”crossref“,”first page“:“860”,“DOI”:“10.1038\\35057062”,“article-title”人类基因组的初始测序和分析”,“卷”:“409”,“作者”:“基因组测序协会”,“年份”:“2001”,“期刊标题”:“自然”},{“关键”:“2023020204412761400_btw683-B36”,“首页”:“1754”,“文章标题”:《利用TRAP进行转录因子结合预测以分析ChIP-seq数据和调控SNP》,“卷“:“6”author“:”Thomas-Collier“,”year“:”2011“,”journal-title“:”BMC Genomics“},{“key”:“2023020204412761400_btw683-B37”,“doi-asserted-by”:“crossref”,“first-page”:“885”,“doi”:“10.1038\/ng.406”,“article-title”:“常见的结直肠癌易感性SNP rs6983267具有增强Wnt信号的潜力”,“volume”:”41“,“author”:“Tuupanen“,”year“:”2009“,”journal-title“:”Nat.Genet“},”{“key”:“2023020204412761400_btw683-B38”,”doi-asserted-by“:”crossref“,”first page“:”126“,“doi”:“10.1038\/nbt.2486”,“article-title”:“转录因子序列特异性建模方法评估”,“volume”:”31“,”author“:”Weirauch“,”年“:”2013“,”journal-ttitle“:“Nat.Biotech.ol“},{”key“:”2023020204412761400_btw683-B39“,”doi-asserted-by“:”crossref“,”first-pages“:”233“,”doi“:”10.1093\/生物信息学\/16.3.233“,”article-title“:”使用得分矩阵快速概率分析序列函数“,”volume“:“16”,”author“:”Wu“,”year“2000”,”journal-title”:“生物信息学”},{“key”:“20230202044 12761400-btw683-B40”,“doi-asserted-by“:”crossref“,”first page“:”781“,”doi“:”10.1534\/genestics.112.138685“,”article-title“:”使用非依赖性相互作用识别转录因子结合位点的改进模型“,”volume“:“191”,”author“:”Zhao“,”year“:”2012“,”journal-title”:“genetics”},{“key”:“2023020204412761400_btw683-B41”,”doi-assert-by“,”首页“:”3353“,”DOI“:”10.1093\/生物信息学\/btv328“,”article-title“:”atSNP:转录因子结合亲和力检测用于调节性SNP检测“,”volume“:”31“,”author“:”Zuo“,”year“:”2015“,”journal-title”:“生物信息学”}],”container-titlehttps:\/\/cademicial.oup.com/bioninformatics\/article-pdf\/33\/4\/514\/49037769\/bioinformatics_33_4_514.pdf“,”content-type“:”application\/pdf“,”content-version“:”vor“,”intended-application“:”syndication“},{”URL“:”https:\//ademiciational.oup.com\/bioinformatics\-article-pdf\/33 \/40\/514\/4903769\/bioinformatics_33_4 _514。pdf“,”content-type“:”未指定“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,2,2],”date-time“:”2023-02-02T04:45:53Z“,”timestamp“:1675313153000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/academicial.oup.com/bioinformatics\/article\/33\/4\/514\/2726114”}},“substitle”:[],“editor”“:[{”given“:”Alfonso“,”family“:”Valencia“,”sequence“:”additional“,”affiliation“:[]}],”short-title“:[],”issued“:{”date-parts“:[[2016,12,5]]},”references-count“:41,”journal-issue“:”{“issue”:“4”,”published-print“:”date-parts“:[[2017,2,15]]}},“URL”:“http://\/dx.doi.org\/10.10093\/生物信息学\/btw683”,“relation”:{},“ISSN”:[“1367-4803”,“1367-4811”],“ISSN-type”:[{“value”:“1367-4.803”,“type“:”print“},{“value”:“1367-4811”,“type”:”electronic“}],“subject”:[],“published-other”:{“date-parts”:[[2017,2,15]]},“publisher”:}“dateparts”:[2016,12,5]]}}