{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,3,2],“日期-时间”:“2024-03-02T21:07:34Z”,“时间戳”:1709413654730},“参考-计数”:22,“出版商”:“Springer Science and Business Media LLC”,“问题”:“1”,“许可证”:[{“开始”:}“日期-零件”:[2021,2,9]],“日期时间”:“2021-02-09T00:00:00Z”,“timestamp”:161282880000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/creativecommons.org\/licenses\/by\/4.0”},{“start”:{“date-parts”:[[2021,2,9]],“date-time”:“2021-02-09T00:00:00Z”,“timetamp”:6128288000000},commons.org\/licenses\/by\/4.0“}],“出资人”:[{“DOI”:“10.13039\\501100007601”,“name”:“Horizon 2020”,“doi断言者”:“publisher”,“award”:[“116026”,“874735”,“721815”],“id”:[{“id”:“10.13039\\501100007601”,“id type”:“doi”,“asserted by”:“publisher”}],“content domain”:{“domain”:[“link.springer.com”],“crosmark restriction”:false},“short container title”:[“BMC Bioinformations”],“已出版印刷品”:{“日期部分”:[[2021,12]]},“摘要”:“摘要<\/jats:title>\n个背景<\/jats:title>\n当前的高通量技术\u2014i.即全基因组测序、RNA-Seq、ChIP-Seq等\u2014\u2014产生了大量数据,并且其使用越来越广泛。涉及多个计算密集型步骤的复杂分析管道必须应用于越来越多的样本。工作流管理系统允许并行化和更有效地使用计算能力。然而,这主要是通过一次将可用岩芯分配给单个或几个样本\u2019管道来实现的。我们将此方法称为naive parallel策略(NPS)。在这里,我们讨论一种替代方法,我们称之为concurrent<\/jats:italic>执行策略(CES),它在每个样本\u2019s管道中平均分配可用的处理器<\/jats:p>\n<\/jats:sec>\n个结果<\/jats:title>\n理论上,我们表明,在宽松的条件下,CES的结果具有显著的加速比,理想的增益范围从1到样本数。此外,我们还观察到,CES的执行速度甚至更快,因为并行计算任务的规模是次线性的。实际上,我们在一个完整的外显子组测序管道上测试了这两种策略,并将其应用于三对公开获得的胃肠道间质瘤匹配肿瘤正常样本对。与NPS相比,CES在延迟方面实现了2 \u20132.4的加速<\/jats:p>\n<\/jats:sec>\n个结论<\/jats:title>\n我们的结果表明,如果进一步调整资源分配以适应特定情况,则可以在多个样本管道执行的性能方面获得更大的提高。为了实现这一点,有必要对管道中包含的工具进行基准测试。我们认为,这些基准应该由2019年工具开发人员始终如一地执行。最后,这些结果表明,并发策略还可以通过使低功耗机器集群的使用变得可行,从而节省能源和成本<\/jats:p>\n“,”DOI“:”10.1186\/s12859-020-03780-3“,”type“:”journal-article“,”created“:{”date-parts“:[[2021,2,9]],”date-time“:”2021-02-09T18:13:51Z“,”timestamp“:1612894431000},”update-policy“:d-by-count“:3,”标题“:[”并发对整个外显子组测序管道性能的影响“],”前缀“:”10.1186“,”卷“:”22“,”作者“:[{”给定“:”Daniele“,”家族“:”Dall\u2019Olio“,”序列“:”first“,”affiliation“:[]},{”given“:”Nico“,”family“:”Curti“,”sequence“:”additional“,”从属“:[]},“given”:“Eugenio”,“family”:“Fonzi”,“sequence”:“additional”,“affiliation“:[]},{“ORCID”:“http://\/ORCID.org\/00000-0002-4889-1047”,“authenticated-ORCID”:false,“给定”:“Claudia”,“family”:“Sala”,“sequence”:“additional”,“affiliance”:[]}“:[]},{”给定“:”Enrico“,”family“:”Giampieri“,”sequence“:”additional“,”affiliation“:[]}],”member“:”297“,”published-online“:{”date-parts“:[2021,2,9]]},”reference“:[{”key“:”3780_CR1“,”doi-asserted-by“:“publisher”,“doi”:“10.1093\/生物信息学\/btp324”,”author“:”H Li“,“year”:“2009”,“unstructured”:“Li H,Durbin R。使用Burrows\u2013Wheeler变换快速准确地进行短读对齐。生物信息学。2009;. https:\/\/doi.org/10.1093\/生物信息学\/btp324.“,”期刊标题“:”生物信息学“},{”键“:”3780_CR2“,”doi断言“:”出版商“,”doi“:”10.1093\/生物信息学\/btp352“,”作者“:”H Li“,”年份“:”2009“,”非结构化“:”Li H,et al.The sequence alignment\/map format and SAMtools.Bioinformations.2009;https:\/\/doi.org\/10.1093\/生物信息学\/btp352.“,”journal-title“:”生物信息学“},{”key“:”3780_CR3“,”doi-asserted-by“:”crossref“,”unstructured“:”Houtgast EJ,et al。使用自适应负载平衡的GPU加速BWA-MEM基因组映射算法。摘自:第29届计算系统架构国际会议论文集\u2014ARCS 2016,第9637卷。柏林:施普林格;2016年,第130\u2013142页,“DOI”:“10.1007\/978-3-319-30695-7_10”},{“key”:“3780_CR4”,“DOI-asserted-by”:“publisher”,“DOI:”10.1007\/s10586-017-0874-8“,“author”:“NT Weeks”,“year”:“2017”,“unstructured”:“Weeks NT,Luecke GR.使用OpenMP任务优化SAMtools排序。Cluster Compute.2017;https:\\/DOI.org 0874-8.“,”journal-title“:”Cluster Compute“},{“key”:“3780_CR5”,“doi-asserted-by”:“publisher”,“doi”:“10.1093\/生物信息学\/btv706”,“author”:“C Schmied”,“year”:“2016”,“unstructured”:“Schmied C,et al.并行处理大型多视图SPIM记录的自动化工作流。生物信息学。2016;https:\/\/doi.org\/101093\/bioinformational\/btv 706。”,“journal-title“:“生物信息学”},{“key”:“3780_CR6”,“doi-asserted-by”:“publisher”,“doi”:“10.1186\/s40168-017-0318-y”,“author”:“VC Piro”,“year”:“2017”,“unstructured”:“Piro VC,et al.MetaMeta:集成元基因组分析工具以改进分类分析。Microbiopome.2017;https:\/\/doi.org\/10.1186\/s40168 \/017-0318-y.”,“journal-title”:“微生物组“},{“key”:“3780_CR7”,“doi-asserted-by”:“publisher”,“doi”:“10.1186\/s12859-018-2119-9”,“author”:“MI Cornwell”,“year”:“2018”,“unstructured”:“Cornwell-MI,et al.VIPER:RNA-seq可视化管道,一种用于高效完整RNA-seq.分析的Snakemake工作流.BMC生物信息学.2018;.https:\/\/doi.org\/10.1186\/s12859-018-2139-9.“,”journal-title“:”BMC生物信息学“},{”key“:”3780_CR8“,”doi-asserted-by“:”publisher“,”doi“:”10.1093\/bos480“,“author”:”J K\u00f6ster“,”year“:”2012“,”unstructured“:”K\u200f6ster J,Rahmann S.Snakemake\u2014a scalevelable Bioinformatics工作流引擎。生物信息学。2012;.https:\/\/doi.org\/10.1093\/生物信息学\/bts480.“,”journal-title“:”生物信息学“},{“key”:“3780_CR9”,“doi-asserted-by”:“publisher”,“doi”:“10.1093\/gigascience\/gix042”,“author”:“M Jafar Taghiyar”,“year”:“2017”,“unstructured”:“Jafar taghiyarM,et al.Kronos:基因组分析和信息学的工作流汇编器。gigascience.2017;.https:\/\/doi.org\/10.1093\/gigascience\/gix042.“,”journal-title“:”gigascience“},{“key”:“3780_CR10”,“doi-asserted-by”:“publisher”,“doi”:“10.1186\/s12859-018-2107-4”,“author”:“M Kluge”,“year”:“2018”,“unstructured”:“Kluge M,et al。Watchdog \u2014a用于大规模实验数据分布式分析的工作流管理系统。BMC生物信息学。2018;. https:\/\/doi.org/10.1186\/s12859-018-2107-4.“,”期刊标题“:”BMC生物信息学“},{”密钥“:”3780_CR11“,”doi断言“:”发布者“,”doi“:”10.1093\/ggigscience\/giz084“,”作者“:”M Kotliar“,”年份“:”2019“,”非结构化“:”Kotliar M等人。CWL气流:一个支持通用工作流语言的轻量级管道管理器。gigascience.2019;.https:\/\/doi.org\/10.1093\/gigascience\/giz084.“,”journal-title“:”gigascience“},{”key“:”3780_CR12“,”doi-asserted-by“:”publisher“,”unstructured“:”Amdahl GM.实现大规模计算能力的单处理器方法的有效性。In:AFIPS conference procedures \u20141967 spring joint computer conferences,AFIPS 1967;1967。https:\/\/doi.org\/10.1145\/1465482.1465560“,”doi“:”10.1145\/14654 82.146550“},{”key“:”3780_CR13“,”doi-asserted-by“:”publisher“,”unstructured“:”Curti N,et al.生物信息学管道的跨环境比较:混合计算视角。摘自:Euro-Par 2018:并行处理研讨会。Cham:Springer;2019,pp.638\u2013649。https:\/\/doi.org\/10.1007\/978-3-030-10549-5“,”doi“:”10.1007\/9783-030-10549-5“},{“key”:“3780_CR14”,“unstructured”:“Anaconda软件分发。https:\//Anaconda.com\/”},}“密钥”:“37.80_CR15”,“非结构化”:“FASTQC是高通量序列数据的质量控制工具。https://www.bioinformationals.babraham.ac.uk\/projects\/FASTQC\/”{,{“key“:”3780_CR16“,”doi-asserted-by“:”publisher“,”doi“:”10.1186\/1756-0500-5-337“,”author“:”S Lindgreen“,”year“:”2012“,”unstructured“:”Lindgreens S.AdapterRemoval:轻松清洁下一代测序读数。BMC Res注释。2012;. https:\/\/doi.org\/10.1186\/1756-0500-5-337.“,”journal-title“:”BMC Res Notes“},{”key“:”3780_CR17“,”unstructured“:”Picard.http:\/\/broadinstitute.github.io\/Picard\/“}”,{“key”:“3780_CR18”,“doi-asserted-by”:“publisher”,“doi”:“10.1101\/gr.107524.110.20”,“author”:“A McKenna”,“year”:“2010”,“非结构化”:“McKenna A、Hanna M、Banks E、Sivachenko A、Cibulskis K、Kernytsky A、Garimella K、Altshuler D、Gabriel S、Daly M、DePristo MA。基因组分析工具包:用于分析下一代DNA测序数据的MapReduce框架。基因组研究2010;。https:\/\/doi.org\/10.101\/gr.107524.110.20.“,”journal-title“:”Genome Res“},{“key”:“3780_CR19”,“doi-asserted-by”:“publisher”,“doi”:“10.1038\/nbt.2514”,“author”:“K Cibulskis”,“year”:“2013”,“unstructured”:“Cibulski K,Lawrence MS,Carter SL,Sivachenko A,Jaffe D,Sougnez C,Gabriel S,Meyerson M,Lander ES、Getz G。对不纯和异质性癌症样本中的体细胞点突变进行敏感检测。国家生物技术公司。2013;. https:\/\/doi.org\/10.1038\/nbt.2514.“,”journal-title“:”Nat Biotechol“},{“key”:“3780_CR20”,“doi-asserted-by”:“publisher”,“doi”:“10.1101\/gr.129684.111”,“author”:“DC Kobolt”,“year”:“2012”,“unstructured”:“Kobolt DC,Zhang Q,Larson DE,Shen D,McLellan MD,Lin L,Miller CA,Mardis ER,Ding L,Wilson RK。VarScan 2:通过外显子组测序发现癌症中的体细胞突变和拷贝数改变。基因组研究2012;。https:\/\/doi.org\/10.101\/gr.129684.111.“,”journal-title“:”Genome Res“},{“key”:“3780_CR21”,“doi-asserted-by”:“publisher”,“doi”:“10.1093\/nar\/gkq603”,“author”:“K Wang”,“year”:“2010”,“unstructured”:“Wang K,Li M,Hakonson H.ANNOVAR:高通量测序数据中遗传变异的功能注释。核酸研究,2010;.https:\/\/doi.org\/10.1093\/nar\/gkq603.“,”journal-title“:核酸研究”},{“key”:“3780_CR22”,“unstructured”:“Bethesda(MD):美国国家医学图书馆,N.C.f.B.I.:国家生物技术信息中心(NCBI)。https:\/\/www.NCBI.nlm.nih.gov\/“}”,“updated-by”:[{“updated”:{“date-parts”:[2021,6,1]],“日期时间”:“2021-06-01T00:00:00Z“,”timestamp“:1622505600000},”DOI“:”10.1186\/s12859-021-04205-5“,”type“:”correction“,”label“:”correction“}],”container-title“:[”BMC生物信息学“],”original-title”:[],”language“:”en“,”link“:[{”URL“:”https:\/\/link.springer.com/content\/pdf\/10.1186\/s12859-02780-3.pdf“,”content-type“:”application\/pdf“,”content-version“:”vor“,”intended-application“:”text-mining“},{”URL“:”https:\/\/link.springer.com/article\/10.1186\/s12859-020-03780-3\/fulltext.html“,”content-type“:”文本\/html“,”内容-version“:”vor“、”intended-applicance“:”text-mining应用程序\/pdf“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2021,7,30]],”date-time“:”2021-07-30T21:09:09Z“,”timestamp“:1627679349000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/bmcbioinformations.biomedcentral.com/articles\/10.1186\/s12859-020-03780-3”}},“subtitle”:[],“short”标题“:[],”发布“:{”date-parts“:[[2021,2,9]]},“references-count”:22,“journal-issue”:{“issue”:“1”,“published-print”:{-“date-part”:[[2021,12]]}},”alternative-id“:[”3780“],“URL”:“http://\/dx.doi.org\/10.1186\/s12859-020-03780-3”,“relation”:{-has-preprint“:[{”id-type“:”doi“,”id“:”10.21203\/rs.3.rs-16453\/v1“,”asserted-by“:”object“}]},”ISSN“:[”1471-2105“],”ISSN-type“:[{”value“:“1471-2105”,“type”:“electronic”}],“subject”:[],“published”:{“date-parts”:[[2021,2,9]]},“assertion”:[{“value”:”2020年2月28日“,“order”:1,“name”:“received”,“label”:“received”,”group“name:”ArticleHistory“,”label“:”Article History组“:{”名称“:”ArticleHistory“,”label“:”Article History”}},{“value”:“2021年2月9日”,“order”:3,“name”:“first_online”,“label”:“首次联机”,“group”:{“name”:“ArticleHistory”,“标签”:“Article History“},”value“:”2021年6月1日“,”order“:4,”name“:”change_date“,”标签“:”更改日期“,”group“:{”name“:”Article-History“:”更正“,”order“:5,”name“:”change_type“,”label“:”change type“,”group“:“,”URL“:”https://doi.org/10.1186\\s12859-021-04205-5“,”order“:7,”name“:”change_details“,”label“:”更改详细信息“,”group“:{”name“:”ArticleHistory“,”label“:”ArticleHistory“}},{”value“:”不适用“,”order“:1,”name“:”Ethics“,”group“:{”name“:”EthicsHeading“,”label“:”Ethics approvement and consent to participation“}}},{”value“:”不适用“,”order“:2,”name“:”Ethics“,”group“: