极致 swMATH ID: 29727 软件作者: Sahli M、Mansour E、Kalnis P 描述: ACME:一个可扩展的并行系统,用于从很长的序列中提取频繁模式。现代应用,包括生物信息学、时间序列和网络日志分析,需要从一个很长(即数GB)的序列中提取称为基序的频繁模式。现有的方法要么是容易出错的启发式方法,要么是速度极慢的精确(也称为组合)方法,因此只适用于非常小的序列(即兆字节级)。本文介绍了ACME,这是一种可扩展到千兆字节长序列的组合方法,也是第一个支持超最大基序的方法。ACME是一个多功能并行系统,可以部署在桌面多核系统上,也可以部署在云中数千个CPU上。然而,由于相关的开销,仅仅使用更多的计算节点并不能保证效率。为此,ACME引入了一种自动调优机制,建议使用适当数量的CPU,以满足用户在运行时间方面的限制,同时最小化云资源的财务成本。我们的实验表明,与现有技术相比,ACME支持三个数量级更长的序列(例如,整个人类基因组的DNA);处理大型字母表(例如,维基百科的英文字母表);在一台超级计算机上扩展到16384个CPU;并支持云中的弹性部署。 主页: https://dl.acm.org/citation.cfm?id=2691549 相关软件: MAVisto公司;算法97;PAML公司;ClustalW公司;国防部;MultiPhyl公司;PathBLAST(路径BLAST);格雷姆林;卡沃什;NeMoFinder公司;巴拉圭人;基因智慧;MotifClick(鼠标点击);ParaMEME公司;普鲁斯塔尔;路透社;阵列Express;GenBank(基因银行);FANMOD公司;算法457 引用于: 1文件 由1位作者引用 1 卡罕·埃尔西耶斯 连载1篇 1 计算生物学 在3个字段中引用 1 组合数学(05-XX) 1 计算机科学(68至XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文