摘要
背景
结果
结论
背景
实施
C库接口
指令集和CPU调度
条带化矢量化的改进
代码生成
验证
Parasail对准器应用
结果
软件
-
parasail带条纹剖面图41_128 , -
parasail_sw_striped_profile_avx2_256秒 , -
parasail_nw_striped_profile_sse41_128_16 , -
parasail_nw_striped_profile_avx2_256_16 , -
parasail_nw_scan_profile_sse41_128_16 , -
parasail_nw_scan_profile_avx2_256_16 , -
副邮件_打印_剖面_ SE41_128_16 , -
副邮件_打印_剖面_ vx2_256_16 , -
副邮件扫描配置文件SE41_128_16 、和 -
副邮件扫描配置文件avx2_256_16 .
硬件
数据库和查询序列
得分矩阵和差距惩罚
线程评估
查询长度评估
评分系统评估
全球和半全球实施评估
讨论
结论
可用性和要求
缩写
GCUPS: -
每秒千兆个单元更新 模拟时间: -
单指令多数据 SSE、SSE2、SSE4.1: -
第2版或第4.1版数据流单指令多数据扩展指令集 AVX、AVX2: -
高级向量扩展,版本2 软件: -
Smith-Waterman局部线形 西北: -
Needleman-Wunsh全球联盟 新加坡: -
半全局对齐
工具书类
Henikoff S、Henikoft JG。 蛋白质块的氨基酸替代矩阵。 Proc Nat科学院。 1992; 89(22):10915–9. 州DJ、Gish W、Altschul SF。 使用特定应用的评分矩阵提高核酸数据库搜索的敏感性。 方法。 1991; 3(1):66–70. 数字对象标识: 10.1016/S1046-2023(05)80165-3 . Gotoh O.一种改进的生物序列匹配算法。 分子生物学杂志。 1982; 162(3):705–8. 数字对象标识: 10.1016/0022-2836(82)90398-9 . Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ。基本本地对齐搜索工具。 分子生物学杂志。 1990; 215(3):403–10. 数字对象标识: 10.1016/S0022-2836(05)80360-2 . 沃兹尼亚克A.使用视频指令加快序列比较。 计算应用程序Biosci CABIOS。 1997; 13(2):145–50. 数字对象标识: 10.1093/生物信息学/13.2.145 . Rognes T,Seeberg E.在普通微处理器上使用并行处理将smith–waterman序列数据库搜索速度提高了六倍。 生物信息学。 2000; 16(8):699–706. 数字对象标识: 10.1093/生物信息学/16.8.699 . Farrar M.Striped smith–与其他simd实现相比,waterman将数据库搜索速度提高了六倍。 生物信息学。 2007; 23(2):156–61. 数字对象标识: 10.1093/生物信息学/btl582 . Rognes T.通过序列间simd并行化加快smith-waterman数据库搜索。 BMC生物信息学。 2011; 12(1):221。 Zhao M,Lee WP,Garrison EP,Marth GT.Ssw文库:用于基因组应用的simd-smith-waterman c/c++文库。 《公共科学图书馆·综合》。 2013; 8(12):82138. 数字对象标识: 10.1371/journal.pone.0082138 . Liu Y,Schmidt B.Swaphi:关于xeon phi协处理器的Smith-waterman蛋白质数据库搜索。 在:应用特定系统、架构和处理器(ASAP),2014年IEEE第25届国际会议,日期:2014年。 第184–5页。 数字对象标识: 10.1109/ASAP.2014.6868657 . Wang L,Chan Y,Duan X,Lan H,Meng X,Liu W.Xsw:加速xeon phi上的生物数据库搜索。 参见:并行和分布式处理研讨会(IPDPSW),2014 IEEE国际:2014。 第950-7页。 数字对象标识: 10.1109/IPDPSW.2014.108 . Daily J.用于分析极端规模宏基因组数据的可扩展并行方法:华盛顿州立大学论文; 2015 https://research.wsulibs.wsu.edu/xmlui/handle/2376/5503 。于2015年10月9日访问。 Daily J,Kalyanaraman A,Krishnamoorthy S,Vishnu A.一种基于工作窃取的方法,用于实现可扩展的最佳序列同源性检测。 J并行分布式计算。 2015; 79–80(0):132–42. 数字对象标识: 2016年10月10日/j.jpdc.2014.08.009 . Šošic M.一个simd动态编程c/c++库:萨格勒布大学论文; 2015 https://bib.irb.hr/datoteka/758607.diplomski_Martin_Sosic.pdf . Frielingsdorf JT公司。 通过simd加速库改进最佳序列比对:奥斯陆大学论文; 2015 http://urn.nb.no/urn:NBN:否 -49935 。2015年12月10日查阅。 Szalkowski A、Ledergerber C、Krahenbuhl P、Dessimoz C.Swps3-用于ibm cell/b.e.和x86/sse2的快速多线程矢量化smith-waterman。 BMC Res注释。 2008; 1(1):107. Abouelhoda MI,Kurtz S,Ohlebusch E.7。 作者:阿鲁鲁·S,编辑。 增强的后缀数组和应用程序。 佛罗里达州博卡拉顿:查普曼和霍尔/CRC:2005。 第27页。 Fischer J.诱导LCP阵列In:Dehne F,Iacono J,Sack J-R,编辑。 第十二届算法和数据结构国际会议论文集(WADS’11)。 柏林,海德堡:Springer-Verlag:2011。 第374-85页。 Camacho C、Coulouris G、Avagyan V、Ma N、Papadopoulos J、Bealer K、Madden TL。Blast+:架构和应用。 BMC生物信息学。 2009; 10:421–1。 数字对象标识: 10.1186/1471-2105-10-421 . 超线程。 网站。 https://www.nersc.gov/users/computational-systems/edison/performance-and-optimization/hyper-threading/ 。访问时间:2015-11-17。 UniProt联盟。 Uniprot:蛋白质信息中心。 核酸研究2015; 43(D1):204-12。 数字对象标识: 10.1093/nar/gku989 . 蛋白质BLAST:使用蛋白质查询搜索蛋白质数据库。 网站。 http://blast.ncbi.nlm.nih.gov/blast.cgi?PAGE=蛋白质 ,访问时间:2015-11-17。 scikit-bio网站。 http://scikit-bio.org/ ,访问日期:2015-11-06。
致谢
作者信息
作者和附属机构
通讯作者
其他信息
竞争性利益
其他文件
附加文件1
权利和权限