×

蛋白质组学中的加速计算方法。 (英语) Zbl 1444.92074号

Ganesh Naik(编辑),生物医学信号处理。理论、算法和应用的进展。新加坡:斯普林格。序列号。生物工程。,389-432 (2020).
摘要:计算生物信息学领域的新技术和研究的出现彻底改变了生物数据的生成速度。因此,蛋白质组学和基因组学数据的贡献增加了许多倍,每18个月翻一番。因此,蛋白质组学研究中涉及的操作已成为计算密集型的。蛋白质鉴定是蛋白质组学研究的一个基本过程,需要从大型蛋白质数据库中鉴定一种或多种蛋白质。通过协助生物标记物识别和发现未来医学处方,它被严格用于疾病诊断和预后。如今,质谱是蛋白质组学研究中广泛使用的分析工具,其中包括作为基本步骤的峰值检测和数据库搜索。为了应对蛋白质组学领域生物数据的不断增长,蛋白质鉴定需要加速和高效的解决方案。本章主要从蛋白质鉴定的算法和体系结构角度,回顾质谱数据峰值检测和字符串数据库搜索的各种硬件加速方法。
关于整个系列,请参见[Zbl 1433.92003年].

MSC公司:

92D20型 蛋白质序列,DNA序列
92-08 生物学问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Garret,R.H.,Grisham,C.M.:生物化学。圣智学习(2013)
[2] Ebbing,D.,Gammon,S.D.:普通化学。Cengage Learning(2010年)
[3] Abhai,K.,Verma,A.,Mishra,V.N.,Singh,S.:基于蛋白质组学的差异血浆蛋白和白质完整性变化的识别,作为早期检测阿尔茨海默病高危轻度认知障碍患者的标记物。神经科学。莱特。676, 71-77 (2018)
[4] Pinker,K.,Chin,J.,Melsaether,A.N.,Morris,E.A.,Moy,L.:乳腺癌的精确医学和放射基因组学:诊断和治疗的新方法。放射学287(3),732-747(2018)·doi:10.1148/radiol.2018172171
[5] Buchberger,A.R.、DeLaney,K.、Johnson,J.、Li,L.:质谱成像:新兴进展和未来见解综述。分析。化学。90(1), 240-265 (2017) ·doi:10.1021/acs.analchem.7b04733
[6] Bischoff,R.,Luider,T.M.:蛋白质和肽疾病标志物发现的方法学进展。J.色谱法。B 803(1),27-40(2004)·doi:10.1016/j.jchromb2003.09.004
[7] Boschetti,E.,D'Amato,A.,Candiano,G.,Righetti,P.G.:用于早期检测疾病的蛋白质生物标记物:组合肽配体库的决定性贡献。《蛋白质组学杂志》188,1-14(2018)·doi:10.1016/j.jprot.2017.08.009
[8] Clarke,W.,Zhang,Z.,Chan,D.W.:临床蛋白质组学在癌症和其他疾病中的应用。临床。化学。《医学实验室》41(12),1562-1570(2003)·doi:10.1515/CCLM.2003.239
[9] Sallam,R.M.:癌症生物标记物发现中的蛋白质组学:挑战和应用。数字化信息系统。马克2015(2015)
[10] Wu,L.,Qu,X.:癌症生物标志物检测:最近的成就和挑战。化学。Soc.Rev.44(10),2963-2997(2015)·doi:10.1039/C4CS00370E
[11] Petricoin,E.F.,Zoon,K.C.,Kohn,E.C.,Barrett,J.C.,Liotta,L.A.:临床蛋白质组学:将床边承诺转化为床边现实。国家药品监督管理局。1(9), 683 (2002) ·doi:10.1038/nrd891
[12] Bloss,C.S.、Jeste,D.V.、Schork,N.J.:疾病治疗和预防的基因组学。精神病临床。34(1), 147-166 (2011)
[13] Aebersold,R.M.M.:基于质谱的蛋白质组学。《自然》422198-207(2003)·doi:10.1038/nature01511
[14] Henzel,W.J.等人:蛋白质鉴定:肽质量指纹的起源。《美国社会质谱学杂志》。14(9), 931-942 (2003) ·doi:10.1016/S1044-0305(03)00214-9
[15] Bogdán,I.A.等人:用于实时肽质量指纹的并行数据库搜索引擎的高性能硬件实现。生物信息学24(13),1498-1502(2008)·doi:10.1093/bioinformatics/btn216
[16] Gras,R.等:通过参数化多级评分算法和优化的峰值检测,从肽质量指纹改进蛋白质识别。电泳20,3535-50(1999)·doi:10.1002/(SICI)1522-2683(19991201)20:18<3535::AID-ELPS3535>3.0.CO;2至J
[17] Adam,B.等人:血清蛋白指纹结合模式匹配算法将前列腺癌与良性前列腺增生和健康男性区分开来。《癌症研究》62,3609-3614(2002)
[18] Coombes,K.等人:通过使用非抽取离散小波变换对光谱进行去噪,改进了从表面增强激光解吸和电离获得的质谱数据的峰值检测和量化。蛋白质组学5,4107-17(2005)·doi:10.1002/pmic.200401261
[19] Mantini,D.等人:LIMPIC:一种从噪声中分离蛋白质信号的计算方法。BMC生物信息。8, 101 (2007) ·doi:10.1186/1471-2105-8-101
[20] Satten,G.等人:用于分类全有机体细菌样本的质谱标准化和去噪算法。生物信息学20(17),3128-36(2004)·doi:10.1093/bioinformatics/bth372
[21] Yasui,Y.等人:质谱仪高维蛋白质测量的自动峰值识别/校准程序。J.生物识别。生物技术。4, 242-8 (2003) ·网址:10.1155/S111072430320927X
[22] Diamandis,E.:质谱作为一种诊断和癌症生物标志物发现工具:机会和潜在的局限性。分子细胞蛋白质组学3(4),367-78(2004)·doi:10.1074/mcp。R400007-MCP200型
[23] Mantini,D.等人:从MALDI-TOF质谱中提取可靠蛋白质信号图谱的独立成分分析。生物信息学24,63-70(2008)·doi:10.1093/bioinformatics/btm533
[24] Zerck,A.等人:基于lc-ms/ms的鸟枪蛋白质组学的前体离子选择迭代策略。《蛋白质组研究杂志》8(7),3239-3251(2009)·数字对象标识码:10.1021/pr800835x
[25] Peace,R.J.等人:使用细胞宽带引擎进行ms/ms蛋白质鉴定的精确字符串匹配。CMBES程序。33(1), (2018)
[26] Benson,D.,Cavanaugh,M.,Clark,K.,Karsch-Mizrachi,I.,Lipman,D.,Ostell,J.,Sayers,E.:基因银行。核酸研究45(1)(2016)
[27] 周,C.,等:通过最长公共前缀加速串联质谱数据库搜索。BMC生物信息。11(1),577(2010)·doi:10.1186/1471-2105-11-577
[28] Aho,A.V.,Corasick,M.J.:高效字符串匹配:书目搜索的辅助工具。Commun公司。ACM 18(6),333-340(1975)·Zbl 0301.68048号 ·doi:10.1145/360825.360855
[29] Schadt,E.E.等人:大规模数据管理和分析的计算解决方案。Nat.Rev.基因。11(9), 647 (2010) ·doi:10.1038/nrg2857
[30] Aluru,S.,Jammula,N.:计算基因组学硬件加速综述。IEEE设计。测试31(1),19-30(2014)·doi:10.1109/MDAT.2013.2293757
[31] Arram,J.等人:利用fpgas加速短读对齐。IEEE/ACM传输。计算。生物信息。(TCBB)14(3),668-677(2017)·doi:10.1109/TCBB.2016.2535385
[32] Shyu、K.K.、Lee、M.H.、Wu、Y.T.、Lee和P.L.:流水线fastICA在FPGA上的实现,用于实时盲源分离。IEEE传输。神经网络。19(6), 958-970 (2008) ·doi:10.1109/TNN.2007.915115
[33] Yang,C.H.,Shih,Y.H.,Chiueh,H.:用于癫痫发作检测的fastica处理器。IEEE传输。生物识别。电路系统。9(1), 60-71 (2015)
[34] Mammone,N.,Foresta,F.L.,Morabito,F.C.:通过小波ica从多通道头皮脑电图中自动剔除伪影。IEEE Sens.J.12(3),533-542(2012)·doi:10.1109/JSEN.2011.2115236
[35] Van,L.D.,Wu,D.Y.,Chen,C.S.:生物医学信号分离的高效快速实现。IEEE传输。神经网络。22(11), 1809-1822 (2011) ·doi:10.1109/TNN.2011.2166979
[36] Bhardwaj,S等人:在线和自动化可靠的系统设计,可消除脑电图中的眨眼和肌肉伪影。摘自:2015年第37届IEEE医学和生物学会工程国际年会(EMBC),第6784-6787页(2015)
[37] Naik,G.R.等人:一种基于ica-ebm的表面肌电分类器,用于识别患有或不患有膝关节病变的个体的下肢运动。IEEE传输。神经系统。Rehabil.Eng.26(3),675-686(2018)·doi:10.1109/TNSRE.2018.2796070
[38] Jiménez-González,A.,James,C.J.:从有噪声的腹部留声机中提取源:一种单通道盲源分离方法。医学生物学。工程计算。47(6), 655-664 (2009) ·doi:10.1007/s11517-009-0474-8
[39] Jiménez-González,A.,James,C.J.:基于时间结构的生理独立源重建,从有噪声的腹部录音中提取。IEEE传输。生物识别。工程57(9),2322-2330(2010)·doi:10.10109/TBME.201210.2051226
[40] Zou,X.,等:基于ica空间映射算法的语音信号增强。IEEE传输。信号处理。56(5), 1812-1820 (2008) ·Zbl 1390.94517号 ·doi:10.1109/TSP.2007.910555
[41] Lee,H.Y.,等:基于Dnn的特征增强,使用方位约束ica进行鲁棒语音识别。IEEE信号处理。莱特。23(8), 1091-1095 (2016) ·doi:10.1109/LSP.2016.2583658
[42] Hyvärinen,A.:独立成分分析的快速稳健定点算法。IEEE传输。神经网络。10(3),626-634(1999)·数字对象标识代码:10.1109/72.761722
[43] Oja,E.,Yuan,Z.:重温fastica算法:收敛性分析。IEEE传输。神经网络。17(6), 1370-1381 (2006) ·doi:10.1109/TNN.2006.880980
[44] Gotze,J.,Paul,S.,Sauer,M.:并行特征值计算的高效Jacobi-like算法。IEEE传输。计算。42(9), 1058-1065 (1993) ·Zbl 1396.65087号 ·数字对象标识代码:10.1109/12.241595
[45] Acharyya,A.等人:基于坐标旋转的低复杂度n-d快速算法和架构。IEEE传输。信号处理。59(8),3997-4011(2011)·Zbl 1392.94060号 ·doi:10.1109/TSP.2011.2150219
[46] Hyyrö,H.等人:关于独特寡核苷酸的精确字符串匹配。计算。《生物医学》35(2),173-181(2005)·doi:10.1016/j.compbiomed.2003.11.003
[47] Sahab,Z.J.等人:人类血清中疾病生物标志物鉴定的方法和应用。Biomark.见解2,117727190700200034(2007)·doi:10.1177/117727190700200034
[48] Brudno,M.等人:大基因组序列的快速和敏感的多重比对。BMC生物信息。4(1), 66 (2003) ·doi:10.1186/1471-2105-4-66
[49] Michael,M.等人:利用基序锚定对基因组序列进行快速和敏感的局部比对。生物信息学21(9),2093-2094(2004)·doi:10.1093/bioinformatics/bti224
[50] Alex,A.T.等:用于质谱分析的硬件加速蛋白质鉴定。快速通讯。质谱。Int.J.致力于快速传播。最新研究质谱。19(6), 833-837 (2005) ·doi:10.1002/rcm.1853
[51] Dandass,Y.S.等:加速fpga硬件中的字符串集匹配,用于生物信息学研究。BMC生物信息。9(1), 197 (2008) ·doi:10.1186/1471-2105-9-197
[52] Gudur,V.Y.、Thallada,S.、Deevi,A.R.、Gande,V.K.、Acharyya,A.、Bhandari,V.、Sharma,P.、Khursheed,S.和Naik,G.R.:蛋白质鉴定的可重构软硬件协同设计方法。摘自:2016年第38届IEEE医学和生物学会工程国际年会(EMBC),第456-2459页(2016)
[53] Kim,H.,Choi,K.I.:在fpga中使用合并状态转换的基于流水线的非确定性有限自动机的字符串匹配方案。PLoS ONE 11(10),e016535(2016)·doi:10.1371/journal.pone.0163535
[54] Maxfield,C.:《FPGA设计勇士指南:设备、工具和流程》。Elsevier(2004)
[55] Palnitkar S(2003)Verilog HDL:数字设计和合成指南,第1卷。普伦蒂斯·霍尔专业
[56] Dm,S.等:人类生物标记物发现和异基因干细胞移植后特发性肺炎综合征疾病进展的预测模型。分子细胞蛋白质组学11(6)(2012)
[57] Brody,E.等人:生命的简单措施:解开蛋白质组。分子生物学杂志。422(5), 595-606 (2012) ·doi:10.1016/j.jmb.2012.06.021
[58] Heikkinen,M.等人:硫酸铝质谱的独立成分分析。世界科学院。科学。工程技术。26, 173-177 (2007)
[59] Chen,Y.,Wolfgang,W.,Hohenwarter,W.:利用二氧化钛磷酸肽富集和质量准确度前体比对对拟南芥中植物激素响应的磷酸蛋白进行比较分析。《植物杂志》63,1-17(2012)
[60] Bhardwaj,S.、Raghuraman,S.和Acharyya,A.:D FastICA的基于坐标旋转和矢量叉积的硬件加速器。2017年欧洲电路理论与设计会议(ECCTD),第1-4页(2017)
[61] Bhardwaj,S.等人:基于向量叉积和坐标旋转的nd杂交快速算法。J.低功率电子。14(2), 351-364 (2018) ·doi:10.1166/jolpe.2018.1551
[62] Hyvärinen,A.,Oja,E.:独立成分分析的快速定点算法。神经计算。9(7), 1483-1492 (1997) ·doi:10.1162/neco.1997.9.7.1483
[63] Bravo,I.,Mazo,M.,Lazaro,J.L.,Jimenez,P.,Gardel,A.,Marron,M.:基于面向fpga的新型硬件架构,用于解决特征问题。IEEE传输。超大规模集成。(VLSI)系统。16(12), 1722-1725 (2008) ·doi:10.1010/TVLSI.2008.2001939
[64] Volder,J.E.:心形三角计算技术。IRE事务处理。电子。计算。EC-8(3),330-334(1959)·doi:10.1109/TEC.1959.5222693
[65] Walther,J.S.:初等函数的统一算法。摘自:春季联合计算机会议,第18-20页(1971)
[66] Adapa,B.、Biswas,D.、Bhardwaj,S.、Raghuraman,S.,Acharyya,A.、Maharatna,K.:基于坐标旋转的低复杂性意味着集群架构。IEEE传输。超大规模集成。(VLSI)系统。25(4), 1568-1572 (2017) ·doi:10.1109/TVLSI.2016.2633543
[67] Aggarwal,S.、Meher,P.K.、Khare,K.:可重构cordic的概念、设计和实现。IEEE传输。超大规模集成。(VLSI)系统。第24(4)页,1588-1592·doi:10.1109/TVLSI.2015.2445855
[68] Bhardwaj,S.、Bhagyaraja,A.、Shashank,R.、Jadhav,P.、Biswas,D.、Acharyya,A.和Naik,G.R.:普及医疗应用的低复杂性单通道ica架构设计方法。2016年IEEE信号处理系统(SiPS)国际研讨会。IEEE,第39-44页(2016年)
[69] Shaw,R.:n维向量叉积。国际数学杂志。教育。科学。Technol公司。18, 803-816 (1987) ·Zbl 0631.15020号 ·doi:10.1080/0020739870180606
[70] Dittmer,A.:任意维的交叉积恒等式。美国数学。周一。101, 887-891 (1994) ·兹比尔0823.15030 ·doi:10.1080/00029890.1994.1997042
[71] Bhardwaj,S.、Raghuraman,S.和Acharyya,A.:Simplex FastICA:D FastICA的一种加速且低复杂度的架构设计方法。IEEE传输。超大规模集成。(VLSI)系统。(2019)
[72] Bhardwaj,S.、Raghuraman,S.和Acharyya,A.:基于坐标旋转的D FastICA低复杂度硬件加速器。2017年IEEE信号处理系统国际研讨会(SiPS),第1-6页(2017年)
[73] Acharyya,A.,Maharatna,K.,Al-Hashimi,B.M.:n-d向量叉积计算的算法和架构。IEEE传输。信号处理。59(2), 812-826 (2011) ·Zbl 1392.94059号 ·doi:10.1109/TSP.2010.2090523
[74] Sung,T.,Hu,Y.,Yu,H.:用于数字信号处理算法的双流水线心形阵列。In:ICASSP’86。IEEE声学、语音和信号处理国际会议,第11卷,第1169-1172页(1986)
[75] Rao,C.S.等人:并行方法的字符串匹配问题是对最新研究的评估。手套。J.计算。科学。Technol公司。(2013)
[76] Schaumont,P.R.:硬件和软件的本质。摘自:硬件/软件协同设计实用介绍,第3-30页。施普林格(2013)
[77] Teich,J.:硬件/软件代码设计:过去、现在和预测未来。程序。IEEE 100(百年特刊),1411-1430(2012)·doi:10.1109/JPROC.2011.2182009
[78] Santarini,M.:Zynq-7000 epp为新时代的创新奠定了基础。Xcell J.75,8-13(2011)
[79] Dorta,T.、Jiménez,J.、Martín,J.,Bidarte,U.、Astarloa,A.:可重构多处理器系统:综述。国际J.可重构计算。2010 (2010)
[80] Tong,J.G.等:嵌入式系统的软核处理器。2006年ICM’06国际微电子会议。IEEE,第170-173页(2006)
[81] Senhadji-Navarro,R.等人:fpgas中基于RAM的有限状态机实现的性能评估。在:2012年第19届IEEE电子、电路和系统国际会议(ICECS),第225-228页。IEEE(2012)
[82] Gudur,V.Y.,Acharyya,A.:使用计算生物信息学应用的软硬件协同设计加速可重构字符串匹配。2017年欧洲电路理论与设计会议(ECCTD),第1-4页(2017)
[83] Gudur,V.Y.,Acharyya,A.:计算生物信息学应用中基于硬件-软件协同设计的字符串匹配加速和可重构方法。IEEE/ACM传输。计算。生物信息学。1-1 (2019)
[84] Xilinx,Inc.:Zynq-7000全可编程SoC:嵌入式设计教程。In:A Hand-On Guide Effective Embedded System Design UG1165(v20173)(2017年)
[85] Gävert,H.等人:Matlab的fastica包(2017年)。https://research.ics.aalto.fi/ica/fastica网站/
[86] Goldberger,A.L.、Amaral,L.A.N.、Glass,L.、Hausdorff,J.M.、Ivanov,P.C.、Mark,R.G.、Mietus,J.E.、Moody,G.B.、Peng,C.K.、Eugene Stanley,H.:Physiobank、physiotoolkit和physinet。循环101(23),e215-e220(2000)
[87] 贝特曼,A.等人:Uniprot:蛋白质信息中心。《核酸研究》43(D1),D204-D212(2015)
[88] Gasteiger,E.等人:expasy服务器上的蛋白质识别和分析工具。摘自:蛋白质组学协议手册,第571-607页。斯普林格(2005)
[89] Lei,S.,et al.:Scadis:用于fpga上数据密集型字符串集匹配的可扩展加速器。收录于:Trustcom/BigDataSE/I SPA,2016 IEEE,第1190-1197页。IEEE(2016)
[90] 法罗,S·Zbl 1293.68314号 ·doi:10.1145/2431211.2431212
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。