×

蛋白质三级结构预测的复合方法:基于格的隐马尔可夫模型。 (英文) Zbl 1415.92139号

摘要:蛋白质的生物功能主要取决于其三级结构,三级结构由蛋白质折叠过程中的氨基酸序列决定。从氨基酸序列预测蛋白质结构是计算生物学中最突出的问题之一。结合了蛋白质结构预测的两种基本方法:从头算方法(三维空间格)和折叠识别方法(隐马尔可夫模型)。将蛋白质的一级结构和氨基酸残基的三维坐标放在一个隐马尔可夫模型中,以学习氨基酸残基在三维空间中从每个折叠蛋白质的第一个原子到最后一个原子的路径。因此,每个模型都有每个折叠氨基酸的三维路径信息。将该方法与以隐马尔可夫模型为基础的折叠识别方法进行了比较,这些方法的算法仅基于氨基酸序列或二级结构。为了验证所提方法,使用三个数据集对模型进行了评估。结果表明,在相同的数据集中,该模型的性能优于7-HMM和3-HMM。与优化的3-HMM最有效版本的性能以及SAM 3.5最新版本的性能相比,以面为中心的立方晶格是最紧凑的三维晶格,在所有实验中都达到了最大的分类精度。结果表明,蛋白质中氨基酸原子的三维坐标在预测中具有重要作用。与折叠分类中的蛋白质二级结构相比,它还具有很大的隐藏信息。

MSC公司:

92D20型 蛋白质序列,DNA序列
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

HMMER公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Bahamish HAA,Abdullah R,Salam RA(2009),使用人工蜂群算法预测蛋白质三级结构。摘自:第三届亚洲建模与仿真国际会议,第258-263页
[2] Berman HM、Westbrook J、Feng Z、Gilliland G、Bhat TN、Weissig H等人(2000)蛋白质数据库。核酸研究28:235-242
[3] Bidargaddi NP,Chetty M,Kamruzzaman J(2009)将分段半马尔可夫模型与神经网络相结合,用于蛋白质二级结构预测。神经计算72:3943-3950
[4] Camproux AC,Tufféry P(2005)蛋白质的隐马尔可夫模型衍生结构字母表:蛋白质局部形状的学习捕获序列特异性。生物化学与生物物理学报1724:394-403
[5] Caoa H,Ihma Y,Wangb C-Z,Morrisb JR,Sua M,Dobbsc D等人(2004)蛋白质结构识别的三维线程方法。聚合物45:687-697
[6] Chandonia JM、Hon G、Walker NS、Lo Conte L、Koehl P、Levit M等人(2004)《2004年ASTRAL简编》。核酸研究32:D189-D192
[7] Chmielnicki W,Stapor K(2012)蛋白质折叠识别的混合鉴别/生成方法”。神经计算75:194-198
[8] Deschavanne P,Tufféry P(2009)使用结构字母表增强蛋白质折叠识别。蛋白质76:129-137
[9] Dorn M、Silva MB、Buriol LS、Lamb LC(2014)《三维蛋白质结构预测:方法和计算策略》。计算机生物化学53:251-276
[10] Dotu I、Cebrian M、Van Hentenryck P、Clote P(2011)《关于晶格蛋白结构预测的再探讨》。IEEE/ACM Trans-Comput生物信息8:1620-1632
[11] Elofsson A,Hargbo J(1999)使用预测的二级结构进行褶皱识别的隐马尔可夫模型。蛋白质36:68-76
[12] Finn RD、Clements J、Eddy SR(2011)HMMER web服务器:交互式序列相似性搜索。核酸研究39:W29-W37
[13] Fox NK、Brenner SE、Chandonia JM(2015)蛋白质结构分类信息的价值——调查科学文献。蛋白质结构功能生物信息83:2025-238
[14] Gheraibia Y,Moussaoui A(2012)使用遗传算法和K最近邻分类器预测3D蛋白质结构。参加:阿尔及利亚生物医学工程国际会议
[15] Karchin R,Cline M,Mandel-Gutfreund Y,Karplus K(2003)使用预测局部结构进行褶皱识别的隐马尔可夫模型:主干几何字母。蛋白质51:504-514
[16] Karplus K、Sjölander K、Barrett C、Cline M、Haussler D、Hughey R等人(1997)使用隐马尔可夫模型预测蛋白质结构。蛋白质结构功能生物信息29:134-139
[17] Karplus K,Karchin R,Shackelford G,Hughey R(2005)使用反向序列零模型校准隐马尔可夫模型的E值。生物信息学21:4107-4115
[18] Kong L,Zhang L(2014)用于准确预测蛋白质结构类别的新结构驱动特征。基因组学103:292-297
[19] Lampros C,Papaloukas C,Exarchos TP,Goletsis Y,Fotiadis DI(2007a)使用缩减状态空间隐马尔可夫模型的基于序列的蛋白质结构预测。计算生物医学37:1211-1224
[20] Lampros C,Papaloukas C,Exarchos K(2007b)通过在评分中使用二级结构信息提高简化状态空间隐马尔可夫模型的折叠识别准确性。in:法国IEEE EMBS第29届国际年会
[21] Lampros C、Papaloukas C、Exarcos K、Fotiadis DI、Tsalikakis D(2009)《改进简化状态空间隐马尔可夫模型的蛋白质折叠识别准确性》。计算机生物医学39:907-914
[22] Lampros C,Simos T,Exarchos TP,Exarchos KP,Papaloukas C,Fotiadis DI(2014)蛋白质折叠分类中优化马尔可夫模型的评估。生物信息计算生物学杂志12(4):1450016。https://doi.org/10.1142/S021972014500164 ·doi:10.1142/S021972014500164
[23] Lampros C、Papaloukas C、Exarchos T、Fotiadis DI(2017)蛋白质折叠分类HMM。隐马尔可夫模型方法分子生物学1552:13-27
[24] Lee J,Kim S-Y,Joo K,Kim I,Lee J(2004)使用基于片段组装和构象空间退火的新方法PROFESY预测蛋白质三级结构。蛋白质结构功能生物信息56:704-714
[25] Lee SY,Lee JY,Jung KS,Ryu KH(2009)使用蛋白质二级结构信息进行蛋白质折叠识别的9状态隐马尔可夫模型。计算生物医学39:527-534
[26] Lin C-J,Su S-C(2011)使用遗传算法和粒子群优化的混合算法进行蛋白质3D HP模型折叠模拟。国际模糊系统杂志13:140-147
[27] Márquez-Chamorro AE、Divina F、Aguilar-Ruiz JS、Bacardit J、Asencio-Cortes G、Santiesteban-Toca CE(2012)剩余接触预测的NSGA-II算法。柏林施普林格,第234-244页
[28] Murzin AG,Brenner SE,Hubbard T,Chothia C(1995)SCOP:用于序列和结构研究的蛋白质数据库的结构分类。分子生物学杂志247:536-540
[29] Nanni L,Brahnamc S,Lumini A(2014)通过将不同的蛋白质描述符合并到一般Chou的伪氨基酸组成中来预测蛋白质结构类别。理论生物学杂志360:109-116·Zbl 1343.92387号
[30] Pitteri M,Zanzotto G(1996)关于Bravais格的定义和分类。《水晶学报》A52:830-838·Zbl 1188.52012号
[31] Rashid MA、Newton MAH、Hoque MT、Sattar A(2013a)用于晶格蛋白质结构预测的遗传算法中的混合能量模型。《生物医学研究国际》27:37-52
[32] Rashid MA、Newton MAH、Hoque MT、Sattar A(2013b)用于简化蛋白质结构预测的局部搜索嵌入式遗传算法。2013年IEEE进化计算大会。https://doi.org/10.109/CEC.2013.6557688 ·doi:10.1109/CEC.2013.6557688
[33] Regad L,Guyon F,Maupetit J,Tufféry P,Cambroux AC(2008)应用于蛋白质3D结构分析的隐马尔可夫模型。计算统计数据分析52:3198-3207·Zbl 1452.62842号
[34] Shi J-Y,Zhang Y-N(2010)使用层次隐马尔可夫模型对蛋白质结构进行基于序列的分类。In:IEEE第十届信号处理国际会议,北京,第1789-1792页
[35] Song NY,Yan H(2013)用于蛋白质序列中周期性检测和螺线管结构识别的自回归和迭代隐马尔可夫模型。IEEE J生物健康信息17:436-441
[36] Stanfel LE(1996)氨基酸聚类的新方法。《Theor生物学杂志》183:195-205
[37] Tan C-W,Jones DT(2008)利用神经网络和进化信息进行蛋白质三级结构预测的诱饵识别。BMC生物信息94:19-42
[38] Valavanis I,Spyrou G,Nikita K(2010)蛋白质序列/结构集分析和比较的相似网络方法。J生物识别信息43:257-267
[39] Yang Y,Faraggi E,Zhao H,Zhou Y(2011)通过在预测的查询一维结构属性和相应的模板本地属性之间使用基于概率的匹配来改进蛋白质折叠识别和基于模板的建模。结构生物信息27:2076-282
[40] Yoon B-J(2009)隐马尔可夫模型及其在生物序列分析中的应用。电流基因组10:402-415
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。