×

预测蛋白质接触图的进化决策规则。 (英语) Zbl 1328.92054号

摘要:蛋白质结构预测是当前生物信息学中的主要开放挑战之一。蛋白质接触图是蛋白质3D结构的有用且常用的表示,并且表示蛋白质的每对氨基酸之间的二元接近性(接触或非接触)。在这项工作中,我们提出了一种基于氨基酸物理化学性质的接触图预测的多目标进化方法。进化算法产生一组决策规则,用于识别氨基酸之间的接触。该算法获得的规则根据氨基酸属性施加一组条件来预测接触。我们展示了通过我们的方法在四个不同的蛋白质数据集上获得的结果。还进行了统计研究,以从我们的算法生成的预测规则集中提取有效的结论。获得的结果证实了我们建议的有效性。

MSC公司:

92D20型 蛋白质序列,DNA序列
92D15型 与进化有关的问题
92C40型 生物化学、分子生物学
90 C90 数学规划的应用
90 C59 数学规划中的近似方法和启发式
90C29型 多目标规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abu-Doleh AA,Al-Jarrah OM,Alkhateeb A(2011)使用多级混合智能推理系统预测蛋白质接触图。J生物识别信息
[2] Altschul SF、Madden TL、Schffer AA、Zhang J、ZhangZ、Miller W、Lipman DJ(1997)Gapped blast和psi-blast:新一代蛋白质数据库搜索程序。核酸研究增刊25(17):3389-3402·doi:10.1093/nar/25.17.3389
[3] Andrew Toona GW(2012)基于接触距离的蛋白质结构测定的动态方法。J摩尔图模型32:75-81·doi:10.1016/j.jmgm.2011.10.003
[4] Asencio Cortes G,Aguilar-Ruiz JS(2011),根据物理化学性质预测蛋白质距离图。整合生物信息杂志8(3):181
[5] Ashkenazy H,Unger R,Kliger Y(2011)蛋白质结构中的隐藏构象。生物信息学27(14):1941-1947·doi:10.1093/bioinformatics/btr292
[6] 百加得J、斯托特M、赫斯特J、瓦伦西亚A、史密斯R、克拉斯诺戈尔N(2009)《蛋白质数据集的自动字母表缩减》。BMC生物信息10:6·doi:10.1186/1471-2105-10-6
[7] Bjrkholm P、Daniluk P、Kryshtafovych A、Fidelis K、Andersson R、Hvidsten TR(2009)使用对蛋白质结构的局部邻域进行训练的多数据隐马尔可夫模型预测残余接触。生物信息学25(10):1264-1270·doi:10.1093/bioinformatics/btp149
[8] Calvo JC,Ortega J,Anguita M(2011)Pitagoras-psp:在蛋白质结构预测的多目标方法中包含领域知识。神经计算74(16):2675-2682·doi:10.1016/j.neucom.2011.04.003
[9] Chen P,Li J(2010)使用带有序列轮廓中心的遗传算法分类器集成预测蛋白质长距离接触。BMC Struct Biol 10(补充1):S2·doi:10.1186/1472-6807-10-S1-S2
[10] Cheng J,Baldi P(2007)使用支持向量机和大型特征集改进残差接触预测。生物信息学8:113
[11] Cutello V,Narzisi G,Nicosia G(2006)蛋白质结构预测问题的多目标进化方法。J R Soc接口3(6):139-151·doi:10.1098/rsif.2005.0083
[12] Day RO,Zydallis JB,Lamont GB,Pachter R(2002)通过多目标遗传算法解决蛋白质结构预测问题。纳米科技2:32-35
[13] Di Lena P、Fariselli P、Margara L、Vassura M、Casadio R(2010)通过特征向量对齐快速重叠蛋白质接触图。生物信息学26(18):2250-2258·兹比尔1196.37121 ·doi:10.1093/bioinformatics/btq402
[14] Dodge C、Schneider R、Sander C(1998)蛋白质结构序列比对和家族简介的hssp数据库。核酸研究增刊26(1):313-315·doi:10.1093/nar/261.313
[15] Duarte JM、Sathyapriya R、Stehr H、Filippis I、Lappe M(2010),接触图重建的最佳接触定义。BMC生物信息11:283·doi:10.1186/1471-2105-11-283
[16] Eickholt J,Wang Z,Cheng J(2011)蛋白质残留接触的构象集成方法。BMC结构生物学11:38·doi:10.1186/1472-6807-11-38
[17] Faraggi E,Yang Y,Zhang S,Zhou Y(2009)在无片段蛋白质结构预测中预测连续局部结构及其替代二级结构的效果。结构17(11):1515-1527·doi:10.1016/j.str.2009.09.006
[18] Fariselli P、Olmea O、Valencia A、Casadio R(2001)《神经网络和相关突变接触图预测》。蛋白质工程设计选择14:133-154·doi:10.1093/蛋白质/14.11.835
[19] Faure G、Bornot A、de Brevern AG(2008)《蛋白质接触、残留间相互作用和侧链建模》。生物化学90(4):626-639·doi:10.1016/j.biochi.2007.11.007
[20] Fernandez M、Paredes A、Ortiz L、Rosas J(2009)《利用蛋白质和二云母分子(modypp)的结构预测系统》。国际计算机与电子系统修订版1:6-16
[21] Furuta T、Shimizu K、Terada T(2009)借助二级结构知识,使用分子动力学模拟准确预测蛋白质的天然三级结构。化学物理快报472(13):134-139·doi:10.1016/j.完成2009.03.009
[22] Gao X,Bu D,Xu J,Li M(2009)通过服务器相关性降低改进共识联系预测。BMC结构生物学9:28·doi:10.1186/1472-6807-9-28
[23] Grantham R(1974)氨基酸差异公式有助于解释蛋白质进化。分子生物学杂志185:862-864
[24] Gu J,Bourne P(2003)结构生物信息学。新泽西州Wiley Blackwell
[25] Gupta N,Mangal N,Biswas S(2005)接触图空间中蛋白质结构的进化和相似性评估。蛋白质结构功能生物信息59:196-204·doi:10.1002/port.20415
[26] Hall M、Frank E、Holmes GBP、Reutemann P、Witten I(2009)《weka数据挖掘软件:更新》。SIGKDD探索11(1):10-18
[27] Jaravine V,Ibraghimov I,Yu Orekhov V(2006)高分辨率多维核磁共振波谱的时间屏障移除。天然甲基3(8):605-607·doi:10.1038/nmeth900
[28] Jones D(1999)基于位置特异性评分矩阵的蛋白质二级结构预测。分子生物学杂志292(2):195-202·doi:10.1006/jmbi.1999.3091
[29] Jones DT、Buchan DWA、Cozzetto D、Pontil M(2012)Psicov:使用大型多序列比对的稀疏逆协方差估计进行精确的结构接触预测。生物信息学28(2):184-190·doi:10.1093/bioinformatics/btr638
[30] Judy MV、Ravichandran KS、Murugesan K(2009),使用免疫算子预测蛋白质结构的多目标进化算法。计算方法生物医学生物工程12(4):407-413·网址:10.1080/10255840802649715
[31] Kabsch W,Sander C(1983)《蛋白质二级结构词典:氢键和几何特征的模式识别》。生物聚合物22(12):2577-2637·doi:10.1002/bip.360221211
[32] Kawashima S、Pokarowski P、Pokarouwska M、Kolinski A、Katayama T、Kanehisa M(2008)Aaindex:氨基酸指数数据库,2008年进度报告。核酸研究增补36(数据库问题):D202-D205
[33] Kihara D(2005)《蛋白质二级结构形成中长程相互作用的影响》。蛋白质科学14(8):1955-1963·doi:10.1110/ps.051479505
[34] Kinjo AR,Horimoto K,Nishikawa K(2005)从氨基酸序列预测天然蛋白质结构的绝对接触数。蛋白质58(1):158-165·doi:10.1002/prot.20300
[35] Klein P、Kanehisa M、DeLisi C(1984)《从序列特性预测蛋白质功能:数据库的判别分析》。Biochim生物物理学787:221-226·doi:10.1016/0167-4838(84)90312-1
[36] Kloczkowski A、Jernigan R、Wu Z、Song G、Yang L、Kolinski A、Pokarowski P(2009)基于距离矩阵的蛋白质结构预测方法。J结构功能基因组10:67-81·doi:10.1007/s10969-009-9062-2
[37] Kyte J,Doolittle R(1982)显示蛋白质亲水特性的简单方法。分子生物学杂志157:105-132·doi:10.1016/0022-2836(82)90515-0
[38] Lattman E(2004)蛋白质结构倡议的状态。蛋白质54(4):611-615·doi:10.1002/port.20000
[39] Lavor C,Liberti L,Maculan N,Mucherino A(2012)可离散分子距离几何问题的最新进展。欧洲运营研究杂志219(3):698-706·Zbl 1253.05132号
[40] Li Y、Fang Y和Fang J(2011)使用随机森林模型预测残余接触。生物信息学27(24):3379-3384·doi:10.1093/bioinformatics/btr579
[41] Lippi M,Frasconi P(2009)利用基于特定权重的马尔可夫逻辑网络预测蛋白质β-残基接触。生物信息学25(18):2326-2333·doi:10.1093/bioinformatics/btp421
[42] Lo A,Chiu YY,Rdland EA,Lyu PC,Sung TY,Hsu WL(2009)从膜蛋白中的残基接触预测螺旋-螺旋相互作用。生物信息学25(8):996-1003·doi:10.1093/bioinformatics/btp114
[43] Marks DS、Colwell LJ、Sheridan R、Hopf TA、Pagnani A、Zecchina R、Sander C(2011)《进化序列变异计算的蛋白质三维结构》。《公共科学图书馆·综合》6(12),e28766。doi:10.1371/journal.pone.0028766
[44] Monastirskyy B、Fidelis K、Tramontano A、Kryshtafovych A(2011)案例9中残余接触预测的评估。蛋白质:结构功能生物信息79(Suppl 10):119-125·doi:10.1002/port.23160
[45] Murzin A,Brenner S,Hubbard T,Chothia C(1995)Scop:用于序列和结构研究的蛋白质数据库的结构分类。分子生物学杂志247:536-540
[46] Nagata K,Randall A,Baldi P(2012)Sidepro:一种用于快速准确预测侧链构象的新型机器学习方法。蛋白质80(1):142-153·doi:10.1002/port.23170
[47] Plaxco KW,Simons KT,Baker D(1998),接触顺序,过渡状态放置和单域蛋白质的重折叠率。分子生物学杂志277(4):985-994·doi:10.1006/jmbi.1998.1645
[48] Rajgaria R,McAllister SR,Floudas CA(2009)通过整数线性优化实现α螺旋蛋白的准确残余疏水接触预测。蛋白质74(4):929-947·doi:10.1002/电话:22202
[49] Rajgaria R,Wei Y,Floudas CA(2010),使用整数线性优化对β和α-β蛋白的接触预测及其对第一原理三维结构预测方法astro-fold的影响。蛋白质78(8):1825-1846
[50] Roy A,Kucukural A,Zhang Y(2010)I-tasser:自动化蛋白质结构和功能预测的统一平台。国家协议5(4):725-738·doi:10.1038/nprot.2010.5
[51] Service,R.结构生物学-结构基因组学,第2轮。科学30715541558(2005)·doi:10.1126/science.307.5715.1554
[52] Song J,Burrage K(2006)通过支持向量回归预测蛋白质中的残余接触顺序。BMC生物信息7:425·doi:10.1186/1471-2105-7-425
[53] Stout M,百加得J,Hirst JD,Krasnogor,N(2008)蛋白质残基递归凸壳类分配的预测。生物信息学24(7):916-923·doi:10.1093/生物信息学/btn050
[54] Tegge AN,Wang Z,Eickholt J,Cheng J(2009)Nncon:使用2d-递归神经网络改进蛋白质接触图预测。核酸研究补充37(Web服务器问题):W515-W518·doi:10.1093/nar/gkp305
[55] Unger R,Moult J(1993)蛋白质折叠模拟的遗传算法。Biochim生物物理231:75-81
[56] Vassura M,Margara L,Di Lena P,Medri F,Fariselli P,Casadio R(2008)Ft-comar:基于蛋白质接触图的容错三维结构重建。生物信息学24(10):1313-1315·doi:10.1093/bioinformatics/btn115
[57] Vassura M、Di Lena P、Margara L、Mirto M、Aloisio G、Fariselli P、Casadio R(2011)数千种蛋白质的模糊接触图:通过重建三维结构我们可以学到什么。生物数据最小值4(1):1·doi:10.1186/1756-0381-4-1
[58] Walsh I、Bau D、Martin A、Mooney C、Vullo A、Pollastri G(2009),二维递归神经网络对多类距离图的从头算和基于模板的预测。BMC结构生物学9(1):5·数字对象标识代码:10.1186/1472-6807-9-5
[59] Wang Z,Eickholt J,Cheng J(2010)Multicom:蛋白质结构预测的多级组合方法及其在casp8中的评估。生物信息学26(7):882-888·doi:10.1093/bioinformatics/btq058
[60] Wei Y,Floudas CA(2011)增强跨膜蛋白的药物间残留接触预测。化学工程科学66(19):4356-4369·doi:10.1016/j.ces.2011.04.033
[61] Wu S,Zhang Y(2008)《基于序列和基于模板的蛋白质接触预测方法的综合评估》。生物信息学24(7):924-931·doi:10.1093/bioinformatics/btn069
[62] Wu S,Szilagyi A,Zhang Y(2011)使用基于多序列的接触预测改进蛋白质结构预测。结构19(8):1182-1191·doi:10.1016/j.str.2011.05.004
[63] Xue B,Faraggi E,Zhou Y(2009)用两层集成神经网络方法预测残余接触图。蛋白质76(1):176-183·doi:10.1002/port.22329
[64] Yang JY,Chen X(2011)通过logistic回归预测蛋白质接触图的共识方法。在:Chen J,Wang J,Zelikovsky A(编辑)生物信息学研究与应用第七届国际研讨会,ISBRA 2011,中国长沙,2011年5月27-29日。《计算机科学论文集》,第6674卷,第136-147页。施普林格
[65] Zhang G,Huang D,Quan Z(2005)将二进制输入编码方案与rbfnn相结合,用于球蛋白残余接触图预测。图案识别信16(10):1543-1553·doi:10.1016/j.patrec.2005.01.05
[66] Zhou Y,Duan Y,Yang Y,Faraggi E,Lei H(2011)模板/无片段蛋白质结构预测趋势。Theor Chem Acc:理论计算模型(Theor Chim Acta)128:3-16·doi:10.1007/s00214-010-0799-2
[67] Zitzler E,Thiele L(1999)多目标进化算法:比较案例研究和强度帕累托方法。IEEE Trans-Evol计算3(4):257-271·doi:10.1109/4235.797969
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。