×

使用基于补丁的残基特征预测蛋白质相互作用位点。 (英语) Zbl 1307.92088号

摘要:识别蛋白质相互作用位点为蛋白质的功能提供了重要线索,并且在系统生物学和药物发现等主题中变得越来越重要。使用基于补丁的模型描述残留物,我们训练随机森林分类器进行基于残留物的界面预测,然后通过聚类过程生成补丁进行基于补丁的界面预测。对于基于残差的界面预测,我们的方法实现了0.7的特异性和0.78的敏感性。对于基于补丁的界面预测,成功率达到0.80。基于相同的数据集,我们还将其与几种已发表的方法进行了比较。结果表明,我们的方法是基于残差和基于补丁的界面预测的一个成功的预测器。

MSC公司:

92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abagyan,R.,《通过全球能量优化预测蛋白质结构》,(van Gunsteren,W.F.,《生物分子系统的计算机模拟》,第3卷(1997),Kluwer学术出版社:Kluwer-学术出版社Dordrecht),32
[2] Andraos,J.,动力学塑性和动力学方案的乘积比的确定,导致没有速率定律的多个乘积:基于有向图的新方法,Can。化学杂志。,86, 342-357 (2008)
[3] 巴哈,I。;Atilgan,A.R。;Erman,B.,使用单参数谐波电位直接评估蛋白质的热波动,Fold。设计。,2, 173-181 (1997)
[4] 伯曼,H.M。;威斯布鲁克,J。;冯,Z。;Gilliland,G。;Bhat,T.N。;韦西格,H。;Shindyalov,I.N。;Bourne,P.E.,蛋白质数据库,核酸研究,28,235-242(2000)
[5] Bordner,A.J。;Abagyan,R.,蛋白质-蛋白质界面的统计分析和预测,《蛋白质》,60,353-366(2005)
[6] 布拉德福德,J.R。;李约瑟,C.J。;Bulpitt,A.J。;Westhead,D.R.,《利用贝叶斯网络预测方法洞察蛋白质-蛋白质界面》,J.Mol.Biol。,362, 365-386 (2006)
[7] 布拉德福德,J.R。;Westhead,D.R.,使用支持向量机方法改进蛋白质结合位点的预测,生物信息学,211487-1494(2005)
[8] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32 (2001) ·Zbl 1007.68152号
[9] Chelliah,V。;布伦德尔,T.L。;Fernández-Recio,J.,《通过比较观察到的氨基酸替代模式与当地环境预测的氨基酸替代类型,有效限制蛋白质与蛋白质对接》,J.Mol.Biol。,357, 1669-1682 (2006)
[10] 陈,C。;Chen,L。;邹,X。;Cai,P.,利用周氏伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein Pept。莱特。,2009年7月16日至31日
[11] Chen,H.L。;周海霞,用一致性神经网络方法预测蛋白质复合物中的界面残基:核磁共振数据测试,蛋白质,61,21-35(2005)
[12] 陈晓伟。;Jeong,J.C.,用综合方法对蛋白质相互作用位点进行基于序列的预测,生物信息学,25,585-591(2009)
[13] Chou,K.C.,《综述:生物大分子的低频集体运动及其生物功能》,《生物物理》。化学。,30, 3-48 (1988)
[14] Chou,K.C.,《稳态和非稳态酶动力学的图形规则》,J.Biol。化学。,264, 12074-12079 (1989)
[15] Chou,K.C.,血红蛋白的低频共振和协同性,趋势生物化学。科学。,14, 212 (1989)
[16] Chou,K.C.,预测(20-1)-D氨基酸组成空间中蛋白质结构类别的新方法,蛋白质,21319-344(1995)
[17] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质,43,246-255(2001),(勘误表:蛋白质,2001,44,60)
[18] Chou,K.C.,药物代谢系统的图形规则,当前。药物代谢。,11, 369-378 (2010)
[19] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[20] Chou,K.C。;Cai,Y.D.,从杂交空间中的序列预测蛋白质相互作用,《蛋白质组研究杂志》,5316-322(2006)
[21] Chou,K.C。;沈海斌,《综述:蛋白质亚细胞定位预测的最新进展》,《分析》。生物化学。,370, 1-16 (2007)
[22] Chou,K.C。;Shen,H.B.,Euk-mPLoc:通过合并多个位点进行大规模真核蛋白亚细胞定位预测的融合分类器,《蛋白质组研究》,第6期,1728-1734页(2007年)
[23] Chou,K.C。;Shen,H.B.,Cell PLoc:用于预测蛋白质在各种生物体中的亚细胞定位的网络服务器包(更新版本:Cell PLoc 2.0:用于预测蛋白质在各种生物体中的亚细胞定位的改进网络服务器包。自然科学,2010,21090-103),国家协议,3153-162(2008)
[24] Chou,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2, 63-92 (2009)
[25] Chou,K.C。;Shen,H.B.,Plant-mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,《公共科学图书馆·综合》,5,e11335(2010)
[26] Chou,K.C。;吴振聪。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,PLoS One,6,e18258(2011)
[27] Chou,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。分子生物学。,30, 275-349 (1995)
[28] Chou,K.C。;周国平,活性位点外蛋白质在酶扩散控制反应中的作用,美国化学杂志。《社会学杂志》,1041409-1413(1982)
[29] Chung,J.L。;Wang,W。;Bourne,P.E.,利用序列和结构同源物识别蛋白质结合位点,《蛋白质》,62,630-640(2006)
[30] de Vries,S.J。;Bonvin,A.M.J.J.,《蛋白质如何接触:生物分子复合物研究中的界面预测》,Curr。蛋白质肽。科学。,9, 394-406 (2008)
[31] de Vries,S.J。;van Dijk,A.D。;Bonvin,A.M.,WHISCY:表面保护产生了什么信息?数据驱动对接的应用,蛋白质,63,479-489(2006)
[32] 丁·H。;罗,L。;Lin,H.,利用Chou的两亲性伪氨基酸组成预测细胞壁裂解酶,蛋白质Pept。莱特。,16, 351-355 (2009)
[33] 董庆伟。;Wang,X.L。;林,L。;Guan,Y.,利用残余水平和剖面水平界面倾向预测蛋白质结合位点,BMC Bioinf。,8147(2007年)
[34] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,使用周的伪氨基酸组成概念预测人类乳头瘤病毒的风险类型,J.Theor。生物学,263203-209(2010)·Zbl 1406.92455号
[35] Fariselli,P。;帕佐斯,F。;巴伦西亚。;Casadio,R.,用神经网络预测杂合物中的蛋白质相互作用位点,欧洲生物化学杂志。,269, 1356-1361 (2002)
[36] Fauchere,J.L。;Pliska,V.,n-乙酰-氨基酸酰胺分配产生的氨基酸侧链的疏水参数-pi,《欧洲医学化学杂志》。,18, 369-375 (1983)
[37] 费尔南德斯·雷西奥,J。;托特罗夫,M。;Abagyan,R.,《从对接能量景观中识别蛋白质相互作用位点》,《分子生物学杂志》。,335, 843-865 (2004)
[38] Georgiou,D.N。;卡拉卡西迪斯,T.E。;尼托·J·J。;Torres,A.,《使用模糊聚类技术和矩阵对氨基酸进行分类及其对周氏伪氨基酸组成的影响》,J.Theor。生物学,257,17-26(2009)·Zbl 1400.92393号
[39] 顾奇。;丁Y.S。;Zhang,T.L.,使用具有近似熵和疏水性模式的Chou伪氨基酸组成预测低同源性的G蛋白偶联受体类别,protein Pept。莱特。,17, 559-567 (2010)
[40] Heuser,P。;鲍·D。;Benkert,P。;Schomburg,D.,利用生物学知识改进未结合蛋白质对接研究,《蛋白质》,611059-1067(2005)
[41] Higa,R.H。;Tozzi,C.L.,预测蛋白质相互作用位点的简单有效方法,遗传学。摩尔研究,7898-909(2008)
[42] 何,Z。;张杰。;史晓华(Shi,X.H.)。;胡丽莲。;孔,X。;Cai,Y.D。;Chou,K.C.,基于功能群和生物特征预测药物靶点相互作用网络,《公共科学图书馆·综合》,5,e9603(2010)
[43] 胡,L。;黄,T。;施,X。;卢,W.C。;Cai,Y.D。;Chou,K.C.,基于加权蛋白质相互作用网络和蛋白质杂交特性预测小鼠蛋白质功能,PLoS ONE,6,e14556(2011)
[44] 黄,T。;史晓华(Shi,X.H.)。;王,P。;何,Z。;Feng,K.Y。;胡,L。;孔,X。;李玉霞。;Cai,Y.D。;Chou,K.C.,基于序列特征、亚细胞位置和相互作用网络的蛋白质代谢稳定性分析和预测,《公共科学图书馆·综合》,5,e10972(2010)
[45] 贾,S.C。;Hu,X.Z.,使用随机森林算法预测β发夹基序,蛋白质Pept。莱特。,18, 609-617 (2011)
[46] 琼斯,S。;Thornton,J.M.,使用斑块分析预测蛋白质相互作用位点,《分子生物学杂志》。,272, 133-143 (1997)
[47] Kabsch,W。;Sander,C.,《蛋白质二级结构词典:氢键和几何特征的模式识别》,生物聚合物,222577-2637(1983)
[48] Kandaswamy,K.K。;Chou,K.C。;马丁内茨,T。;莫勒,S。;Suganthan,P.N。;Sridharan,S。;Pugalenthi,G.,AFP-Pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.Theor。生物学,27056-62(2011)
[49] 小池百合子,A。;Takagi,T.,使用支持向量机预测蛋白质相互作用位点,蛋白质工程设计。选择。,17, 165-173 (2004)
[50] 库法列娃,I。;Budagyan,L.公司。;Raush,E。;托特罗夫,M。;Abagyan,R.,PIER:结构蛋白质组学的蛋白质界面识别,蛋白质,67,400-417(2007)
[51] Kyte,J。;杜立德,R.F.,《一种显示蛋白质亲水特性的简单方法》,《分子生物学杂志》。,157, 105-132 (1982)
[52] Li,J.J。;黄,D.S。;王,B。;Chen,P.,《利用残基保守性得分识别杂合物中的蛋白质-蛋白质界面残基》,国际生物学杂志。大分子。,38, 241-247 (2006)
[53] Liang,S.D。;张,C。;刘,S。;Zhou,Y.,使用经验评分函数预测蛋白质结合位点,核酸研究,34,3698-3707(2006)
[54] Lin,H.,利用周氏伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.Theor。《生物学》,252350-356(2008)·Zbl 1398.92076号
[55] Lin,W.Z。;Xiao,X。;Chou,K.C.,GPCR-GIA:通过灰色关联分析识别G蛋白偶联受体及其家族的网络服务器,protein Eng.Des。选择。,22, 699-705 (2009)
[56] Madkan,A。;空白,M。;埃尔森,E。;Chou,K.C。;Geddis,M.S。;Goodman,R.,《ELF EMF诊所步骤》,自然科学。,1, 157-165 (2009)
[57] Mihel,J。;Sikic,M。;托米奇,S。;杰伦,B。;Vlahovicek,K.,PSAIA-蛋白质结构和相互作用分析仪,BMC结构。生物学,8,21(2008)
[58] Mohabatkar,H.,利用周氏伪氨基酸组成预测细胞周期蛋白,蛋白质Pept。莱特。,171207-1214(2010年)
[59] Mohabatkar,H。;穆罕默德·贝吉,M。;Esmaeili,A.,利用Chou伪氨基酸组成和支持向量机的概念预测GABA(A)受体蛋白,J.Theor。生物学,281,18-23(2011)·Zbl 1397.92215号
[60] Neuvirth,H。;Raz,R。;Schreiber,G.,ProMate:一种基于结构的预测程序,用于识别蛋白质-蛋白质结合位点的位置,J.Mol.Biol。,338, 181-199 (2004)
[61] 奥夫兰,Y。;Rost,B.,从局部序列信息预测蛋白质相互作用位点,FEBS Lett。,544, 236-239 (2003)
[62] 奥夫兰,Y。;Rost,B.,ISIS:根据序列确定的相互作用位点,生物信息学,23,E13-E16(2007)
[63] 佩蒂特,F.K。;裸体,E。;蔡,A。;Bowie,J.U.,《HotPatch:一种在蛋白质表面发现生物学相关特征的统计方法》,J.Mol.Biol。,369, 863-879 (2007)
[64] Porollo,A。;Meller,J.,蛋白质相互作用的基于预测的指纹,蛋白质,66,630-645(2007)
[65] 秦,S.B。;周海霞,蛋白质对接的整体方法,蛋白质,69,743-749(2007)
[66] 邱建德。;黄,J.H。;史,S.P。;Liang,R.P.,使用Chou的伪氨基酸组成概念预测酶家族类别:基于离散小波变换的支持向量机方法,Protein Pept。莱特。,17, 715-722 (2010)
[67] 邱志杰。;Wang,X.C.,使用残基偏好方法识别蛋白质中的配体结合囊,蛋白质Pept。莱特。,16, 984-990 (2009)
[68] Ren,L.H。;沈永中。;丁Y.S。;Chou,K.C.,蛋白质相互作用网络分析的生物工程网络,亚洲控制杂志,13,726-737(2011)·Zbl 1303.93030号
[69] 研究,I。;米哈莱克,I。;Lichtarge,O.,《不使用蛋白质结构预测蛋白质界面的基于进化的分类器》,生物信息学,212496-2501(2005)
[70] 桑纳,M.F。;奥尔森·A·J。;Spehner,J.C.,《简化表面:计算分子表面的有效方法》,《生物聚合物》,38,305-320(1996)
[71] Sikic,M。;托米奇,S。;Vlahovicek,K.,通过随机森林预测序列和3D结构中的蛋白质相互作用位点,PLoS Compute。生物学,5,e1000278(2009)
[72] Tjong,H。;秦,S。;Zhou,H.X.,PI2PE:蛋白质界面/内部预测引擎,核酸研究,35,W357-W362(2007)
[73] 特雷斯,M。;德胡安,D。;格拉纳,O。;Gómez,M.J。;哥梅斯·普埃尔塔斯,P。;González,J.M。;López,G。;瓦伦西亚,A.,《利用进化信息对对接模型进行评分》,《蛋白质》,60,275-280(2005)
[74] van Dijk,A.D.J。;de Vries,S.J。;多明格斯,C。;陈,H。;周海霞。;Bonvin,A.M.J.J.,《数据驱动对接:HADDOCK在CAPRI中的冒险》,《蛋白质》,第60期,第232-238页(2005年)
[75] 王,B。;陈,P。;黄,D.S。;Li,J.J。;洛克·T·M。;Lyu,M.R.,从残基空间序列剖面和进化速率预测蛋白质相互作用位点,FEBS Lett。,580, 380-384 (2006)
[76] 王,B。;Wong,H.S。;Huang,D.S.,利用残基保守性和进化信息推断蛋白质相互作用位点,蛋白质Pept。莱特。,13, 999-1005 (2006)
[77] 王,P。;Xiao,X。;Chou,K.C.,NR-2L:基于序列衍生特征识别核受体亚家族的两级预测因子,《公共科学图书馆·综合》,6,e23505(2011)
[78] Wesson,L。;Eisenberg,D.,应用于溶液中蛋白质分子动力学的原子溶剂化参数,蛋白质科学。,1, 227-235 (1992)
[79] Xia,J.F。;Han,K。;Huang,D.S.,利用旋转森林和自相关描述符对蛋白质相互作用进行基于序列的预测,protein Pept。莱特。,17, 137-145 (2010)
[80] Xiao,X。;王,P。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:使用细胞自动机图像几何矩的方法,J.Theor。生物学,254691-696(2008)·Zbl 1400.92416号
[81] Xiao,X。;Lin,W.Z。;Chou,K.C.,《使用灰色动态模型和伪氨基酸组成预测蛋白质结构类别》,J.Compute。化学。,29, 2018-2024 (2008)
[82] Xiao,X。;王,P。;Chou,K.C.,GPCR-CA:预测G蛋白偶联受体功能类的细胞自动机图像方法,J.Compute。化学。,30, 1414-1423 (2009)
[83] Xiao,X。;Chou,K.C.,使用伪氨基酸组成通过细胞自动机和其他方法预测蛋白质属性,Curr。生物信息。,2011, 6, 251-260 (2011)
[84] Xiao,X。;王,P。;Chou,K.C.,GPCR-2L:通过杂交两种不同模式的伪氨基酸组分预测G蛋白偶联受体及其类型,分子生物学。,7, 911-919 (2011)
[85] Xiao,X。;王,P。;Chou,K.C.,Quat-2L:预测蛋白质四元结构属性的网络服务器,Mol.Divers。,15, 149-155 (2011)
[86] Xiao,X。;吴振聪。;Chou,K.C.,《预测革兰氏阴性细菌蛋白质亚细胞定位的单位点和多位点多标签分类器》,《公共科学图书馆·综合》,6,e20592(2011)
[87] Xiao,X。;吴振聪。;Chou,K.C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。生物学,284,42-51(2011)·Zbl 1397.92238号
[88] Yan,C.,Dobbs,D.,Honavar,V.,2003年。蛋白质相互作用中表面残基的识别——一种支持向量机方法。摘自:智能系统设计应用会议记录,第53-62页。;Yan,C.,Dobbs,D.,Honavar,V.,2003年。蛋白质相互作用中表面残基的识别——一种支持向量机方法。摘自:智能系统设计应用会议记录,第53-62页。
[89] 杨,J。;Jiang,X.F.,基于复杂网络预测阿尔茨海默病相关蛋白-蛋白质相互作用的新方法,protein Pept。莱特。,17, 356-366 (2010)
[90] Yu,L。;郭毅。;李毅。;李·G。;李,M。;罗,J。;熊,W。;Qin,W.,SecretP:通过将新特征融合到Chou的伪氨基酸成分中来识别细菌分泌的蛋白质,J.Theor。生物学,267,1-6(2010)·Zbl 1410.92040号
[91] 曾Y.H。;郭义忠。;肖瑞秋。;Yang,L。;Yu,L.Z。;Li,M.L.,基于自协方差方法,使用增广的周伪氨基酸组成预测蛋白质亚线粒体位置,J.Theor。生物学,259366-372(2009)·兹比尔1402.92193
[92] 张国勇。;Fang,B.S.,基于氨基酸组成分布和Chou的两亲性伪氨基酸组成预测氧化还原酶的辅因子,J.Theor。《生物学》,253,310-315(2008)
[93] Zhou,G.P.,《文祥图中LZCC蛋白残基的分布为蛋白质相互作用机制提供了新的见解》,J.Theor。《生物学》,284142-148(2011)·Zbl 1397.92245号
[94] 周国平。;Deng,M.H.,《周恩来推导酶动力学方程的图形规则在涉及平行反应路径的系统中的扩展》,《生物化学》。J.,222169-176(1984年)
[95] 周海霞。;Qin,S.B.,蛋白质复合物的相互作用预测:关键评估,生物信息学,232203-2209(2007)
[96] 周海霞。;Shan,Y.B.,从序列分析和残基邻接表预测蛋白质相互作用位点,《蛋白质》,44,336-343(2001)
[97] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.Theor。《生物学》,248546-551(2007)·Zbl 1451.92245号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。