×

RBSURFpred:使用正则化和优化回归在实空间和二进制空间中建模蛋白质可访问表面积。 (英语) Zbl 1397.92542号

摘要:蛋白质残基的可及表面积(ASA)是蛋白质结构预测、结合区域识别、折叠识别等问题的有效特征。通过应用有效特征变量改进ASA的预测是一项具有挑战性但值得探索的任务,特别是在机器学习领域。在现有的ASA预测因子中,REGAd(^3)p是一种基于3次多项式核正则化精确回归的高精度ASA预测算子。在这项工作中,我们提出了一个新的预测因子RBSURFpred,它通过Chou的通用PseAAC将58个物理化学、进化和结构特性整合到9元组肽中,从而在多个维度上扩展了REGAd(^3)p,这使我们能够在预测实际值和二进制ASA时获得更高的精确度。我们将RBSURFpred用于实空间和二进制空间预测与最先进的预测工具(如REGAd(^3)p和SPIDER2)进行了比较。我们还对RBSURFpred在不同氨基酸及其特性方面的性能进行了严格的分析,并进行了生物学相关的案例研究。RBSURFpred的性能为社区建立了一个有用的工具。

MSC公司:

92D20型 蛋白质序列,DNA序列
92C40型 生物化学、分子生物学
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abbass,H.A.,自适应帕累托差分进化算法,Evol。计算。,1, 831-836 (2002)
[2] 阿达姆扎克,R。;Porollo,A。;Meller,J.,使用基于神经网络的回归准确预测溶剂可及性,蛋白质,56753-767(2004)
[3] 艾哈迈德,S。;Gromiha,M.,NETASA:基于神经网络的溶剂可及性预测,生物信息学,18819-824(2002)
[4] 艾哈迈德,S。;格罗米哈,M。;Sarai,A.,《氨基酸序列中溶剂可及性的实际值预测》,《蛋白质》,50,629-635(2013)
[5] 比斯利,D。;布尔·D·R。;Martin,R.R.,《遗传算法概述:第2部分,研究主题》,Univ.Comput。,15, 170-181 (1993)
[6] 伯曼,H。;威斯布鲁克,J。;Z.Feng。;Gilliland,G。;巴特,T。;韦西格,H。;辛迪亚洛夫,I。;Bourne,P.,蛋白质数据库,核酸研究,28,235-242(2000)
[7] Beyer,H.-G。;Schwefel,H.-P.,《进化战略——综合介绍》,《自然计算》。,1, 3-52 (2002) ·Zbl 1014.68134号
[8] Bonetti,D.,Pérez-Sánchez,H.,Delbem,A.,2014年。一种用于从头算蛋白质结构预测的有效溶剂可及表面积计算。生物信息学和生物医学工程国际工作会议论文集。;Bonetti,D.,Pérez-Sánchez,H.,Delbem,A.,2014年。一种用于从头算蛋白质结构预测的有效溶剂可及表面积计算。国际生物信息学和生物医学工程工作会议论文集。
[9] Carugo,O.,通过考虑序列环境预测蛋白质序列中残留溶剂的可及性,蛋白质工程,13,607-609(2000)
[10] 陈,H。;周海霞,用一致性神经网络方法预测蛋白质复合物中的界面残基:核磁共振数据测试,蛋白质结构。功能。生物信息。,61, 21-35 (2005)
[11] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.-C.,IRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,8(3),4208-4217(2017)
[12] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,iRSpot-pseDNC:用伪二核苷酸组成识别重组点,核酸研究,41,6,e68(2013)
[13] Cheng,X。;Xiao,X。;Chou,K.-C.,Ploc-meuk:通过将关键GO信息提取到通用pseAAC中来预测多标签真核蛋白的亚细胞定位,基因组学,110,1,50-58(2018)
[14] Chou,K.-C.,生物大分子的低频集体运动及其生物功能,生物物理学。化学。,30, 3-48 (1988)
[15] Chou,K.-C.,使用子位点偶联预测信号肽,蛋白质工程,14,75-79(2001)
[16] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[17] Chou,K.-C.,《关于预测分子生物系统中多标签属性的一些评论》,《分子生物学》。,9, 1092-1100 (2013)
[18] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 21, 2337-2358 (2017)
[19] Chou,K.C。;陈,纽约。;Forsen,S.,低频声子的生物功能。2.协同效应,化学。Scr.、。,18, 126-132 (1981)
[20] 周,K.-C。;Shen,H.-B.,Euk-mPLoc:通过合并多个位点进行大规模真核蛋白质亚细胞定位预测的融合分类器,《蛋白质组研究》,第6期,第1728-1734页(2007年)
[21] 周,K.-C。;Shen,H.-B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63 (2009)
[22] 周,K.-C。;吴振中。;Xiao,X.,Iloc hum:使用累积标记量表预测具有单个和多个位点的人类蛋白质的亚细胞位置,Mol.Bioyst。,8, 629-641 (2012)
[23] Cho,K.I。;Kim,D。;Lee,D.,基于特征的蛋白质相互作用热点建模方法,核酸研究,372672-2687(2009)
[24] DeLano,W.L.,《解开绑定界面的热点:进展与挑战》,当前。操作。结构。生物学,12,14-20(2001)
[25] 佐治亚州多斯塔尼。;Csizmok,V。;汤帕,P。;Simon,I.,《根据氨基酸组成估计的成对能量含量区分折叠蛋白质和固有非结构蛋白质》,《分子生物学杂志》。,347, 4, 827-839 (2005)
[26] 艾克霍尔特,J。;Cheng,J.,《DNA紊乱:使用增强和深层网络预测蛋白质紊乱》,BMC Bioninform。,14, 88 (2013)
[27] 艾克霍尔特,J。;邓,X。;Cheng,J.,Dobo:通过整合进化信号和机器学习进行蛋白质结构域边界预测,BMC Bioinform。,12, 43 (2011)
[28] Faraggi,E。;薛,B。;周瑜,通过两层神经网络引导学习提高蛋白质残液可及性和实际值骨架扭转角的预测准确性,蛋白质,74847-856(2009)
[29] Faraggi,E。;Yang,Y。;张,S。;周瑜,预测连续局部结构及其替代二级结构在无片段蛋白质结构预测中的作用,结构,171515-1527(2009)
[30] Faraggi,E。;张,T。;Yang,Y。;库根,L。;Zhou,Y.,SPINE x:通过多步学习结合溶剂可及表面积和骨架扭转角的预测改进蛋白质二级结构预测,计算。化学。,33259-267(2012年)
[31] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.-C.,IRNA-psecoll:通过将核苷酸的集体效应纳入pseKNC来识别不同RNA修饰的发生位置,分子治疗-核酸,7,155-163(2017)
[32] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.-C.,IRNA-psecoll:通过将核苷酸的集体效应纳入pseKNC来识别不同RNA修饰的发生位置,分子治疗-核酸,7,155-163(2017)
[33] 加格,A。;Kaur,H。;拉加瓦。,G.p.s.:使用多重序列比对和二级结构预测蛋白质中溶剂可及性的实际值,《蛋白质》,61318-324(2005)
[34] Gianese,G。;Bossa,F。;Pascarella,S.,《通过概率分布预测溶剂可及性的改进》,《蛋白质》,16,987-992(2003)
[35] 格拉泽,F。;斯坦伯格,D.M。;瓦克瑟,I.A。;Ben Tal,N.,蛋白质-蛋白质界面的残基频率和配对偏好,蛋白质结构。功能。生物信息。,43, 89-102 (2001)
[36] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.H.,《统计学习的要素:数据挖掘、推断和预测》(2001),施普林格出版社·Zbl 0973.62007号
[37] 霍尔布鲁克,S。;Muskal,S。;Kim,S.,从蛋白质序列预测氨基酸的表面暴露,蛋白质工程,3,8,659-665(1990)
[38] Holland,J.H.,《自然和人工系统的适应:生物学、控制和人工智能应用的介绍性分析》(1992年),麻省理工学院出版社
[39] 伊克巴尔,S。;Hoque,M.T.,《Dispredict:使用优化RBF核预测蛋白质紊乱》,PloS One,10,10,E0141551(2015)
[40] 伊克巴尔,S。;米什拉,A。;Hoque,M.T.,可及表面积的改进预测导致高效能量函数应用,J.Theor。生物学,380380-391(2015)
[41] 伊克巴尔,S。;Hoque,M.T.,《将位置比能作为结构分类中仅序列蛋白质残基的特征的估计》,PloS One,11,9,E0161452(2016)
[42] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,通过将物理化学性质和固定小波变换结合到伪氨基酸组成中来鉴定蛋白质-蛋白质结合位点,J.Biomol。结构。动态。,34, 1946-1961 (2016)
[43] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPBS-opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集来识别蛋白质结合位点,Molecules,21,95(2016)
[44] 琼斯·D·T。;Cozzetto,D.,DISOPRED3:带注释蛋白结合活性的精确无序区域预测,生物信息学。,31, 6, 857-863 (2014)
[45] Kabsch,W。;Sander,C.,《蛋白质二级结构词典:氢键和几何特征的模式识别》,生物聚合物,222577-2637(1983)
[46] Khashan,R。;郑伟。;Tropsha,A.,使用暴露残基对蛋白质相互作用诱饵进行评分(SPIDER):基于界面残基频繁几何模式的新型多体相互作用评分函数,《蛋白质》,80,2207-2217(2012)
[47] Kim,H。;Park,H.,用支持向量机和长程相互作用三维局部描述符预测蛋白质相对溶剂可及性,蛋白质,54555-562(2014)
[48] 郭成,C。;年毅,C.,低频声子的生物功能,科学。罪。,20, 447-457 (1977)
[49] Lafferty,J。;McCallum,A。;Pereira,F.C.N.,条件随机场:分割和标记序列数据的概率模型,第18届机器学习国际会议论文集,282-289(2001)
[50] Lee,B。;Richards,F.,《蛋白质结构的解释:静态可及性的估计》,《分子生物学杂志》。,55, 3, 379-400 (1971)
[51] 李,X。;Pan,X.,从蛋白质序列准确预测溶剂可及性的新方法,蛋白质,42,1-5(2001)
[52] 刘,S。;张,C。;Liang,S。;周瑜,同时使用溶剂可及性和残留深度进行折叠识别,蛋白质。,68, 636-645 (2007)
[53] Lin,H。;邓永中。;丁·H。;Chen,W。;Chou,K.-C,Ipro54 pseKNC:一种基于序列的预测因子,用于鉴定具有伪K元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,4212961-12972(2014)
[54] 刘,B。;王,S。;朗·R。;Chou,K.-C.,IRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2016)
[55] Liu,L.M。;Xu,Y。;Chou,K.C.,iPGK-pseAAC:通过将四个不同层次的氨基酸成对偶联信息合并到通用pseAAC,Med.Chem。,13, 6, 552-559 (2017)
[56] Luke,S.,《元启发式要领》(2013),lulu.com
[57] Marsh,J.A.,埋藏和可接近表面积控制内在蛋白质柔韧性,蛋白质。,425, 3250-3263 (2013)
[58] 梅勒,J。;穆勒,M。;Zeidler,A。;Schmäschke,F.,用人工神经网络生成和评估降维氨基酸参数表示,J.Mol.模型。,7, 360-369 (2001)
[59] Pollastri,G。;巴尔迪,P。;Fariselli,P。;Casadio,R.,蛋白质中配位数和相对溶剂可及性的预测,蛋白质,47142-153(2002)
[60] 邱伟荣。;Xiao,X。;Chou,K.-C.,iRSpot-TNCPseAAC:用三核苷酸成分和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 1746-1766 (2014)
[61] 罗斯,G.D。;Geselowitz,A.R。;Lesser,G.J。;Lee,R.H。;Zehfus,M.H.,球形蛋白质中氨基酸残基的疏水性,科学,229834-838(1985)
[62] 罗斯特,B。;Sander,C.,蛋白质家族中溶剂可及性的保存和预测,蛋白质,20,216-226(1994)
[63] 沈,H.-B。;Chou,K.-C.,Hum-mPLoc:一种集成分类器,用于通过合并多个位点的样本进行大规模人类蛋白质亚细胞位置预测,Biochem。生物物理学。Res.Commun.公司。,355, 1006-1011 (2007)
[64] 汤普森,M.J。;Goldstein,R.A.,《预测溶剂可及性:使用贝叶斯统计和优化残留替代类别的更高精度》,《蛋白质》,25,38-47(1996)
[65] Tien,M.Z。;Meyer,A.G。;Sydykova,D.K。;斯皮尔曼,S.J。;Wilke,C.O.,《蛋白质中残留的最大允许溶剂可及性》,《公共科学图书馆·综合》,8,11,e80635(2013)
[66] Wang,J。;Hou,T.,在构象熵计算中开发和测试一种基于溶剂可及表面面积的模型,J.Chem。Inf.模型。,52, 5, 1199-1212 (2012)
[67] Wang,J。;Lee,H。;Ahmad,S.,SVM小屋:使用累积截断集和支持向量机预测溶剂可及性,蛋白质,68,82-91(2007)
[68] Wang,J.-Y。;李·H·M。;Ahmad,S.,使用多元线性回归对蛋白质溶剂可及性的预测和进化信息分析,《蛋白质》,61,3,481-491(2005)
[69] Wang,L。;Sauer,U.H.,Ond-CRF:使用[校正的]条件随机场预测蛋白质的顺序和紊乱,生物信息学,241401-1402(2008)
[70] 王,S。;彭杰。;马,J。;Xu,J.,利用深度卷积神经场预测蛋白质二级结构,科学。代表,6,18962(2016)
[71] 王,S。;翁,S。;马,J。;Tang,Q.,DeepCNF-d:通过加权深层卷积神经场预测蛋白质有序/无序区域,国际分子科学杂志。,16, 8, 17315-17330 (2015)
[72] Wu,W。;王,Z。;丛,P。;Li,T.,使用平衡模型准确预测蛋白质相对溶剂可及性,BioData Min.,10,1(2017)
[73] Xiao,X。;王,P。;林,W.-Z。;贾俊华。;Chou,K.-C.,IAMP-2l:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436168-177(2013年)
[74] Xu,Y。;丁,J。;Wu,L.-Y。;Chou,K.-C.,ISNO-pseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸s-亚硝基化位点,PLoS One,8,e55844(2013)
[75] Xu,Y。;邵晓杰。;Wu,L.-Y。;邓,N.-Y。;Chou,K.-C.,ISNO-AAPair:将氨基酸成对偶联到pseAAC中以预测蛋白质中半胱氨酸s-亚硝基化位点,PeerJ,1,e171(2013)
[76] 袁,Z。;Burrage,K。;Mattick,J.,使用支持向量机预测蛋白质溶剂可及性,蛋白质,48,566-570(2002)
[77] 张,H。;张,T。;Chen,K。;沈,S。;阮,J。;Kurgan,L.,《关于蛋白质中残留柔韧性和局部溶剂可及性之间的关系》,《蛋白质》,76617-636(2009)
[78] 张,T。;Faraggi,E。;Zhou,Y.,从NMR确定的结构获得的主链扭转角波动及其预测,蛋白质,783353-3362(2010)
[79] 周海霞。;Shan,Y.,从序列剖面和残基邻域列表预测蛋白质相互作用位点,蛋白质结构。功能。生物信息。,44, 336-343 (2001)
[80] 周,J。;Troyanskaya,O.G.,蛋白质二级结构预测的深度监督和卷积生成随机网络,计算。科学。,32, 745-753 (2014)
[81] 周,Y。;维特库普,D。;Karplus,M.,天然蛋白质是表面熔融固体:固体与液体状态的林德曼标准的应用,《分子生物学杂志》。,285, 1371-1375 (1999)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。