×

通过将蛋白质的全局和局部物理化学和构象特性结合到Chou的PseAAC中来预测蛋白质的结构类别。 (英语) Zbl 1406.92452号

小结:在本研究中,我基于一个名为“总平方和”(TSS)的统计量引入了新的全局和局部0D蛋白描述符。该数量表示氨基酸特性与算术平均特性的平方差之和。作为扩展,“氨基酸类型”和“氨基酸组”形式用于描述蛋白质的感兴趣区域。为了评估所提出描述符的有效性,建立了一个预测四个主要蛋白质结构类的最近邻模型。该模型在折刀交叉验证试验中的成功率为98.53%;尽管预测器简单,但这种性能优于其他报道的方法。此外,该预测因子在不同的交叉验证测试中的平均成功率为98.35%。Kappa统计值为0.98,可以清楚地将该模型与随机预测值区分开来。最近邻模型得到的结果表明,所提出的描述符不仅能够反映与蛋白质结构类相关的生化信息,而且能够进行适当的解释。因此,可以预期,当前的方法可以在蛋白质结构类预测和其他蛋白质属性的现有方法中起到补充作用。

MSC公司:

92D20型 蛋白质序列,DNA序列
62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arif,M。;海亚特,M。;Jan,Z.,iMem-2LSAAC:通过将SAAC的概念扩展到chou的伪氨基酸组成中来区分膜蛋白及其类型的两级模型,J.Theor。生物学,442,11-21(2018)·兹比尔1397.92180
[2] 巴尔迪,P。;布鲁纳克,S。;乔文,Y。;安徒生公司。;Nielsen,H.,《评估分类预测算法的准确性:概述》,生物信息学,16,412-424(2000)
[3] Bo,L。;麒麟,X。;Dachao,L.,将次要特征纳入Chou的PseAAC的一般形式中,以预测蛋白质结构类别,即蛋白质。肽。莱特。,19, 1133-1138 (2012)
[4] 蔡永德。;Chou,K.-C.,通过功能域组成和伪氨基酸组成预测膜蛋白类型,J.Theor。生物学,238395-400(2006)·Zbl 1445.92219号
[5] 蔡永德。;胡,J。;刘,X。;周锦川,用神经网络方法预测蛋白质结构类别,分子设计杂志。,1, 332-338 (2002)
[6] 蔡永德。;刘晓杰。;徐,X.-b。;Chou,K.-C.,用支持向量机预测蛋白质结构类,计算。化学。(英国牛津),26,293-296(2002)
[7] 蔡永德。;Feng,K.-Y。;卢,W.C。;Chou,K.-C.,使用LogitBoost分类器预测蛋白质结构类别,J.Theor。《生物学》,238172-176(2006)·Zbl 1445.92220号
[8] Caltabiano,G。;冈萨雷斯,A。;科尔多米,A。;坎皮洛,M。;Pardo,L.,第五章-疏水性氨基酸在g蛋白偶联受体视紫红质家族结构和功能中的作用,(Conn,P.M.,《酶学方法》,第520卷(2013年),学术出版社),99-115
[9] 科兰特斯,E.R。;Dunn,W.J.,《肽类似物定量构效关系研究的氨基酸侧链描述符》,J.Med.Chem。,38, 2705-2713 (1995)
[10] Chao,C。;Zhi-Bin,S。;Xiao Yong,Z.,通过Chou伪氨基酸组成的一般形式预测蛋白质结构类别的双层小波SVM,蛋白质。肽。莱特。,19, 422-429 (2012)
[11] 陈,C。;陈,L.-X。;邹晓勇。;蔡,P.-X.,基于多特征融合的蛋白质结构类预测,J.Theor。《生物学》,253388-392(2008)·Zbl 1398.92196号
[12] 陈,C。;田玉霞。;邹晓勇。;蔡,P.-X。;Mo,J.-Y.,使用伪氨基酸组成和支持向量机预测蛋白质结构类别,J.Theor。《生物学》,243444-448(2006)·Zbl 1447.92300号
[13] Chen,K。;洛杉矶库根。;阮,J.,使用新的基于进化搭配的序列表示预测蛋白质结构类,J.Compute。化学。,29, 1596-1604 (2008)
[14] Chen,W。;Lin,H。;Chou,K.-C.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,《分子生物学系统》。,11, 2620-2634 (2015)
[15] Chen,W。;冯,P.-M。;Lin,H。;Chou,K.-C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,核酸研究(2013),gks1450
[16] Chen,W。;Lei,T.-Y。;金,D.-C。;Lin,H。;Chou,K.-C.,PseKNC:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60 (2014)
[17] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.-C.,iRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,84208-4217(2017)
[18] Cheng,X。;Xiao,X。;Chou,K.-C.,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.BioSyst.,预测多位置植物蛋白的亚细胞定位。,13, 1722-1727 (2017)
[19] Cheng,X。;赵,S.-G。;Xiao,X。;Chou,K.-C.,iATC-mISF:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346(2017)
[20] 周杰杰。;Zhang,C.-T.,《从1490个人类蛋白质的遗传密码子中联合预测其折叠类型》,J.Theor。生物学,161251-262(1993)
[21] Chou,K.-C.,抗冻蛋白的能量优化结构及其结合机制,分子生物学杂志。,223509-517(1992),doi:http://dx.doi.org/10.1016/0022-2836(92)90666-8
[22] Chou,K.-C.,预测(20-1)-D氨基酸组成空间中蛋白质结构类的新方法,蛋白质结构。功能。生物信息。,21, 319-344 (1995)
[23] Chou,K.-C.,蛋白质结构类别测定的关键驱动力,生物化学。生物物理学。Res.Commun.公司。,264, 216-224 (1999)
[24] Chou,K.-C.,使用伪氨基酸成分预测蛋白质细胞属性,蛋白质结构。功能。生物信息。,43, 246-255 (2001)
[25] Chou,K.-C.,蛋白质结构类预测进展及其对生物信息学和蛋白质组学的影响,Curr。蛋白质肽。科学。,6, 423-436 (2005)
[26] Chou,K.-C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[27] Chou,K.-C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学。,6, 262-274 (2009)
[28] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[29] Chou,K.-C.,生物信息学对药物化学的影响,医学化学,11,218-234(2015)
[30] Chou,K.-C.,由生物科学的进步推动的药物化学的一场前所未有的革命,Curr。顶部。医药化学。,17, 2337-2358 (2017)
[31] 周,K.-C。;Zhang,C.-T.,《从氨基酸组成预测蛋白质结构类别的相关系数法》,《欧洲生物化学杂志》。,207, 429-433 (1992)
[32] 周,K.-C。;Zhang,C.-T.,通过考虑氨基酸相互作用的距离函数预测蛋白质折叠类型,J.Biol。化学。,269, 22014-22020 (1994)
[33] 周,K.-C。;Cai,Y.-D.,通过功能域组成预测蛋白质结构类别,生物化学。生物物理学。Res.Commun.公司。,321, 1007-1009 (2004)
[34] 周,K.-C。;沈海波,蛋白质亚细胞定位预测的最新进展,分析。生物化学。,370, 1-16 (2007)
[35] Chou,K.C.,蛋白质结构类和亚细胞位置预测,Curr。蛋白质肽。科学。,1, 171-208 (2000)
[36] Chun-Ting,Z。;Kuo-Chen,C.,《从氨基酸组成预测蛋白质结构类别的优化方法》,《蛋白质》。科学。,1, 401-408 (1992)
[37] 丁永生。;张,T.-L。;Chou,K.-C.,用伪氨基酸组成和模糊支持向量机网络预测蛋白质结构类,protein Pept。莱特。,14, 811-815 (2007)
[38] 杜青山。;姜振清。;何伟珍。;李,D.-P。;Chou,K.C.,氨基酸主成分分析(AAPCA)及其在蛋白质结构类别预测中的应用,J.Biomol。结构。动态。,23, 635-640 (2006)
[39] 杜琪。;魏,D。;Chou,K.-C.,蛋白质中氨基酸的相关性,肽,241863-1869(2003)
[40] Gramatica,P.,《QSAR模型验证原则:内部和外部》,QSAR Comb。科学。,26, 694-701 (2007)
[41] Gromiha,M.M.,《利用结构类别信息预测氨基酸序列中蛋白质折叠速率的统计模型》,J.Chem。Inf.模型,45,494-501(2005)
[42] 格罗米哈,M.M。;Selvaraj,S。;Thangakani,A.M.,根据氨基酸序列预测蛋白质去折叠速率的统计方法,J.Chem。Inf.Model,46,1503-1508(2006)
[43] 郭,S.-H。;邓永中。;徐立清。;丁·H。;Lin,H。;Chen,W。;Chou,K.-C.,iNuc-PseKNC:一种基于序列的预测因子,用于预测具有伪K元组核苷酸组成的基因组中的核小体定位,生物信息学(2014),btu083
[44] 哈雷,C.A。;Tipper,D.J.,《带电残基在确定酵母跨膜蛋白插入方向中的作用》,J.Biol。化学。,27124625-24633(1996年)
[45] Hellberg,S。;Sjostrom,M。;Skagerberg,B。;Wold,S.,肽定量构效关系,多元方法,J.Med.Chem。,30 (1987)
[46] Hellberg,S。;Sjoestroem,M。;Skagerberg,B。;Wold,S.,肽定量结构-活性关系,多元方法,J.Med.Chem。,30, 1126-1135 (1987)
[47] 霍普,T.P。;Woods,K.R.,从氨基酸序列预测蛋白质抗原决定簇,Proc。国家。阿卡德。科学。美国,78,3824-3828(1981)
[48] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物》,377,47-56(2015)
[49] Kardaun,O.J.,《经典统计方法:在面向融合的等离子体物理中的应用》(2005),Springer Science&Business Media·Zbl 1088.62141号
[50] 基德拉,A。;Konishi,Y。;Ooi,T。;Scheraga,H.A.,蛋白质序列相似性和结构相似性之间的关系。氨基酸重要性质的作用,蛋白质化学杂志。,4, 265-297 (1985)
[51] 基德拉,A。;Konishi,Y。;奥卡,M。;Ooi,T。;Scheraga,H.A.,20种天然氨基酸物理性质的统计分析,蛋白质化学杂志。,4, 23-55 (1985)
[52] Kong,L.公司。;张,L。;Lv,J.,通过将预测的二级结构信息合并到Chou伪氨基酸组成的一般形式中来准确预测蛋白质结构类别,J.Theor。生物学,344,12-18(2014)·兹比尔1412.92246
[53] Kyte,J。;杜立德,R.F.,《一种显示蛋白质亲水特性的简单方法》,《分子生物学杂志》。,157, 105-132 (1982)
[54] Lehninger,A。;Nelson,D.L。;Cox,M.M.,Lehninger的生物化学原理(2005),WH Freeman and Company:WH Freeman and Company New York
[55] Levit,M.,球形蛋白质中氨基酸的构象偏好,生物化学,17,4277-4285(1978)
[56] 李,Z.C。;周,X.-B。;戴,Z。;Zou,X.-Y.,通过Chou的伪氨基酸组成预测蛋白质结构类别:使用连续小波变换和主成分分析的方法,《氨基酸》,37,415-425(2009)
[57] 梁,Y。;Zhang,S.,通过将两种不同的进化信息模式合并到Chou的一般伪氨基酸组成中来预测蛋白质结构类别,J.分子图。型号。,78, 110-117 (2017)
[58] Lin,H。;Li,Q.-Z.,《使用伪氨基酸组成预测蛋白质结构类别:通过合并400个二肽组分进行处理》,J.Compute。化学。,28, 1463-1466 (2007)
[59] 刘,B。;Wu,H。;Chou,K.-C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,09, 04, 23 (2017)
[60] 刘,B。;王,X。;陈,Q。;Dong,Q。;Lan,X.,《使用氨基酸物理化学距离变换快速检测蛋白质远程同源性》,PLoS ONE,7,e46633(2012)
[61] 刘,B。;王,X。;邹强。;Dong,Q。;Chen,Q.,通过结合Chou的伪氨基酸组成和基于轮廓的蛋白质表示进行蛋白质远程同源性检测,Mol.Inf.,32,775-782(2013)
[62] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.-C.,repDNA:一个Python包,通过结合用户定义的物理化学特性和序列顺序效应,为DNA序列生成各种模式的特征向量,生物信息学(2014),btu820
[63] 刘,B。;徐,J。;邹强。;Xu,R。;王,X。;Chen,Q.,《使用顶部n颗粒和残基对之间的距离进行蛋白质远程同源性检测》,BMC生物信息学,15,S3(2014)
[64] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[65] 刘,B。;徐,J。;兰,X。;Xu,R。;周,J。;王,X。;Chou,K.-C.,iDNA-Prot | dis:通过将氨基酸距离-首字母和简化字母组合纳入一般伪氨基酸组成来识别DNA-结合蛋白,《公共科学图书馆·综合》,第9期,文章e106691 pp.(2014)
[67] 刘,W.m。;周锦川,用改进的马氏判别算法预测蛋白质结构类,蛋白质化学杂志。,17, 209-217 (1998)
[68] Marrero-Pone,Y。;康特拉斯·托雷斯,E。;García-Jacas,C.R。;Barigye,S.J。;库比兰,北。;Alvarado,Y.J.,《蛋白质科学的新型3D生物大分子双线性描述符:预测蛋白质结构类》,J.Theor。《生物学》,374125-137(2015)·Zbl 1341.92053号
[69] 马修斯,C.K。;van Holde,K.E。;埃亨,K.G.,《生物化学》(2000),本杰明·卡明斯:本杰明·卡明斯旧金山
[70] 梅,J。;赵,J.,利用周氏伪氨基酸组成和不同分类器预测HIV-1和HIV-2蛋白,科学。代表,82359(2018)
[71] Muthu Krishnan,S.,使用Chou的一般PseAAC来分析受体相关蛋白(RAP)与蛋白质结构域的各种折叠模式的进化关系,J.Theor。生物学,44562-74(2018)
[72] Ruiz-Blanco,Y.B。;Paz,W。;格林,J。;Marrero-Pone,Y.,ProtDCal:一个计算蛋白质序列和三维结构的通用数字描述符的程序,BMC Bioinf。,16, 162 (2015)
[73] Sahu,S.S。;Panda,G.,一种基于周氏伪氨基酸组成的新特征表示方法,用于蛋白质结构类预测,Compute。生物化学。,34, 320-327 (2010) ·Zbl 1403.92221号
[74] Sak,K。;Karelson,M。;Järv,J.,氨基酸侧链对肽构象影响的建模,生物组织化学。,27, 434-442 (1999)
[75] 沈海波。;杨,J。;刘晓杰。;Chou,K.-C.,《使用监督模糊聚类预测蛋白质结构类别》,《生物化学》。生物物理学。Res.Commun.公司。,334, 577-581 (2005)
[76] 宋,J。;Wang,Y。;Li,F。;Akutsu,T。;罗林斯,N.D。;韦伯,G.I。;Chou,K.-C.,iProt-Sub:一个用于准确绘制和预测蛋白酶特异性底物和裂解位点的综合软件包,简介。生物信息学。(2018),bby028-bby028
[77] 托德斯基尼,R。;Consonni,V.,《化学信息学的分子描述符》(Mannhold,R.;等,《药物化学的方法和原理》(2009),Wiley-VCH:Wiley-VC Weinheim)
[78] Tropsha,A。;格拉马提亚,P。;Gombar,V.K.,《认真的重要性:验证是成功应用和解释QSPR模型的绝对必要条件》,QSAR Comb。科学。,22, 69-77 (2003)
[79] 威滕,I.H。;E.弗兰克。;霍尔,医学硕士。;Pal,C.J.,《数据挖掘:实用机器学习工具和技术》(2016),摩根·考夫曼
[80] Xiao,X。;王,P。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:使用细胞自动机图像几何矩的方法,J.Theor。生物学,254691-696(2008)·Zbl 1400.92416号
[81] Xiao,X。;林,W.-Z。;Chou,K.-C.,《使用灰色动态模型和伪氨基酸组成预测蛋白质结构类别》,J.Compute。化学。,29, 2018-2024 (2008)
[82] Xiao,X。;邵,S.-H。;黄,Z.-D。;Chou,K.-C.,《使用伪氨基酸组成预测蛋白质结构类别:用复杂性度量因子进行探讨》,J.Compute。化学。,27, 478-482 (2006)
[83] Xiao,X。;Shao,S.-H。;黄,Z.D。;Chou,K.-C.,《使用伪氨基酸组成预测蛋白质结构类别:用复杂性度量因子进行探讨》,J.Compute。化学。,27, 478-482 (2006)
[84] Xu,Y。;文,X。;Wen,L.-S。;Wu,L.-Y。;纽约州邓。;Chou,K.-C.,iNitro-Tyr:预测具有一般伪氨基酸组成的蛋白质中的硝基酪氨酸位点,《公共科学图书馆·综合》,9,文章e105018 pp.(2014)
[85] 永胜,D。;铜梁,Z。;Kuo-Chen,C.,用伪氨基酸组成和模糊支持向量机网络预测蛋白质结构类,蛋白质。肽。莱特。,14, 811-815 (2007)
[86] 于芳,Q。;春华,W。;小青,Y。;杰,Z。;Tai-Gang,L。;Xiao-Qi,Z.,通过将过度代表的k-mers模式并入Chou的PseAAC,protein的一般形式来预测蛋白质结构类别。肽。莱特。,19, 388-397 (2012)
[87] Yu,B。;卢·L。;李,S。;Zhang,Y。;邱伟。;吴,X。;王,M。;Tian,B.,使用Chou的伪氨基酸组成和小波去噪预测低相似度序列的蛋白质结构类,J.Mol.Graph。型号。,76, 260-273 (2017)
[88] 扎米亚特宁,A.,溶液中的蛋白质体积,Prog。生物物理学。分子生物学。,24, 107-123 (1972)
[89] 张,L。;X.赵。;Kong,L.,通过进化差异信息预测低相似度序列的蛋白质结构类别为Chou的伪氨基酸组成的一般形式,J.Theor。生物学,355,105-110(2014)
[90] Zhang,S.,通过将PSSS和PSSM合并到Chou的通用PseAAC中,精确预测蛋白质结构类别,化学计量学。智力。实验室,142,28-35(2015)
[91] 张,T.-L。;Ding,Y.-S.,使用伪氨基酸组成和二元树支持向量机预测蛋白质结构类别,《氨基酸》,33,623-629(2007)
[92] 张,T.-L。;丁永生。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:近似熵和疏水性模式,J.Theor。生物学,250186-193(2008)·Zbl 1397.92551号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。