×

周的伪氨基酸成分改进了基于序列的防冻蛋白预测。 (英文) Zbl 1412.92249号

摘要:生物体中的防冻蛋白(AFP)在其对极冷温度的耐受性中发挥着关键作用,并具有广泛的生物技术应用。但由于物种的多样性,对生物学家来说,它们的识别一直是一个挑战。该领域的早期研究尚未涵盖序列序信息的引入,序列序信息被认为代表了各种蛋白质和蛋白质系统的重要属性,用于预测目的。在本研究中,使用支持向量机预测AFP,系统地探讨了代表蛋白质序列顺序的周伪氨基酸组成的影响。我们的研究结果表明,序列顺序信息的引入有助于在独立测试数据集上识别AFP,准确率为84.75%,优于AFP-Pred和iAFP等方法。我们的预测因子(AFP-PseAAC)、AFP-Pred和iAFP的相对绩效分别为0.71、0.48和0.05。我们希望这种新的预测方法将有助于基于AFP的生物技术应用研究。

MSC公司:

92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Altschul,S.F。;Madden,T.L。;Schaffer,A.A。;张杰。;张,Z。;米勒,W。;Lipman,D.J.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[2] 阿南德,A。;Pugalenthi,G。;Suganthan,P.N.,利用分类优化特征和决策概率通过SVM预测蛋白质结构类别,J.Theor。生物学,253,375-380(2008)
[3] Cai,Y.D。;李嘉图,P.W。;Jen,C.H。;Chou,K.C.,SVM在预测膜蛋白类型中的应用,J.Theor。生物学,226373-776(2004)
[4] 曹,D.S。;徐庆生。;Liang,Y.Z.,Propy:一种生成Chou’s PseAAC各种模式的工具,生物信息学,29960-962(2013)
[5] Chen,W。;冯·P。;Lin,H.,使用还原氨基酸字母预测酮酰基合酶家族,J.Ind.Microbiol。,39, 579-584 (2012)
[6] Chen,W。;林,H。;冯,P.M。;丁,C。;Zuo,Y.C。;Chou,K.C.,iNuc-PhyChem:一种基于序列的预测因子,用于通过物理化学性质识别核小体,PLoS One,7,e47843(2012)
[7] Chen,W。;冯,P.M。;Chou,K.C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[8] Chou,K.C.,抗冻蛋白的能量优化结构及其结合机制,分子生物学杂志。,223, 509-517 (1992)
[9] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。遗传学。,43, 246-255 (2001)
[10] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚家族类别,生物信息学,21,10-19(2005)
[11] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[12] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[13] Chou,K.C。;Cai,Y.D.,通过结合两性效应预测膜蛋白类型,《化学杂志》。信息模型。,45, 407-413 (2005)
[14] Chou,K.C。;Shen,H.B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63-92 (2009)
[15] Chou,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2, 63-92 (2009)
[16] Davies,P.L。;Hew,C.L.,《鱼类抗冻蛋白生物化学》,FASEB J.,42460-2468(1990)
[17] Dhole,K。;辛格,G。;Pai,P.P。;Mondal,S.,《利用L1-logreg分类器对蛋白质相互作用位点进行基于序列的预测》,J.Theor。生物学,348,47-54(2014)·Zbl 1412.92085号
[18] 丁·H。;罗,L。;Lin,H.,利用Chou的两亲性伪氨基酸组成预测细胞壁裂解酶,蛋白质Pept。莱特。,16, 351-355 (2009)
[19] 杜,P。;Li,Y.,通过将假氨基酸组成与分段序列的各种物理化学特征杂交预测蛋白质亚线粒体位置,BMC Bioninform。,7, 518 (2006)
[20] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC-Builder:一个跨平台独立程序,用于生成各种特殊的Chou伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[21] 杜,P。;顾S。;Jiao,Y.,PseAAC General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式的模式,Int.J.Mol.Sci。,15, 3495-3506 (2014)
[22] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,使用Chou的伪氨基酸组成概念预测人类乳头瘤病毒的风险类型,J.Theor。生物学,263203-209(2010)·Zbl 1406.92455号
[23] Fan,Y.N。;Xiao,X。;Min,J.L。;Chou,K.C.,iNR-Drug:预测药物与细胞网络中核受体的相互作用,国际分子科学杂志。,15, 4915-4937 (2014)
[24] 冯,P.M。;Chen,W。;林,H。;Chou,K.C.,iHSP-PseRAAC:使用伪还原氨基酸字母组成识别热休克蛋白家族,Ana。生物化学。,442, 118-125 (2013)
[25] 冯,P.M。;丁·H。;Chen,W。;Lin,H.,带特征选择的朴素贝叶斯分类器,用于识别噬菌体病毒蛋白,计算机。数学。方法医学,2013,530696(2013)·Zbl 1275.92017年
[26] 冯,P.M。;林,H。;Chen,W.,使用朴素贝叶斯从序列信息中识别抗氧化剂,计算。数学。方法医学,2013,567529(2013)
[27] Guo,S.H。;邓,E.Z。;徐立清。;丁·H。;林,H。;Chen,W。;Chou,K.C.,iNuc-PseKNC:基于序列的预测因子,用于预测具有伪K元组核苷酸组成的基因组中的核小体定位,生物信息学(2014)
[28] 黄R.B。;杜青山。;Wei,Y.T。;彭,Z.W。;魏,H。;Chou,K.C.,预测肽和蛋白质生物活性的物理和化学驱动的人工神经网络及其设计,J.Theor。生物学,256428-435(2009)·Zbl 1400.92188号
[29] Joachims,T.,《使大规模SVM学习实用化》,(Schölkopf,B.;Burges,C.;Smola,A.,《内核方法的进展——支持向量学习》(1999),麻省理工学院出版社剑桥:麻省理学出版社剑桥,MA,美国)
[30] Kandaswamy,K.K。;Chou,K.C。;马丁内斯,T。;米勒,S。;Suganthan,P.N。;Sridharan,S。;Pugalenthi,G.,AFP-Pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.Theor。生物学,270,56-62(2011)
[31] Lewitt,J.,《植物对环境胁迫的响应》,第1卷(1980年),学术出版社:纽约学术出版社
[32] 林,H。;Wang,H。;丁·H。;Chen,Y.L。;Li,Q.Z.,利用周氏伪氨基酸成分预测凋亡蛋白的亚细胞定位,生物学报。,57, 321-330 (2009)
[33] 林,H。;Chen,W。;袁,L.F。;李振强。;Ding,H.,使用过度代表的四肽预测蛋白质亚线粒体的位置,生物学报。,61, 259-268 (2013)
[34] 林,H。;Chen,W。;Ding,H.,AcalPred:一种基于序列的工具,用于区分酸性和碱性酶,《公共科学图书馆·综合》,8,e75726(2013)
[35] Lin,S.X。;Lapointe,J.,《理论与实验生物学一体化》,J.Biomed。工程师,6435-442(2013)
[36] 刘,B。;张,D。;Xu,R。;徐,J。;王,X。;陈,Q。;Dong,Q。;Chou,K.C.,将从频率剖面提取的进化信息与基于序列的内核相结合,用于蛋白质远程同源性检测,生物信息学,30472-479(2014)
[37] Min,J.L。;Xiao,X。;Chou,K.C.,iEzy-drug:一种用于识别细胞网络中酶和药物之间相互作用的网络服务器,生物医药研究国际,2013,701317(2013)
[38] Mohabatkar,H.,利用Chou的伪氨基酸组成预测蛋白质结构类别的细胞周期蛋白,计算。生物化学。,34, 320-327 (2010) ·Zbl 1403.92221号
[39] 蒙达尔,S。;巴夫纳,R。;B.R.莫汉。;Ramakumar,S.,用于芋螺毒素超家族分类的伪氨基酸组成和多类支持向量机方法,J.Theor。生物学,243,252-260(2006)·Zbl 1447.92309号
[40] 邱伟荣。;Xiao,X。;Chou,K.C.,iRSpot TNCPseAAC:鉴定具有三核苷酸组成和伪氨基酸成分的重组点,Int.J.Mol.Sci。,15, 1746-1766 (2014)
[41] Sahu,S.S。;Panda,G.,一种基于Chou伪氨基酸组成的新特征表示方法,用于蛋白质结构类预测,Compute。生物化学。,34, 320-327 (2010) ·Zbl 1403.92221号
[42] Schaffer,C.,通过交叉验证选择分类方法,马赫数。学习。,13, 135-143 (1993)
[43] Se-Kwon,K.,《海洋蛋白质和肽:生物活性和应用》(2013),John Wiley&Sons:John Willey&Sons United Kingdom
[44] 斯福尔莫,T。;科尔,F。;麦金太尔,J。;科尔,P。;杜曼,J.G。;Barnes,B.M.,《单个真菌昆虫的同时抗冻性和避免》,埃克西娅·努加托利亚,J.公司。生理学。B、 179897-902(2009)
[45] Shen,H.B。;Chou,K.C.,PseAAC:生成各种蛋白质伪氨基酸组成的灵活网络服务器,Ana。生物化学。,373, 386-388 (2008)
[46] Sonnhammer,E.L。;艾迪,S.R。;Durbin,R.,Pfam:基于种子比对的蛋白质结构域家族综合数据库,《蛋白质》,28,405-420(1997)
[47] Xiao,X。;Min,J.L。;王,P。;Chou,K.C.,iCDI-PseFpt:利用PseAAC和分子指纹识别细胞网络中的通道药物相互作用,J.Theor。《生物学》,337,71-79(2013)·Zbl 1411.92115号
[48] Z.小伟。;M.志强。;Minghao,Y.,使用支持向量机和进化图谱预测抗冻蛋白序列,国际分子科学杂志。,13, 2196-2207 (2012)
[49] Xu,Y。;丁,J。;Wu,L.Y。;Chou,K.C.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,e55844(2013)
[50] Youden,Y.W.,《癌症诊断测试评级指数》,3,32-35(1950)
[51] Yu,C.S。;Lu,C.H.,基于n肽成分的支持向量机和遗传算法识别防冻蛋白及其功能残留物,PLoS One,6,e20445(2011)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。