×

使用多轮廓贝叶斯和双粒度概率特征空间的混合空间预测蛋白质结构类。 (英语) Zbl 1412.92243号

摘要:蛋白质是生物体生物功能的执行者。在蛋白质组学、计算生物学和生物信息学的时代,蛋白质结构的理解是一个具有挑战性的问题,因为它在蛋白质折叠模式中起着关键作用。由于蛋白质数据库中对蛋白质序列的大量探索以及蛋白质结构的复杂性,实验和理论方法不足以预测蛋白质结构类别。因此,迫切需要开发一个准确、可靠、高通量的计算模型,以便从多基因序列中正确预测蛋白质结构类别。在这方面,我们提出了一个很有前景的模型,该模型使用混合描述符空间和优化的证据理论K最近邻算法。混合空间是两个描述符空间的组合,包括多轮廓贝叶斯和二元概率。为了增强分类器的泛化能力,我们使用著名的进化特征选择技术粒子群优化从混合空间中选择了高分辨描述符。通过对三个低相似度基准数据集(包括25PDB、1189和640)的折刀测试,对所提模型进行了性能评估。在三个基准数据集上,该模型的成功率分别为87.0%、86.6%和88.4%。对比分析表明,与文献中的现有方法相比,我们提出的模型取得了令人满意的结果。此外,我们提出的预测系统可能有助于未来的研究,尤其是在研究重点是低相似度数据集的情况下。

MSC公司:

92D20型 蛋白质序列、DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Adl,A.A。;Dalini,A.N。;薛,B。;乌弗斯基,V.N。;钱,X.,使用功能域准确预测蛋白质结构类和预测二级结构序列,J.Biomol。结构。动态。,29, 623-633 (2012)
[2] 阿南德,G。;Pugalenthi,P.N。;Suganthan,利用分类优化特征和决策概率通过SVM预测蛋白质结构类,J.Theor。生物学,253,375-380(2008)
[3] 安芬森,C.,《蛋白质链折叠原理》,《科学》,181,223-230(1973)
[4] 巴哈,I。;Atilgan,A.R。;Jernigan,R.L。;Erman,B.,《理解氨基酸组成对蛋白质结构类的识别》,《蛋白质》,29,172-185(1997)
[5] Blum,A。;Langley,P.,《机器学习中相关特征和示例的选择》,Artif。智力。,97, 245-271 (1997) ·Zbl 0904.68142号
[6] Cai,Y.D。;周国平,用神经网络预测蛋白质结构类别,生物化学,82783-785(2000)
[7] Cai,Y.D。;Feng,K.Y。;卢,W.C。;Chou,K.C.,使用LogitBoost分类器预测蛋白质结构类别,J.Theor。《生物学》,238172-176(2006)·Zbl 1445.92220号
[8] Chen,K。;洛杉矶库根。;Ruan,J.S.,使用新的基于进化搭配的序列表示预测蛋白质结构类,J.Compute。化学。,29, 1596-1604 (2008)
[9] Chou,K.C.,《蛋白质结构类测定的关键驱动力》,《生物化学》。生物物理学。Res.Commun.公司。,264, 216-224 (1999)
[10] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质,43246-255(2001)
[11] Chou,K.C。;Cai,Y.D.,通过功能域组成预测蛋白质结构类别,生物化学。生物物理学。Res.Commun.公司。,321, 1007-1009 (2004)
[12] 科斯坦蒂尼,S。;法奇亚诺,A.M.,《通过特定肽频率预测蛋白质结构类别》,《生物化学》,91,226-229(2009)
[13] Denoeux,T.,基于Dempster-Shafer理论的K最近邻分类规则,IEEE Trans,Syst。人、赛博、。,第25卷,804-813(1995)
[14] Deschavanne,P。;Tuffery,P.,探索蛋白质分类和结构类预测的无比对方法,Biochimie,9615-625(2008)
[15] 海亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,271,10-17(2011)·Zbl 1405.92217号
[16] 海亚特,M。;Khan,A.,MemHyb:通过SAAC和PSSM杂交预测膜蛋白类型,J.Theor。生物,29293-102(2012)·Zbl 1307.92308号
[17] 海亚特,M。;Khan,A.,Mem-PHybrid:基于杂交特征的膜蛋白类型分类预测系统,Ana。生物化学。,424, 35-44 (2012)
[18] 海亚特,M。;A.Khan。;Yeasin,M.,《使用分裂氨基酸组成和集合分类预测膜蛋白》,《氨基酸杂志》,42,2447-2460(2012)
[20] Kedarisetti,K.D。;库根,L。;Dick,S.,用于不同同源性的蛋白质结构类预测的分类器集合,Biochem。生物物理学。Res.Commun.公司。,348 (2006)
[22] Kohavi,R。;John,G.H.,特征子集选择包装器,Artif。智力。,97, 273-324 (1997) ·兹伯利0904.68143
[23] 库根,L。;Homaeian,L.,蛋白质序列和结构域结构类的预测-预测算法、序列表示和同源性以及测试程序对准确性的影响,模式识别。,39, 2323-2343 (2006) ·Zbl 1103.68767号
[24] 库根,L。;Chen,K.,暮光带序列的蛋白质结构类预测,生物化学生物物理。Res.Commun.公司。,357, 453-460 (2007)
[25] 库根,L。;Cios,K。;Chen,K.,SCPRED:利用预测序列准确预测曙光区相似序列的蛋白质结构类别,BMC Bioninform。,9, 226 (2008)
[26] Lin,H。;Li,Q.Z.,《使用伪氨基酸组成预测蛋白质结构类别:通过合并400个二肽组分的方法》,J.Compute。化学,281463-1466(2007)
[27] 刘,T。;郑,X。;Wang,J.,使用支持向量机和PSI-BLASTprofile预测低相似度序列的蛋白质结构类别,Biochimie,921330-1334(2010)
[28] 罗瑞英。;冯,Z.P。;刘建康,用氨基酸和多肽组成预测蛋白质结构类别,《欧洲生物化学杂志》。,2694219-4225(2002年)
[29] Mizianty,M.J。;Kurgan,L.,利用预测序列从曙光区一致性序列对蛋白质结构类进行模块化预测,BMC Bioninform,10,414(2009)
[30] Nakashima,H。;西川,K。;Ooi,T.,蛋白质的折叠类型与氨基酸组成有关,J.Biochem。,99, 153-162 (1986)
[31] 邱建德。;Luo,S.H。;黄,J.H。;Liang,R.P.,使用支持向量机预测基于离散小波变换的蛋白质结构类别,J.Comput。化学。,30, 1344-1350 (2009)
[32] Schaffer,A.A。;Aravind,L。;Madden,T.L。;沙维林,S。;Spouge,J.L.,《利用基于成分的统计数据和其他改进提高PSI-BLAST蛋白质数据库搜索的准确性》,《核酸研究》,29,2994-3005(2001)
[33] 邵,J。;徐,D。;蔡,S。;Wang,Y。;Ngai,S.,通过双文件贝叶斯特征提取进行蛋白质甲基化位点的计算识别,《公共科学图书馆·综合》,第44920页(2009年)
[34] Sharma,A。;Lyons,J。;Dehzangi,A。;Paliwal,K.K.,《利用位置特异性评分矩阵的双粒度不稳定性进行蛋白质折叠识别的特征提取技术》,J.Theor。生物学(2013)·Zbl 1406.92471号
[35] Shen,H.B。;Chou,K.C.,使用优化的证据理论K最近邻分类器和伪氨基酸组成预测膜蛋白类型。生物化学、生物物理。Res.Commun.公司。,334, 288-292 (2005)
[36] Shen,H.B。;Chou,K.C.,蛋白质折叠模式识别的集成分类器,生物信息学,141717-1722(2006)
[37] Shen,H.B。;杨,J。;刘晓杰。;Chou,K.C.,《使用监督模糊聚类预测蛋白质结构类别》,《生物化学》。生物物理学。Res.Commun.公司。,334, 577-581 (2005)
[38] 宋,J。;Tan,H。;沈,H。;Mahmood,K。;博伊德,S.E。;Webb,G.,Cascleave:更准确预测caspase底物裂解位点,生物信息学,26,752-760(2010)
[39] Sun,X.D。;Huang,R.B.,使用支持向量机预测蛋白质结构类,氨基酸,30469-475(2006)
[40] 王Z.X。;袁,Z.,用组分耦合法预测蛋白质结构类的好坏,《蛋白质》,38,165-175(2000)
[41] Xiao,X。;Shao,S.H。;黄,Z.D。;Chou,K.C.,《使用伪氨基酸组成预测蛋白质结构类别:用复杂性度量因子进行探讨》,J.Compute。化学。,27, 478-482 (2006)
[42] Yang,J.Y。;彭,Z.L。;Yu,Z.G。;张瑞杰。;Anh,V。;Wang,D.S.,基于混沌博弈表示的递归量化分析预测蛋白质结构类,J.Theor。生物学,257,618-626(2009)·Zbl 1400.92417号
[43] 杨,J。;彭,Z。;Chen,X.,基于预测的二级结构预测低同源序列的蛋白质结构类别,BMC Bioninform,11(2010)
[44] 张,S。;Yang,L。;Wang,T.,利用信息差异测度比较蛋白质二级结构,分子结构杂志。Theochem.、。,909, 102-106 (2009)
[45] 张,S。;丁·S。;Wang,T.,基于预测的二级结构对低相似度序列蛋白质结构类的高精度预测,Biochimie,1-5(2011)
[46] Zhang,T.L。;Ding,Y.S.,使用伪氨基酸组成和二元树支持向量机预测蛋白质结构类别,《氨基酸》,33,623-629(2007)
[47] Zhang,T.L。;丁Y.S。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:近似熵和疏水性模式,J.Theor。生物学,250186-193(2008)·Zbl 1397.92551号
[48] 周,P.,关于蛋白质结构类预测的有趣争议,蛋白质化学杂志。,17229-738(1998年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。