×

MemHyb:通过SAAC和PSSM杂交预测膜蛋白类型。 (英文) Zbl 1307.92308号

小结:大约50%的可用药物是针对膜蛋白的。了解膜蛋白的结构和功能在生物学和药理学研究中具有重要意义。因此,一种自动化的方法是非常有利的,它可以帮助根据初级序列识别新的膜蛋白类型。在本文中,我们解决了一个有趣的问题,即利用膜蛋白的序列信息对其进行分类。我们考虑了进化和物理化学特征,并将它们提供给我们的基于支持向量机(SVM)的分类系统,该系统具有纠错代码。我们采用一种强大的序列编码方案,通过融合位置特异性评分矩阵和分裂氨基酸组成来有效区分膜蛋白类型。对基于Bose、Chaudhuri、Hocquenghem编码的线性、多项式和RBF支持向量机进行了训练和测试。在两个数据集上,RBF-SVM的最大成功率分别为91.1%和93.4%。因此,我们提出的方法是区分膜蛋白类型的有效工具,可能有助于药物发现、细胞生物学和生物信息学领域的研究人员/学者。建议的MemHyb-SVM的web服务器可访问http://111.68.99.218/MemHyb-SVM网站.

MSC公司:

92D20型 蛋白质序列,DNA序列
92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Afridi,T.H。;A.Khan。;Lee,Y.S.,Mito-GSAAC:使用遗传集成分类器和分离氨基酸组成预测线粒体,《氨基酸》(2011年)
[2] Cai,Y.D。;周国平。;Chou,K.C.,通过使用功能域组成预测膜蛋白类型的支持向量机,Biophys。J.,84,3257-3263(2003)
[3] Cai,Y.D。;Lin,S。;Chou,K.C.,预测蛋白质信号序列及其裂解位点的支持向量机,肽,24159-161(2003)
[4] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,预测GalNAc-转移酶特异性的支持向量机,肽,23205-208(2002)
[5] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,预测蛋白质中HIV蛋白酶裂解位点的支持向量机,J.Compute。化学。,23, 267-274 (2002)
[6] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,用于β-回转类型分类和预测的支持向量机,J.Pept。科学。,8, 297-301 (2002)
[7] Cai,Y.D。;李嘉图,P.W。;Jen,C.H。;Chou,K.C.,支持向量机在预测膜蛋白类型中的应用,理论杂志。生物学,226373-776(2004)
[8] Chou,K.C.,使用伪氨基酸成分预测蛋白质亚细胞属性,蛋白质:结构。功能。遗传学。,43, 246-255 (2001)
[9] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[10] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[11] Chou,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。分子生物学。,30275-349(1995年)
[12] Chou,K.C。;Elrod,D.E.,膜蛋白类型和亚细胞位置的预测,蛋白质:结构。功能。遗传学。,34, 137-153 (1999)
[13] Chou,K.C。;Cai,Y.D.,通过结合两性效应预测膜蛋白类型,《化学杂志》。Inf.模型,45,407-413(2005)
[14] Chou,K.C。;Shen,H.B.,通过融合优化的证据理论K最近邻分类器预测真核蛋白亚细胞位置,《蛋白质组研究杂志》,51888-1897(2006)
[15] Chou,K.C。;Shen,H.B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,《生物化学》。生物物理学。Res.Commun.公司。,347, 150-157 (2006)
[16] Chou,K.C。;沈海斌,《综述:蛋白质亚细胞定位预测的最新进展》,《分析》。生物化学。,370, 1-16 (2007)
[17] Chou,K.C。;Shen,H.S.,MemType-2L:通过Pse-PSSM和Biochem结合进化信息预测膜蛋白及其类型的网络服务器。生物物理学。Res.Commun.公司。,360, 339-345 (2007)
[18] Chou,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2, 63-92 (2009)
[19] Chou,K.C。;Shen,H.B.,Plant-mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,《公共科学图书馆·综合》,5,e11335(2010)
[20] Chou,K.C。;吴振聪。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,《公共科学图书馆·综合》,6,e18258(2011)
[21] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,使用周的伪氨基酸组成概念预测人类乳头瘤病毒的风险类型,J.Theoret。生物学,263203-209(2010)·Zbl 1406.92455号
[22] 高庆斌。;Ye,X.F。;Jin,Z.C。;He,J.,《通过融合不同形式的伪氨基酸成分来提高外膜蛋白的区分能力》,Anal。生物化学。,398, 52-59 (2010)
[23] 哥伦比亚特区戈伦斯坦。;齐格勒,N.,《符号中的一类纠错码》,J.Soc.Indus。应用数学。,207-214年9月(1961年)·Zbl 0154.44103号
[24] 顾奇。;丁Y.S。;Zhang,T.L.,使用具有近似熵和疏水性模式的Chou伪氨基酸组成预测低同源性的G蛋白偶联受体类别,protein Pept。莱特。,17, 559-567 (2010)
[25] 海亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theoret。生物学,271,10-17(2011)·Zbl 1405.92217号
[26] 海亚特,M。;A.Khan。;酵母素,M.,使用分裂氨基酸和集合分类预测膜蛋白,氨基酸(2011年)
[27] 贾,C。;刘,T。;Chang,K。;Zhai,Y.,A.,使用双向贝叶斯特征提取预测疟疾寄生虫的线粒体蛋白质,生物化学,1-5(2011)
[28] Jones,D.T.,跨膜蛋白超家族存在吗?,FEBS Lett.公司。,423, 281-285 (1998)
[29] A.Khan。;Javed,S.J.,预测GdfeO3型钙钛矿晶格常数的规律,晶体学报。,b64120-122(2008年)
[30] A.Khan。;塔希尔,S.F。;Choi,T.S.,从扭曲图像中智能提取数字水印,IEICE Trans。信息系统。,2008年7月
[31] A.Khan。;M.F.Khan。;Choi,T.S.,变换域中基于邻近性的GPCR预测,生物化学。生物物理学。Res.Commun.公司。,371, 411-415 (2008)
[32] A.Khan。;马吉德,A。;Choi,T.S.,预测蛋白质亚细胞位置:利用基于氨基酸的特征空间序列和不同分类器的融合,《氨基酸》,38,347-350(2010)
[33] A.Khan。;马吉德,A。;Hayat,M.,CE-Ploc:一种新的基于多样性的分类器融合,用于预测蛋白质亚细胞位置,Compute。生物化学。,35, 218-229 (2011) ·Zbl 1226.92020号
[34] A.Khan。;塔希尔,S.F。;马吉德,A。;Choi,T.S.,考虑到预期攻击的基于机器学习的自适应水印解码,模式识别,412594-2610(2008)·Zbl 1151.68585号
[35] 库扎尼,A.Z。;Nasireding,G.,《BCH代码和随机森林的多标签分类》,国际期刊《最新趋势工程》,2113-116(2009)
[36] 李,F.M。;Li,Q.Z.,使用Chou的伪氨基酸组成和改进的杂交方法预测蛋白质亚细胞位置,蛋白质肽。莱特。,15, 612-616 (2008)
[37] Lin,H.,利用周氏伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.Theoret。《生物学》,252350-356(2008)·Zbl 1398.92076号
[38] Lin,H。;丁·H。;冯,B。;郭富斌。;张亚勇。;黄,J.,利用周氏伪氨基酸组成预测分枝杆菌蛋白质的亚细胞定位,蛋白质Pept。莱特。,15, 739-744 (2008)
[39] Lin,S。;Costello,D.J.,《错误控制编码:基础与应用》(1983年),普伦蒂斯·霍尔公司:普伦蒂斯霍尔公司,新泽西州恩格尔伍德克利夫斯(第141-180页)·Zbl 1310.94181号
[40] 刘,H。;王,M。;Chou,K.C.,预测膜蛋白类型的低频傅里叶光谱,生物化学。生物物理学。Res.Commun.公司。,336, 737-739 (2005)
[41] 刘,T。;郑,X。;Wang,J.,使用支持向量机和PSI-BLAST剖面预测低相似度序列的蛋白质结构类别,Biochimie,921330-1334(2010)
[42] 缪,S.G。;Lee,T.S。;Chen,C.M.,用于MPEG视频的易出错传输的BCH编码水印,Lect。注释计算。科学。,654-661 (2001) ·Zbl 1031.68836号
[43] Mohabatkar,H.,利用周氏伪氨基酸组成预测细胞周期蛋白,蛋白质Pept。莱特。,17, 1207-1214 (2010)
[44] Mohabatkar,H。;穆罕默德·贝吉,M。;Esmaeili,A.,利用Chou伪氨基酸组成和支持向量机的概念预测GABA(A)受体蛋白,J.Theoret。生物学,281,18-23(2011)·兹比尔1397.92215
[45] 纳维德,M。;Khan,A.,GPCR-MPredictor:使用遗传集成对G蛋白偶联受体进行多级预测,《氨基酸》(2011年)
[46] 邱建德。;黄,J.H。;Liang,R.P。;Lu,X.Q.,基于Chou伪氨基酸组成概念的G蛋白偶联受体类预测:基于离散小波变换的方法,Ana。生物化学。,390, 68-73 (2009)
[47] 邱建德。;黄,J.H。;史,S.P。;Liang,R.P.,利用Chou伪氨基酸组成的概念预测酶家族类别:一种基于离散小波变换的支持向量机方法,蛋白质肽。莱特。,17, 715-722 (2010)
[48] 邱建德。;Sun,X.U。;黄,J.H。;Liang,R.P.,基于离散小波变换和支持向量机的膜蛋白类型预测,J.Protien,29114-119(2010)
[49] 拉赫曼,Z.U。;Khan,A.,利用伪氨基酸组成和不同理化性质的多尺度能量表示进行GPCR预测,Ana。生物化学。,412, 173-182 (2011)
[50] Rezaei,医学硕士。;Maleki,P.A。;Z.卡拉米。;Asadabadi,E.B。;医学硕士Sherafat。;Moghaddam,K.A。;法代,M。;Forouzanfar,M.,《利用小波分析和级联神经网络预测膜蛋白类型》,J.Theoret。生物学,255,817-820(2008)
[51] Schaffer,A.A。;Aravind,L。;Madden,T.L。;沙维林,S。;Spouge,J.L.,《利用基于成分的统计数据和其他改进提高PSI-BLAST蛋白质数据库搜索的准确性》,《核酸研究》,29,2994-3005(2001)
[52] Sklar,B.,《数字通信:基础与应用》(2001),Prentice-Hall Inc·Zbl 0717.94002号
[53] Tsoumakas,G。;Katakis,I.,《多标签分类:概述》,《国际数据仓库》,3,1-13(2007)
[54] Tusnady,G.E。;佐治亚州多斯塔尼。;Simon,I.,《蛋白质数据库中的跨膜蛋白:识别和分类》,生物信息学,202964-2972(2004)
[55] (Vapnik,V.,《统计学习理论的本质》(1995),斯普林格出版社)·Zbl 0833.62008号
[56] (Vapnik,V.,《统计学习理论》(1998),约翰·威利:约翰·威利纽约)·Zbl 0935.62007号
[57] 维玛,R。;瓦什尼,G.C。;Raghava,G.P.S.,使用分裂氨基酸组成和PSSM谱预测疟疾寄生虫的线粒体蛋白质,氨基酸,39,101-110(2010)
[58] Wang,L。;袁,Z。;陈,X。;周,Z.,用NPE预测膜蛋白类型,IEICE Electron。快递,6397-402(2010)
[59] 王,M。;杨,J。;刘国平。;徐志杰。;Chou,K.C.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计。选择。,17, 509-516 (2004)
[60] 王世清。;杨,J。;Chou,K.C.,基于伪氨基酸使用叠加泛化来预测膜蛋白类型,J.Theor。《生物学》,242941-946(2006)·Zbl 1447.92315号
[61] Xiao,X。;王,P。;Chou,K.C.,GPCR-CA:预测G蛋白偶联受体功能类的细胞自动机图像方法,J.Compute。化学。,30, 1414-1423 (2009)
[62] Xiao,X。;王,P。;Chou,K.C.,GPCR-2L:通过杂交两种不同模式的伪氨基酸组成来预测G蛋白偶联受体及其类型,Mol.Bioyst。,7, 911-919 (2011)
[63] Yu,L。;郭毅。;李毅。;李·G。;Li,M.,SecretP:通过将新特征融合到周的伪氨基酸组成中来识别细菌分泌的蛋白质,J.Theoret。生物学,267,1-6(2010)·Zbl 1410.92040号
[64] 曾Y.H。;郭永中。;肖瑞秋。;Yang,L。;Yu,L.Z.,使用增广的Chou伪氨基酸组成基于自协方差方法预测蛋白质亚线粒体位置,J.Theoret。生物学,259366-372(2009)·Zbl 1402.92193号
[65] 张国勇。;Fang,B.S.,基于氨基酸组成分布和Chou的两亲性伪氨基酸组成预测氧化还原酶的辅因子,J.Theoret。《生物学》,253,310-315(2008)
[66] 张,S。;丁·S。;Wang,T.,基于预测的二级结构对低相似度序列蛋白质结构类的高精度预测,Biochimie,1-5(2011)
[67] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.Theoret。《生物学》,248546-551(2007)·兹比尔1451.92245
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。