×

通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型。 (英语) Zbl 1405.92217号

摘要:膜蛋白是一种重要的蛋白质,在细胞中充当通道、受体和能量传感器。膜蛋白类型预测是生物信息学的一个重要研究领域。膜蛋白类型的知识为预测新的膜蛋白类型示例提供了一些有价值的信息。然而,由于膜蛋白类型的固有相似性,膜蛋白类型分类既耗时又容易出错。本文提出了一种基于神经网络的膜蛋白类型预测系统。复合蛋白质序列表示(CPSR)用于提取蛋白质序列的特征,其中包括七个特征集;氨基酸组成、序列长度、2克交换基团频率、疏水基团、电子基团、疏水性和R基团。然后采用主成分分析降低特征向量的维数。分类器采用概率神经网络(PNN)、广义回归神经网络和支持向量机(SVM)。使用SVM进行刀切试验,获得了86.01%的高成功率。在独立数据集测试中,PNN的准确率最高,为95.73%。这些分类器在使用其他性能度量(如敏感性、特异性、马修相关系数和F度量)时表现出了改进的性能。实验结果表明,所提出的膜蛋白类型分类方案的预测性能是迄今为止最好的。这种性能的提高在很大程度上归功于神经网络的学习能力和复合特征提取策略,该策略利用了蛋白质序列的七种不同属性。提议的Mem预测器可以在以下位置访问http://111.68.99.218/成员预测.

MSC公司:

92D20型 蛋白质序列,DNA序列
68T05型 人工智能中的学习和自适应系统
92立方37 细胞生物学
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 曹,L.,支持向量机时间序列预测专家,神经计算。,51, 321-339, (2003)
[2] 蔡,Y.D。;刘晓杰。;X.B.Xu。;Chou,K.C.,预测半乳糖转移酶特异性的支持向量机,肽,23205-208,(2002)
[3] 蔡,Y.D。;刘晓杰。;X.B.Xu。;Chou,K.C.,预测蛋白质中HIV蛋白酶裂解位点的支持向量机,J.comput。化学。,23, 267-274, (2002)
[4] 蔡,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,用于β-回转类型分类和预测的支持向量机,J.pept。科学。,8, 297-301, (2002)
[5] 蔡,Y.D。;周,G.P。;Chou,K.C.,利用功能域组成预测膜蛋白类型的支持向量机,Biophys。J.,84,3257-3263,(2003)
[6] 蔡,Y.D。;Lin,S。;Chou,K.C.,预测蛋白质信号序列及其裂解位点的支持向量机,肽,24159-161,(2003)
[7] 蔡,Y.D。;Feng,K.Y。;李,Y.X。;Chou,K.C.,预测α-转角类型的支持向量机,肽,24629-630,(2003)
[8] 蔡,Y.D。;里卡多,P.W。;Jen,C.H。;Chou,K.C.,SVM在预测膜蛋白类型中的应用,J.theor。生物学,226373-776,(2004)
[9] 陈,C。;Chen,L。;邹,X。;蔡,P.,利用周氏伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein pept。利特。,16, 27-31, (2009)
[10] 陈,Y。;Isaac,G.C.,支持向量机概述简介,Al-magzine,24,1-2,(2003)
[11] 周,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。微生物。,30, 275-349, (1995)
[12] 周,K.C。;Elrod,D.W.,《膜蛋白类型和亚细胞位置的预测》,《蛋白质:结构》。功能。基因。,34, 137-153, (1999)
[13] Chou,K.C.,使用伪氨基酸组成预测蛋白质亚细胞属性,蛋白质:结构、功能,遗传学,43,246-255,(2001)
[14] 周,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.biol。化学。,277, 45765-45769, (2002)
[15] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19,(2005)
[16] 周,K.C。;Shen,H.B.,Memtype-2L:一个通过pse-PSM整合进化信息来预测膜蛋白及其类型的网络服务器,Biochem。生物物理。公共资源。,360, 339-345, (2007)
[17] 周,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2,63-92,(2009),可在\9001http://www.scirp.org/journal/NS/
[18] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274,(2009)
[19] 周,K.C。;Shen,H.B.,Cell-ploc 2.0:一个改进的网络服务器包,用于预测各种生物体中蛋白质的亚细胞定位,《自然科学》。,21090-1103,(2010),可在\9001http://www.scirp.org/journal/NS/
[20] 周,K.C。;Shen,H.B.,预测单位点和多位点真核蛋白亚细胞定位的新方法:euk-mploc 2.0,Plos one,5,e9931,(2010)
[21] 周,K.C。;Shen,H.B.,Plant-mploc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,Plos one,5,e11335,(2010)
[22] Dayhoff,M.O。;R.M.施瓦茨。;Orcutt,B.C.,蛋白质进化变化模型,Atlas蛋白质序列结构。,5,345-352,(1978年)
[23] Devroye,L.P。;Györfi,L.,非参数密度估计:L1观点,(1985),威利纽约·Zbl 0546.62015号
[24] 丁,Y.S。;张,T.L。;Chou,K.C.,用伪氨基酸组成和模糊支持向量机网络预测蛋白质结构类,蛋白质pept。利特。,14, 811-815, (2007)
[25] 丁·H。;罗,L。;Lin,H.,利用Chou的两亲性伪氨基酸组成预测细胞壁裂解酶,蛋白质肽。利特。,16, 351-355, (2009)
[26] 杜达,R.O。;哈特,体育。;Stock,D.G.,Pattern classification,(2001),John Wileys Sons纽约·Zbl 0968.68140号
[27] 埃格巴尔,G.M。;Mansoor,J.Z。;Seraj,D.K.,使用模糊规则分类器的Protien超家族分类,IEEE trans。纳米生物学。,8, 1-8, (2009)
[28] 艾森伯格,D。;施瓦兹,E。;科马罗米,M。;Wall,R.,用疏水矩图分析膜和表面蛋白质序列,J.mol.biol。,179, 125-142, (1984)
[29] 方,G。;陶,G。;Zang,S.,《蛋白质亚细胞定位的生物信息学预测研究》,Curr。生物信息学,4177-182,(2009)
[30] Golmohammadi,S.K.公司。;库根,L。;克劳利,B。;Reformat,M.,《细胞膜蛋白的分类》,Front。收敛biosci。信息技术。,153-158, (2007)
[31] 古勒马斯,J.Y。;Liatsis,P。;Zeng,X.J.,具有局部结构信息和协方差体自适应的核回归网络,神经计算。,72, 257-261, (2008)
[32] Kedarisetti,K。;Kuragan,L。;Dick,S.,用不同同源性预测蛋白质结构类的分类器集成,生物化学。生物物理。公共资源。,348, 981-988, (2006)
[33] A.Khan。;塔希尔,S.F。;马吉德,A。;崔泰孙。,针对预期攻击的基于机器学习的自适应水印解码,模式识别,41,2594-2610,(2008)·Zbl 1151.68585号
[34] Khan,A.,Tahir,S.F.,Choi,Tae Sun,2008年b。从失真图像中智能提取数字水印。IEICE信息系统汇刊E91-D(7),2072;Khan,A.,Tahir,S.F.,Choi,Tae-Sun,2008b。从失真图像中智能提取数字水印。IEICE信息系统汇刊E91-D(7),2072
[35] A.Khan。;马吉德,A。;Choi,T.S.,预测蛋白质亚细胞位置:利用基于氨基酸的特征空间序列和不同分类器的融合,氨基酸,38,347-350,(2010)
[36] 刘,H。;王,M。;Chou,K.C.,预测膜蛋白类型的低频傅里叶光谱,生物化学。生物物理。公共资源。,336, 737-739, (2005)
[37] Lin,H.,利用Chou的伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.theor。生物学,252350-356,(2008)·Zbl 1398.92076号
[38] Mohabatkar,H.,使用Chou的伪氨基酸组成预测细胞周期蛋白,蛋白肽。利特。,17, 1207-1214, (2010)
[39] 邱J.D。;Sun,X.U。;黄J.H。;Liang,R.P.,基于离散小波变换和支持向量机的膜蛋白类型预测,J.protien,29114-119,(2010)
[40] Rezaei,文学硕士。;马莱基,P.A。;Z.卡拉米。;Asadabadi,E.B。;Sherafat,文学硕士。;莫加达姆,K.A。;法代,M。;Forouzanfar,M.,《利用小波分析和级联神经网络预测膜蛋白类型》,J.theor。生物学,255,817-820,(2008)
[41] Sonnhammer,E.L.L.,Heijne,G.V.,Krogh,A.,1998年。预测蛋白质序列跨膜螺旋的隐马尔可夫模型。摘自:《第六届分子生物学智能系统国际会议论文集》,AAAI/MIT出版社,加州门洛帕克,第6卷,第175-182页。;Sonnhammer,E.L.L.,Heijne,G.V.,Krogh,A.,1998年。预测蛋白质序列跨膜螺旋的隐马尔可夫模型。摘自:《第六届分子生物学智能系统国际会议论文集》,AAAI/MIT出版社,加州门洛帕克,第6卷,第175-182页。
[42] Specht,D.F.,概率神经网络,神经网络,3109-118,(1990)
[43] Tsoumakas,G。;Katakis,I.,《多标签分类:概述》,《国际数据仓库》。最小值,3,1-13,(2007)
[44] 维拉尔,S。;Gonzalez-Diaz,H。;桑塔纳,L。;Uriart,E.,预测人类结直肠癌基因成分生物标记物的网络-QSAR模型,J.theor。生物学,261449-458,(2009)·Zbl 1403.92088号
[45] 王,M。;杨,J。;刘,G.P。;徐志杰。;Chou,K.C.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计。选择。,17, 509-516, (2004)
[46] 王胜强。;杨,J。;Chou,K.C.,使用叠加泛化来预测基于伪氨基辅助的记忆蛋白类型,J.理论。生物学,242941-946,(2006)·Zbl 1447.92315号
[47] Wang,L。;袁,Z。;陈,X。;周,Z.,用NPE,IEICE电子预测膜蛋白类型。快递,第7卷,第6期,397-402,(2010)
[48] Waugh,D.F.,Protien–蛋白质相互作用,高级蛋白质化学。,9, 325-437, (1954)
[49] 吴,C.H。;贝里,M。;Fung,Y.S。;Mclarty,J.,《全尺寸蛋白质序列分类的神经网络:具有奇异值分解的序列编码》,马赫。学习。,21, 177-193, (1995)
[50] 吴,C。;惠特森,G。;Mclarty,J。;Ermongkonchai,A。;Chang,T.C.,蛋白质分类人工神经系统,蛋白质科学。,1, 667-677, (1992)
[51] 张,L.I。;Lioa,B.O。;李,D。;Zhu,W.,使用支持向量机预测凋亡蛋白亚细胞定位的新表示法,J.theor。生物学,259361-365,(2009)·兹比尔1402.92163
[52] 曾Y.H。;郭义忠。;Xiao,R.Q。;Yang,L。;Yu,L.Z。;Li,M.L.,基于自协方差方法,使用增广的周伪氨基酸组成预测蛋白质亚线粒体位置,J.theor。生物学,259366-372,(2009)·Zbl 1402.92193号
[53] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.theor。生物学,248546-551,(2007)·Zbl 1451.92245号
[54] Zumdahi,S.,《化学》(2000),霍顿-米夫林公司
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。