×

使用最近特征线和可调最近邻方法预测蛋白质亚细胞位置。 (英语) Zbl 1087.92024号

摘要:蛋白质的亚细胞位置与其生物学功能密切相关。本文引入了两种新的模式分类方法,即最近特征线(NFL)和可调谐最近邻(TNN),仅根据蛋白质的氨基酸组成来预测蛋白质的亚细胞位置。模拟实验是在先前构建的数据集上进行的,该数据集由2427种真核蛋白和997种原核蛋白组成。数据集中的所有蛋白质序列分为四个真核亚细胞位置和三个原核生物亚细胞位置。NFL分类器对真核蛋白的总预测准确率为82.5%,对原核蛋白的总预测准确率为91.0%。TNN分类器的总预测准确率分别为83.6%和92.2%。很明显,已经达到了较高的预测精度。与支持向量机(SVM)和最近邻方法相比,这两种方法显示出相似甚至更高的预测精度。因此,我们得出结论,NFL和TNN可以作为预测蛋白质亚细胞位置的补充方法。

MSC公司:

92C40型 生物化学、分子生物学
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

ESLpred公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bendtsen,J.D。;尼尔森,H。;冯·海因,G。;Brunak,S.,《信号肽预测的改进:信号肽3.0》,《分子生物学杂志》。,340, 783-795 (2004)
[2] 巴辛,M。;Raghava,G.P.S.,ESLpred:基于SVM的真核蛋白质亚细胞定位方法,使用二肽组成和PSI-BLAST,核酸研究,32,414-419(2004)
[3] Cedano,J。;阿洛伊,P。;Perez-Pons,J.A。;Querol,E.,氨基酸组成与蛋白质细胞位置的关系,《分子生物学杂志》。,266, 594-600 (1997)
[4] Chen,K。;Wu,T.Y。;张海杰,关于使用最近特征线进行说话人识别,Patt。认可。莱特。,23, 1735-1746 (2002) ·Zbl 1010.68140号
[5] Chou,K.C.,通过结合准序列效应预测蛋白质亚细胞位置,生物化学。生物物理学。Res.Commun.公司。,278, 477-483 (2000)
[6] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,蛋白质结构。功能。遗传学。,43, 246-255 (2001)
[7] Chou,K.C。;Elrod,D.W.,蛋白质亚细胞位置预测,蛋白质工程,12,107-118(1999)
[8] Chou,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.Biol。化学。,277, 45765-45769 (2002)
[9] Chou,K.C。;Cai,Y.D.,通过结合基因本体论和生物化学预测蛋白质亚细胞定位的新混合方法。生物物理学。Res.Commun.公司。,311, 743-747 (2003)
[10] 盖,T.M。;Hart,P.E.,最近邻模式分类,IEEE Trans。通知。西奥。IT,13,21-27(1967)·Zbl 0154.44505号
[11] O.伊曼纽尔森。;尼尔森,H。;Brunk,S。;von Heijne,G.,基于蛋白质N端氨基酸序列预测蛋白质的亚细胞定位,分子生物学杂志。,300, 1005-1016 (2000)
[12] Y.藤原。;Asogawa,M.,利用氨基酸组成和顺序预测亚细胞定位,基因组信息。,12, 103-112 (2001)
[13] 高,Q.B。;王,Z.Z。;严,C。;Du,Y.H.,使用序列的组合特征预测蛋白质亚细胞位置,FEBS Lett。,579, 3444-3448 (2005)
[14] P.R.格雷夫斯。;Haystead,T.A.J.,《蛋白质组学分子生物学家指南》,微生物学。分子生物学。修订版,66,39-63(2002)
[15] 华,S。;Sun,Z.,蛋白质亚细胞位置预测的支持向量机方法,生物信息学,17,721-728(2001)
[16] 黄,Y。;Li,Y.,使用模糊(k)-NN方法预测蛋白质亚细胞位置,生物信息学,20,21-28(2004)
[17] Lio,P。;Vannucci,M.,跨膜蛋白的小波变换点预测,生物信息学,16,376-382(2000)
[18] 李S.Z。;Lu,J.,使用最近特征线方法进行人脸识别,IEEE Trans。诺尔。净值。,10, 439-443 (1999)
[19] 李S.Z。;Chan,K.L。;Wang,C.L.,最近特征线方法在图像分类和检索中的性能评估,IEEE Trans。帕特。分析。机器。智力。,22, 1335-1349 (2000)
[20] Mardia,K.V。;Kent,J.T。;Bibby,J.M.,多元分析(1979),学术出版社:伦敦学术出版社,第322-381页·Zbl 0432.62029号
[21] Matthews,B.W.,T4噬菌体溶菌酶预测和观察二级结构的比较,Biochim。生物物理学。《学报》,405,442-451(1975)
[22] Nakai,K。;Kanehisa,M.,预测革兰氏阴性菌中蛋白质定位位点的专家系统,蛋白质结构。功能。遗传学。,11, 95-110 (1991)
[23] Nakai,K。;Kanehisa,M.,预测真核细胞蛋白质定位位点的知识库,基因组学,14897-911(1992)
[24] Nakai,K。;Horton,P.,PSORT:一个用于检测蛋白质中的分选信号并预测其亚细胞定位的程序,Trends Biochem。科学。,24, 34-36 (1999)
[25] Nakashima,H。;Nishikawa,K.,《利用氨基酸组成和残基对频率区分细胞内和细胞外蛋白质》,《分子生物学杂志》。,238, 54-61 (1994)
[26] 尼尔森,H。;Engelbrecht,J。;Brunk,S。;von Heijne,G.,原核和真核信号肽的鉴定及其切割位点的预测,蛋白质工程,10,1-6(1997)
[27] 尼尔森,H。;Krogh,A.,用隐马尔可夫模型预测信号肽和信号锚,Proc。第六国际竞争情报。系统。分子生物学。,122-130 (1998)
[28] 尼尔森,H。;Brunk,S。;von Heijne,G.,《预测信号肽和其他蛋白质分类信号的机器学习方法》,《蛋白质工程》,12,3-9(1999)
[29] 莱因哈特,A。;Hubbard,T.,《使用神经网络预测蛋白质的亚细胞位置》,《核酸研究》,第26期,第2230-2236页(1998年)
[30] Rost,B。;Fariselli,P。;Casadio,R.,86岁时螺旋跨膜蛋白的拓扑预测
[31] Vapnik,V.,《统计学习理论》(1998),威利出版社:威利纽约·Zbl 0935.62007号
[32] Yuan,Z.,使用马尔可夫链模型预测蛋白质亚细胞位置,FEBS Lett。,451, 23-26 (1999)
[33] 郑伟。;赵,L。;Zou,C.,模式分类的局部最近邻分类器,Patt。推荐。,37, 1307-1309 (2004) ·Zbl 1069.68595号
[34] 周,Y。;张,C。;Wang,J.,可调最近邻分类器,Lec。票据构成。科学。,3175, 204-211 (2004)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。