×

通过将伪平均化学位移纳入周氏伪氨基酸组成的一般形式,预测分枝杆菌蛋白质的亚细胞位置。 (英语) Zbl 1397.92186号

总结:结核分枝杆菌(MTB)是该属中的一种致病细菌分枝杆菌属和大多数肺结核病例的病原体[H.M.伯曼等,“蛋白质数据库”,核酸研究28,235-242(2000)]。本地化知识分枝杆菌蛋白质可能有助于破坏这种蛋白质的正常功能。自动预测分枝杆菌蛋白质亚细胞定位是基因组注释和药物发现的重要工具。在这项工作中,构建了一个包含638个非冗余分枝杆菌蛋白的基准数据集,以及一种预测方法分枝杆菌属亚细胞定位是通过结合氨基酸组成、二肽组成、还原的理化性质、进化信息、伪平均化学位移提出的。总体预测准确率为87.77%分枝杆菌利用多样性增量算法结合支持向量机对完整膜中的三种膜蛋白进行亚细胞定位和85.03%的定位。伪平均化学位移的性能很好。为了检验该方法的性能,还对Rashid构造的数据集进行了预测,准确率达到98.12%。这表明我们的方法优于文献中的其他现有方法。

MSC公司:

92C40型 生物化学、分子生物学
92立方37 细胞生物学
68T05型 人工智能中的学习和自适应系统
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德拉德,文学硕士。;O’Donoghue,S.I.公司。;Rost,B.,蛋白质表面对亚细胞位置的适应,J.mol.biol。,517-525, (1998)
[2] H.M.伯曼。;威斯布鲁克,J。;冯,Z。;Gilliland,G。;巴特,T.N。;韦西格,H。;Shindyalov,I.N。;Bourne,P.E.,蛋白质数据库,核酸研究,28,235-242,(2000)
[3] 毕,J。;Yang,H。;Yan,H。;宋,R。;Fan,J.,来自单纯疱疹病毒基因组的HLA-A 0201限制性CD8+T细胞表位肽的基于知识的虚拟筛选,J.theor biol。,281, 133-139, (2011) ·Zbl 1397.92181号
[4] 蔡,Y.D。;周,G.P。;Chou,K.C.,利用功能域组成预测膜蛋白类型的支持向量机,Biophys。J.,84,3257-3263,(2003)
[5] 蔡,Y.D。;Lin,S.L。;Chou,K.C.,预测蛋白质信号序列及其裂解位点的支持向量机,肽,24159-161,(2003)
[6] 蔡,Y.D。;刘晓杰。;X.B.Xu。;Chou,K.C.,用于β-回转类型分类和预测的支持向量机,J.pept。科学。,8, 297-301, (2002)
[7] 蔡,Y.D。;刘晓杰。;X.B.Xu。;Chou,K.C.,预测蛋白质中HIV蛋白酶裂解位点的支持向量机,J.comput。化学。,23, 267-274, (2002)
[8] 蔡,Y.D。;刘晓杰。;X.B.Xu。;Chou,K.C.,预测半乳糖转移酶特异性的支持向量机,肽,23205-208,(2002)
[9] 蔡,Y.D。;刘晓杰。;X.B.Xu。;Chou,K.C.,用支持向量机预测蛋白质结构类,计算。化学。,26, 293-296, (2002)
[10] 蔡,Y.D。;Feng,K.Y。;李,Y.X。;Chou,K.C.,预测α-转角类型的支持向量机,肽,24629-630,(2003)
[11] 蔡,Y.D。;里卡多,P.W。;Jen,C.H。;Chou,K.C.,SVM在预测膜蛋白类型中的应用,J.theor。生物学,226373-776,(2004)
[12] 蔡,Y.D。;周,G.P。;Jen,C.H。;Lin,S.L。;Chou,K.C.,《利用支持向量机识别丝氨酸水解酶的催化三联体》,J.theor。生物学,228551-557,(2004)·Zbl 1439.92141号
[13] 塞吉尔斯基,J.P。;Chin,D.P。;Espinal,文学硕士。;弗里登,T.R。;罗德里克·克鲁斯(Rodriquez Cruz),R。;塔尔博特,E.A。;威尔,D.E。;扎尔斯基斯,R。;Raviglione,M.C.,《全球结核病形势》。20世纪的进展和问题,21世纪的展望,传染病。临床。北上午,16,1-58,(2002)
[14] Chang,C.C。;Lin,C.J.,LIBSVM:支持向量机库,ACM trans。英特尔。系统。技术。,2, (2011), 27:1–27:27
[15] 陈,C。;Chen,L。;邹,X。;蔡,P.,利用周氏伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein pept。利特。,16, 27-31, (2009)
[16] Chen,Y.L。;Li,Q.Z.,利用改进的杂交方法和伪氨基酸组成预测凋亡蛋白的亚细胞位置,J.theor。生物学,248377-381,(2007)·Zbl 1451.92113号
[17] 乔提亚,C。;Lesk,A.M.,《蛋白质序列和结构差异之间的关系》,Embo j.,5823-826,(1986)
[18] 周克川,利用配对氨基酸组成预测蛋白质二级结构含量,蛋白质化学杂志。,18, 473-480, (1999)
[19] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,蛋白质,43,246-255,(2001)
[20] 周克川,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.theor。生物,273236-247,(2011)·Zbl 1405.92212号
[21] 周,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。微生物。,30, 275-349, (1995)
[22] 周,K.C。;Elrod,D.W.,蛋白质亚细胞位置预测,蛋白质工程,12,107-118,(1999)
[23] 周,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.biol。化学。,277, 45765-45769, (2002)
[24] 周,K.C。;Shen,H.B.,蛋白质亚细胞定位预测的最新进展,分析。生物化学。,370, 1-16, (2007)
[25] 周,K.C。;Shen,H.B.,Memtype-2L:通过pse-PSSM和Biochem结合进化信息预测膜蛋白及其类型的网络服务器。生物物理。公共资源。,360, 339-345, (2007)
[26] 周,K.C。;Shen,H.B.,Cell-ploc:一个用于预测各种生物体中蛋白质亚细胞定位的网络服务器包,Nat.protoc。,3, 153-162, (2008)
[27] Chou,K.C.和Shen,H.B.,2009年。综述:开发用于预测蛋白质属性的网络服务器的最新进展。自然科学2,63-92(可在http://www.scirp.org/journal/NS/; Chou,K.C.和Shen,H.B.,2009年。综述:开发用于预测蛋白质属性的网络服务器的最新进展。自然科学2,63-92(公开访问:http://www.scirp.org/journal/NS/
[28] 周,K.C。;Shen,H.B.,预测单位点和多位点真核蛋白亚细胞定位的新方法:euk-mploc 2.0,Plos one,5,e9931,(2010)
[29] 周,K.C。;Shen,H.B.,Cell-ploc2.:一个改进的网络服务器包,用于预测各种生物体中蛋白质的亚细胞定位,《自然科学》。,2, 1090-1103, (2010)
[30] 周,K.C。;吴振聪。;Xiao,X.,Iloc-euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,Plos one,6,e18258,(2011)
[31] Chou,K.C.,Wu,Z.C.和Xiao,X.,2011年b。iLoc-Hum:使用累加-标签尺度预测人类蛋白质的亚细胞位置,包括单位点和多位点。分子生物晶体。10.1039/C1MB05420a。;Chou,K.C.,Wu,Z.C.和Xiao,X.,2011年b。iLoc-Hum:使用累加-标签尺度预测人类蛋白质的亚细胞位置,包括单位点和多位点。分子生物晶体。10.1039/C1MB05420a。
[32] R.E.迪克森。;蒂姆科维奇,R。;Almassy,R.J.,《细胞色素折叠和细菌能量代谢的进化》,J.mol.biol。,100, 473-491, (1976)
[33] 丁·H。;罗,L。;Lin,H.,使用Chou的两亲性伪氨基酸组成预测细胞壁裂解酶,蛋白质肽。利特。,16351-355(2009年)
[34] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,利用Chou伪氨基酸组成的概念预测人乳头瘤病毒的风险类型,J.理论。生物学,263203-209,(2010)·Zbl 1406.92455号
[35] Fan,G.L.和Li,Q.Z.,2011年。通过将不同描述符组合成Chou伪氨基酸组成的一般形式来预测蛋白质亚线粒体的位置。氨基酸。10.1007/s00726-011-1143-4。;Fan,G.L.和Li,Q.Z.,2011年。通过将不同描述符组合成Chou伪氨基酸组成的一般形式来预测蛋白质亚线粒体的位置。氨基酸。10.1007/s00726-011-1143-4。
[36] Feng,Z.P.,预测蛋白质亚细胞位置概述,《硅生物中》。,2291-303,(2002年)
[37] 弗里登,T.R。;斯特林,T.R。;Munsiff,S.S.公司。;瓦特,C.J。;Dye,C.,《肺结核》,《柳叶刀》,362887-899,(2003)
[38] 高,Q.B。;Wang,Z.Z。;严,C。;Du,Y.H.,使用序列组合特征预测蛋白质亚细胞位置,FEBS ett。,579, 3444-3448, (2005)
[39] 乔治奥,D.N。;卡拉卡西迪斯,T.E。;尼托,J.J。;Torres,A.,《使用模糊聚类技术和矩阵对氨基酸进行分类及其对周氏伪氨基酸组成的影响》,J.theor。生物学,257,17-26,(2009)·Zbl 1400.92393号
[40] 顾奇。;丁,Y.S。;Zhang,T.L.,使用具有近似熵和疏水性模式的Chou伪氨基酸组成预测低同源性的G蛋白偶联受体类别,protein pept。利特。,17, 559-567, (2010)
[41] 海亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.theor。生物学,271,10-17,(2011)·Zbl 1405.92217号
[42] Idicula-Tomas,S。;A.J.库尔卡尼。;库尔卡尼,B.D。;贾亚拉曼,V.K。;Balaji,P.V.,一种基于支持向量机的方法,用于预测蛋白质在大肠杆菌中过度表达时可溶或形成包涵体的倾向,生物信息学,22,278-284,(2006)
[43] 蒋,X。;魏,R。;张,T.L。;Gu,Q.,使用Chou的伪氨基酸组成概念预测凋亡蛋白的亚细胞位置:近似熵方法,蛋白质pept。利特。,15, 392-396, (2008)
[44] Jones,D.T.,基于位置特异性评分矩阵的蛋白质二级结构预测,J.mol.biol。,292, 195-202, (1999)
[45] Kandaswamy,K.K。;周,K.C。;马丁内茨,T。;莫勒,S。;Suganthan,P.N。;Sridharan,S。;Pugalenthi,G.,AFP-pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.theor。生物学,270,56-62,(2011)
[46] 考尔,H。;Raghava,G.P.,使用PSI-BLAST图谱和二级结构信息预测蛋白质中的α-转变,蛋白质,55,83-90,(2004)
[47] 李,F.M。;Li,Q.Z.,使用伪氨基酸组成通过改进的杂交方法预测蛋白质亚核位置,氨基酸,34,119-125,(2008)
[48] 李,F.M。;Li,Q.Z.,使用周的伪氨基酸组成和改进的杂交方法预测蛋白质亚细胞位置,protein pept。利特。,15, 612-616, (2008)
[49] 李庆珍。;吕志清,蛋白质结构类的预测:多样性测度的应用,理论J。生物学,213493-502,(2001)
[50] 李伟(Li,W.)。;雅罗斯基,L。;Godzik,A.,高度同源序列的聚类以减少大型蛋白质数据库的大小,生物信息学,17228-283,(2001)
[51] Lin,H.,利用Chou的伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.theor。生物学,252350-356,(2008)·Zbl 1398.92076号
[52] Lin,H。;Ding,H.,通过伪氨基酸组成的二肽模式预测离子通道及其类型,J.theor。生物学,269,64-69,(2011)·Zbl 1307.92080号
[53] Lin,H。;丁·H。;Guo,联邦调查局。;Huang,J.,使用特征选择技术预测分枝杆菌蛋白质的亚细胞位置,分子多样性,14667-671,(2010)
[54] Lin,H。;丁·H。;Guo,联邦调查局。;张,A.Y。;Huang,J.,利用Chou的伪氨基酸组成预测分枝杆菌蛋白质的亚细胞定位,蛋白质肽。利特。,15, 739-744, (2008)
[55] 刘,T。;郑,X。;王,C。;Wang,J.,使用伪氨基酸组成预测凋亡蛋白的亚细胞位置:自协方差变换方法,蛋白质pept。利特。,171263-1269,(2010年)
[56] 卢金布尔,P。;Szyperski,T。;Wuthrich,K.,使用的统计基础^{13} C类蛋白质结构测定中的化学变化,J.magn。理性。B、 109229-233(1995)
[57] Matthews,B.W.,T4噬菌体溶菌酶预测和观察二级结构的比较,Biochim。生物物理。《学报》,405,442-451,(1975)
[58] Mielke,S.P.公司。;Krishnan,V.V.,使用平均化学位移直接从核磁共振谱中识别蛋白质结构类别,生物信息学,192054-2064,(2003)
[59] Mohabatkar,H.,利用周氏伪氨基酸组成预测细胞周期蛋白,蛋白质肽。利特。,17, 1207-1214, (2010)
[60] Mohabatkar,H。;穆罕默德·贝吉,M。;Esmaeili,A.,使用Chou的伪氨基酸组成和支持向量机概念预测GABA(A)受体蛋白,J.theor。生物学,281,18-23,(2011)·Zbl 1397.92215号
[61] Nakai,K.,蛋白质分类信号和亚细胞定位预测,高级蛋白质化学。,54, 277-344, (2000)
[62] Nakashima,H。;Nishikawa,K.,《利用氨基酸组成和残留对频率区分细胞内和细胞外蛋白质》,J.mol.biol。,238, 54-61, (1994)
[63] Pastore,A。;Lesk,A.M.,《珠蛋白和藻蓝蛋白结构的比较:进化关系的证据》,《蛋白质》,第8期,第133-155页,(1990年)
[64] Pollastri,G。;McLysaght,A.,Porter:蛋白质二级结构预测的新型准确服务器,生物信息学,211719-1720,(2005)
[65] Pollastri,G。;马丁,A.J。;穆尼,C。;Vullo,A.,通过序列和结构信息的一致组合准确预测蛋白质二级结构和溶剂可及性,BMC bioinf。,8, 201, (2007)
[66] 邱J.D。;黄J.H。;Shi,S.P。;Liang,R.P.,使用Chou的伪氨基酸组成概念预测酶家族类别:基于离散小波变换的支持向量机方法,Protein pept。利特。,17, 715-722, (2010)
[67] 拉希德,M。;萨哈,S。;Raghava,G.P.,使用进化信息和模体预测分枝杆菌蛋白质亚细胞定位的基于支持向量机的方法,BMC bioinf。,8,337,(2007年)
[68] Schaffer,A.A。;Aravind,L。;Madden,T.L。;沙维林,S。;斯普格,J.L。;Wolf,Y.I。;科宁,E.V。;Altschul,S.F.,《利用基于成分的统计数据和其他改进提高PSI-BLAST蛋白质数据库搜索的准确性》,核酸研究,29,2994-3005,(2001)
[69] Scharfe,C.公司。;扎卡里亚,P。;Hoertnagel,K。;Jaksch,M。;Klopstock,T。;Dembowski,M。;里尔·R。;Prokisch,H。;K.D.Gerbitz。;纽波特,W。;Mewes,H.W。;Meitinger,T.,MITOP,线粒体蛋白质组数据库:2000年更新,核酸研究,28,155-158,(2000)
[70] Sibley,A.B。;Cosman,M。;Krishnan,V.V.,《蛋白质二级结构含量与平均化学位移之间的经验相关性》,《生物物理杂志》,第84期,第1223-1227页,(2003年)
[71] 辛格,V。;Somvanshi,P.,针对同源模型NAD+依赖性DNA连接酶中潜在药物的虚拟筛选结核分枝杆菌、蛋白质肽。利特。,17, 269-276, (2010)
[72] 斯佩拉,S。;Bax,A.,蛋白质骨架构象与C类α和Cβ13C核磁共振化学位移,化学杂志。《社会学杂志》,113,5490-5492,(1995)
[73] Vapnik,V.,《统计学习理论》,(1998年),Wiley-interscience,纽约·Zbl 0935.62007号
[74] 威斯哈特,D.S。;赛克斯,B.D。;Richards,F.M.,核磁共振化学位移与蛋白质二级结构之间的关系,J.mol.biol。,222, 311-333, (1991)
[75] Wu,C.H。;阿普韦勒,R。;Bairoch,A。;纳塔莱,D.A。;巴克,W.C。;Boeckmann,B。;费罗,S。;Gasteiger,E。;黄,H。;洛佩兹,R。;Magrane,M。;Martin,医学博士。;Mazumder,R。;奥多诺万,C。;Redaschi,N。;Suzek,B.,《通用蛋白质资源(uniprot):蛋白质信息的扩展宇宙》,核酸研究,34,D187-D191,(2006)
[76] 吴振聪。;Xiao,X。;Chou,K.C.,《Iloc-plant:预测植物蛋白质单位点和多位点亚细胞定位的多标记分类器》,《分子生物学》。,7, 3287-3297, (2011)
[77] 吴,Z.C。;Xiao,X。;Chou,K.C.,Iloc-gpos:预测单复合体和复合革兰氏阳性细菌蛋白质亚细胞定位的多层分类器,Protein pept。利特。,19, 4-14, (2012)
[78] Xiao,X。;吴振聪。;Chou,K.C.,一种预测革兰氏阴性细菌蛋白质亚细胞定位的单位点和多位点多标签分类器,Plos one,6,e20592,(2011)
[79] Xiao,X。;吴振聪。;Chou,K.C.,Iloc-virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.theor。生物学,284,42-51,(2011)·Zbl 1397.92238号
[80] Yu,L。;郭毅。;李毅。;李·G。;李,M。;罗,J。;熊,W。;Qin,W.,Secretp:通过将新特征融合到Chou的伪氨基酸成分中来识别细菌分泌的蛋白质,J.theor。生物学,267,1-6,(2010)·Zbl 1410.92040号
[81] Zakeri,P。;Moshiri,B。;Sadeghi,M.,基于序列各种特征的数据融合预测蛋白质亚线粒体位置,J.theor。生物学,269208-216,(2011)·Zbl 1307.92094号
[82] 曾Y.H。;郭义忠。;Xiao,R.Q。;Yang,L。;Yu,L.Z。;Li,M.L.,基于自协方差方法,使用增广的周伪氨基酸组成预测蛋白质亚线粒体位置,J.theor。生物学,259366-372,(2009)·兹比尔1402.92193
[83] 张国勇。;Fang,B.S.,基于氨基酸组成分布和Chou的两亲性伪氨基酸组成预测氧化还原酶的辅因子,J.theor。生物学,253,310-315,(2008)
[84] 张国勇。;H.C.李。;高J.Q。;Fang,B.S.,通过改进的Chou伪氨基酸组成预测脂肪酶类型,蛋白质肽。利特。,15, 1132-1137, (2008)
[85] Zhao,Y。;Alipanahi,B。;李,S.C。;Li,M.,利用核磁共振化学位移数据预测蛋白质二级结构,J.bioinf。计算。生物学,8867-884,(2010)
[86] 周,G.P。;Assa-Mount,N.,《蛋白质结构类预测的一些见解》,《蛋白质》,44,57-59,(2001)
[87] 周,G.P。;K.博士,凋亡蛋白的亚细胞定位预测,蛋白质,50,44-48,(2003)
[88] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.theor。生物学,248546-551,(2007)·Zbl 1451.92245号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。