×

通过将伪位置特异性评分矩阵合并到一般Chou的伪氨基酸组成中来预测蛋白质的亚线粒体位置。 (英语) Zbl 1397.92228号

线粒体是大多数真核生物的重要细胞器,在参与细胞的各种生命活动中发挥着重要作用。然而,线粒体的某些功能只能在特定的亚线粒体位置实现,对亚线粒体位置的研究将有助于进一步了解蛋白质的生物学功能,这是蛋白质组学研究的热点。本文提出了一种新的蛋白质亚线粒体位置预测方法。首先,结合Chou的伪氨基酸组成(PseAAC)和伪位置特异性评分矩阵(PsePSSM)提取蛋白质序列的特征。然后对提取的特征信息进行二维小波去噪。最后,将最优特征向量输入到SVM分类器中,以预测蛋白质的亚线粒体位置。通过折刀试验得到了较为理想的预测结果,并与其他预测方法进行了比较。结果表明,该方法明显优于现有的研究结果,可以为预测蛋白质在其他细胞器中的位置提供一种新的方法。源代码和所有数据集位于https://github.com/QUST-BSBRC/PseAAC-PsePSSM-WD/用于学术用途。

MSC公司:

92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahmad,K。;沃里斯,M。;Hayat,M.,通过将二肽成分纳入Chou的一般伪氨基酸成分预测蛋白质亚线粒体位置,J.Membr。生物学,249,1-12,(2016)
[2] Altschul,S.F。;Madden,T.L。;Schäffer,A.A。;张杰。;Miller,W。;Lipman,D.J.,Gappe BLAST和PSI-BLAST:一个新的通用数据库搜索程序,核酸研究,25,3389-3402,(1997)
[3] 阿什布默,M。;凯瑟琳·A·B。;朱迪思,A.B。;大卫·B。;希瑟,B。;J.C.迈克尔。;艾伦·P·D。;卡拉,D。;Selina,S.D。;Janan,T.E。;Midori,A.H。;David,P.H。;I.T.劳里。;安德鲁·K。;苏珊娜,L。;约翰·C·M。;Joel,E.R。;马丁·R。;Gerald,M.R。;加文,S.,《基因本体论:生物学统一的工具》,《自然遗传学》。,25, 25-29, (2000)
[4] 巴辛,M。;Raghava,G.P.,Eslpred:基于SVM的真核蛋白质亚细胞定位方法,使用二肽组成和PSI-BLAST,核酸研究,32,414-419,(2004)
[5] Burbula,L.F。;宋,P。;Mazzulli,J.R.E。;赞佩斯,E。;Wong,Y.C。;Jeon,S。;桑托斯,D.P。;布兰兹,J。;奥伯迈尔,C.D。;斯特罗尼,C。;萨瓦斯,J.N。;Kiskinis,E。;庄,X。;Krüger,R。;苏美尔,D.J。;Krainc,D.,《多巴胺氧化介导帕金森病线粒体和溶酶体功能障碍》,《科学》,357,1255-1261,(2017)
[6] Cai,Y.D。;Chou,K.C.,使用神经网络预测原核和真核蛋白质的亚细胞位置,生物化学。生物物理学。Res.Commun.公司。,4, 172-173, (2000)
[7] Cai,Y.D。;Chou,K.C.,通过功能域组成和伪氨基酸组成预测酶亚类,蛋白质组研究杂志,4,967-971,(2005)
[8] Caragea,C。;Caragea,D。;Silvescu,A。;Honavar,V.,使用抽象增强马尔可夫模型对蛋白质亚细胞定位的半监督预测,BMC生物信息。,11, 1-13, (2010)
[9] Cedano,J。;阿洛伊,P。;佩雷斯·庞斯,J.A。;Querol,E.,氨基酸组成与蛋白质细胞位置的关系,《分子生物学杂志》。,266, 594-600, (1997)
[10] Chang,S.G。;Yu,B。;Vetterli,M.,用于图像去噪和压缩的自适应小波阈值,IEEE Trans。图像处理。,9, 1532-1546, (2000) ·Zbl 0962.94028号
[11] Chang,S.G。;Yu,B。;Vetterli,M.,带上下文建模的空间自适应小波阈值图像去噪,IEEE Trans。图像处理。,9, 1522-1531, (2000) ·Zbl 0962.94027号
[12] Chang,C.C。;Lin,C.J.,LIBSVM:支持机器库,ACM Trans。智力。系统。技术。,2, 1-27, (2011)
[13] Chen,W。;冯,P.M。;Lin,H.,Irspot-psednc:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68,(2013)
[14] Chen,W。;冯·P。;丁·H。;Lin,H.,Irna-methyl:使用伪核苷酸组成识别N6-甲基腺苷位点,Anal。生物化学。,490, 26-33, (2015)
[15] Chen,W。;冯·P。;丁,H.,使用变形能量分析基因组中的核小体定位,基因组学,107,69-75,(2016)
[16] Chen,W。;Tang,H。;Ye,J。;Lin,H.,Irna-pseu:识别RNA假尿苷位点,分子治疗学。核酸,5,e332,(2016)
[17] Chen,W。;冯·P。;Yang,H。;Ding,H.,Irna-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,84208-4217,(2017)
[18] Cheng,X。;Xiao,X.,Ploc-mplant:通过将最佳GO信息合并到通用pseaac中,预测多位置植物蛋白的亚细胞定位,Mol.Biosyst。,13, 1722-1727, (2017)
[19] Cheng,X。;Xiao,X.,Ploc-mvirus:通过将最佳GO信息合并到通用pseaac中来预测多位置病毒蛋白的亚细胞定位,Gene,628,315-321,(2017)
[20] Cheng,X。;Xiao,X.,Ploc mgneg:通过通用pseaac的深度基因本体学习预测革兰氏阴性细菌蛋白的亚细胞定位,基因组学。,(2017)
[21] Cheng,X。;Xiao,X.,Ploc-mhum:通过通用pseaac预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,11,1-9,(2017)
[22] Cheng,X。;Xiao,X.,Ploc-meuk:通过将关键GO信息提取到通用pseaac中来预测多标签真核蛋白的亚细胞定位,基因组学,110,50-58,(2018)
[23] Cheng,X。;Zhao,S.G.,Iatc misf:一种用于预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346,(2017)
[24] Cheng,X。;Zhao,S.G.,Iatc-myb:一种用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget,8,58494-58503,(2017)
[25] Cheng,X。;Zhao,S.G。;Lin,W.Z.,《Ploc-manimal:预测动物蛋白质在单位点和多位点的亚细胞定位》,生物信息学,33,3524-3531,(2017)
[26] Chou,K.C.,利用亚基偶联预测信号肽,蛋白质工程,14,75-79,(2001)
[27] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。生物信息。,43, 246-255, (2001)
[28] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19,(2005)
[29] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247,(2011)·Zbl 1405.92212号
[30] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,9, 1092-1100, (2013)
[31] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234, (2015)
[32] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 2337-2358, (2017)
[33] Chou,K.C。;Cai,Y.D.,一种通过结合基因本体论预测蛋白质亚细胞定位的新混合方法,Biochem。生物物理学。Res.Commun.公司。,311, 743-747, (2003)
[34] Chou,K.C。;Elrod,D.W.,使用判别函数预测原核蛋白质的亚细胞位置,生物化学。传记。Res.Commun.公司。,252, 63-68, (1998)
[35] Chou,K.C。;Shen,H.B.,通过融合优化的证据理论K最近邻分类器预测真核蛋白亚细胞位置,《蛋白质组研究杂志》,51888-1897,(2006)
[36] Chou,K.C。;Shen,H.B.,Memtype-2L:通过pse-PSSM和Biochem结合进化信息预测膜蛋白及其类型的网络服务器。生物物理学。Res.Commun.公司。,360, 339-345, (2007)
[37] Chou,K.C。;沈海斌,蛋白质亚细胞定位预测的最新进展,分析。生物化学。,370, 1-16, (2007)
[38] Chou,K.C。;Shen,H.B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63-92, (2009)
[39] Chou,K.C。;贾,J。;刘,Z。;Xiao,X。;Liu,B.,通过将物理化学特性和平稳小波变换结合到伪氨基酸组成中来识别蛋白质结合位点,J.Biomol。结构。动态。,34, 1946-1961, (2016)
[40] 邓,M。;涂,Z。;Sun,F。;Chen,T.,基于蛋白质相互作用数据将基因本体映射到蛋白质,生物信息学,20895-902,(2004)
[41] 丁·C·H。;Dubchak,I.,使用支持向量机和神经网络的多类蛋白质折叠识别,生物信息学,17,349-358,(2001)
[42] 丁·H。;Guo,S.H。;邓,E.Z。;袁,L.F。;郭富斌。;黄,J。;Rao,N.N。;Chen,W。;Lin,H.,利用特征选择技术预测高尔基滞留蛋白类型,化学。智力。实验室系统。,124, 9-13, (2013)
[43] 杜,P.F。;Jiao,Y.S.,通过将特定位置的物理化学特性纳入Chou的一般伪氨基酸成分中来预测蛋白质的亚线粒体位置,J.Theor。生物,41681-87,(2017)
[44] 杜,P.F。;Li,Y.D.,通过将假氨基酸组成与分段序列的各种物理化学特征杂交预测蛋白质亚线粒体位置,BMC Bioinf。,7, 1-8, (2006)
[45] 杜,P。;田,Y。;Yan,Y.,用投影的基因本体论评分预测人类内部和细胞器膜蛋白的亚细胞定位,J.Theor。生物学,313,61-67,(2012)
[46] 杜,P.F。;Yu,Y.,Submito-PSPCP:通过将位置特异性物理化学特性与伪氨基酸成分杂交来预测蛋白质的亚线粒体位置,Biomed。Res.Int.,3,(2013年)
[47] Ehsan,A。;Mahmood,K。;Y.D.Khan。;Khan,S.A.,《信号肽分类的数学生物学新模型》,《科学》。众议员,8,1039,(2018)
[48] Fan,G.L。;Li,Q.Z.,通过将不同描述符组合成Chou伪氨基酸组成的一般形式预测蛋白质亚线粒体位置,氨基酸,43,545-555,(2012)
[49] 冯·P。;丁·H。;Yang,H。;Chen,W.,Irna-psecoll:通过将核苷酸的集体效应纳入pseknc,Mol.Ther,来确定不同RNA修饰的发生位置。核酸,7155-163,(2017)
[50] 冯·P。;Yang,H。;丁·H。;Lin,H.,Idna6ma-pseknc:通过将核苷酸物理化学性质纳入pseknc来识别DNA N6-甲基腺苷位点,基因组学,(2018)
[51] 加拉尔,M。;费尔南德斯,A。;Barrenechea,E。;Bustince,H。;Herrera,F.,《多类问题中二进制分类器集成方法概述:一对一和一对所有方案的实验研究》,模式识别。,44, 1761-1776, (2011)
[52] Höglund,A。;Dönnes,P。;Blum,T。;阿道夫,H.W。;Kohlbacher,O.,Multiloc:使用N-末端靶向序列、序列基序和氨基酸组成预测蛋白质亚细胞定位,生物信息学,221158-1165,(2006)
[53] 黄,Y。;Li,Y.,使用模糊k-NN方法预测蛋白质亚细胞位置,生物信息学,20,21-28,(2004)
[54] 贾,J。;刘,Z。;Xiao,X.,Ippi-esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到pseaac,J.Theor中来识别蛋白质的相互作用。生物学,377,47-56,(2015)
[55] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,Isuc-pseopt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56, (2016)
[56] Jones,D.T.,《基于位置特异性评分矩阵的蛋白质预测》,《分子生物学杂志》。,292, 195-202, (1999)
[57] 卡比尔,M。;Yu,D.J.,通过非偏倚伪三核苷酸组成预测DNA酶I超敏位点,《化学》。智力。实验室系统。,167, 78-84, (2017)
[58] Kandaswamy,A。;库马尔,C.S。;Ramanathan,R.P。;贾亚拉曼,S。;Malmurugan,N.,使用小波系数对肺部声音进行神经分类,计算。生物医学,34,523-537,(2004)
[59] King,B.R。;Vural,S。;潘迪,S。;Barteau,A。;Guda,C.,Ngloc:预测原核生物和真核生物蛋白质亚细胞定位的软件和网络服务器,BMC Res.Notes,5,1-7,(2012)
[60] Lin,H。;Chen,W。;袁,L.F。;Li,Z.Q。;Hui,D.,使用过度代表的四肽预测蛋白质亚线粒体的位置,生物学报。,61, 259-268, (2013)
[61] Lin,H。;Li,Q.Z.,《使用伪氨基酸组成预测蛋白质结构类别:通过合并400个二肽组分的方法》,J.Compute。化学。,1463-1466年(2007年)
[62] Lin,H。;Wu,Y。;Tang,H。;Chen,W.,使用伪氨基酸成分预测人类酶家族类别,Curr。蛋白质组。,13, 99-104, (2016)
[63] Li,W.C。;邓,E.Z。;丁·H。;Chen,W。;Lin,H.,Iori-pseknc:利用伪k元组核苷酸组成、化学、智能识别复制起源的预测因子。实验室系统。,141, 100-106, (2015)
[64] Liå,P.,生物信息学和计算生物学中的小波:现状和展望,生物信息学,19,2-9,(2003)
[65] 刘,B。;方,L。;刘,F。;Wang,X.,用伪结构状态合成方法鉴定真的microrna前体,PLoS ONE,10,(2015)
[66] 刘,B。;方,L。;朗·R。;Lan,X.,Ienhancer-2L:通过伪k元组核苷酸组成识别增强子及其强度的双层预测因子,生物信息学,32,362-369,(2016)
[67] 刘,B。;刘,F。;Wang,X.L。;陈,J.J。;Fang,L.Y。;Chou,K.C.,《Pse-in-one:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,43,65-71,(2015)
[68] 刘,B。;Long,R.,Idhs-EL:通过将三种不同模式的伪核苷酸组成融合到集成学习框架中来识别dnase I超敏位点,生物信息学,32,2411-2418,(2016)
[69] 刘,B。;王,S。;朗·R。;Chou,K.C.,Irspot-EL:用集成学习方法识别重组点,生物信息学,33,35-41,(2017)
[70] 刘,B。;Wu,H。;Chou,K.C.,《Pse-in-one 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,9, 67-91, (2017)
[71] 刘,B。;Yang,F.,2L-pirna:一种用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸。,7, 267-277, (2017)
[72] 刘,B。;杨,F。;Huang,D.S.,Ipromoter-2L:通过基于多窗口的pseknc识别启动子及其类型的双层预测因子,生物信息学,34,33-40,(2018)
[73] Liu,L.M。;Xu,Y.,Ipgk-pseaac:通过将四个不同层次的氨基酸成对偶联信息合并到通用pseaac,Med.Chem。,13, 552-559, (2017)
[74] 路易斯·F。;布鲁,T。;Unser,M.,《图像去噪的新方法:尺度间正交小波阈值法》,IEEE Trans。图像处理,16,593-606,(2007)
[75] Mariana,R.V.L.H.,《动物线粒体图》(2011),https://commons.wikimedia.org/wiki/文件:Animal_mitochondrion_diagram_zh_ml.svg
[76] 梅,S。;Wang,F.,基于氨基酸分类的蛋白质亚核定位光谱核融合,BMC生物信息学。,11, 1-8, (2010)
[77] Nakashima,H。;Nishikawa,K.,使用氨基酸组成和残基对频率的细胞内和细胞外蛋白质的区分,J.Mol.Biol。,238, 54-61, (1994)
[78] Nanni,L。;Lumini,A.,《为亚线粒体位置创建周氏伪氨基酸特征的遗传编程》,《氨基酸》,34,653-660,(2008)
[79] 齐,H。;Casalena,G。;Shi,S。;Yu,L。;Ebefors,K。;孙,Y。;张伟。;达加提,V。;施隆道夫,D。;哈拉尔德森,B。;伯廷格,E。;Daehn,I.,肾小球内皮细胞线粒体功能障碍是糖尿病肾病易感性的本质和特征,《糖尿病》,66,763-778,(2017)
[80] 邱伟荣。;姜世勇(Jiang,S.Y.)。;Sun,B.Q.,Irna-2methyl:通过将序列耦合效应纳入通用pseknc和集成分类器,确定RNA 2′-O-甲基化位点,医学化学。,2013年7月13日至43日(2017年)
[81] 邱伟荣。;Sun,B.Q.,Iptm-mlys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123,(2016)
[82] 邱伟荣。;孙碧琴。;Xiao,X。;Xu,Z.C.,Ikcr-pseens:使用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酸化位点,基因组学,(2017)
[83] 塞迪亚姆。;阿齐兹普尔,S。;Patching,S.G.,《人类次级转运蛋白的氨基酸组成分析及其对可靠膜拓扑预测的影响》,J.Biomol。结构。Dyn公司。,35, 929-949, (2017)
[84] Shen,H.B。;Chou,K.C.,Nuc-ploc:一种新的网络服务器,用于通过融合假丝酵母成分和假丝酵母预测蛋白质亚核定位,protein Eng.Des。选择。,20, 561-567, (2007)
[85] Shen,H.B。;Chou,K.C.,Pseaac:一个灵活的网络服务器,用于生成各种蛋白质伪氨基酸组成,Ana。生物化学。,373, 386-388, (2008)
[86] Shen,H.B。;杨,J。;Chou,K.C.,Fuzzy KNN用于从伪氨基酸组成预测膜蛋白类型,J.Theor。生物学,240,9-13,(2006)
[87] 史,S.P。;邱建德。;孙,X.Y。;黄,J.H。;黄S.Y。;索,S.B。;Liang,R.P。;Zhang,L.,用伪氨基酸成分识别亚线粒体和亚叶绿体位置:基于离散小波变换特征提取策略的方法,BBA-Mol.Cell Res.,1813,424-430,(2011)
[88] 乌丁,M.R。;Sharma,A。;Farid,D.M。;拉赫曼,M.M。;Dehzangi,R。;Shatabda,S.,Evostruct-sub:使用进化和结构特征的准确革兰氏阳性蛋白亚细胞定位预测因子,J.Theor。生物学,443138-146,(2018)·Zbl 06898996号
[89] Vapnik,V.N.,《统计学习理论的本质》(1995),纽约斯普林格出版社·Zbl 0833.62008号
[90] 项庆林。;廖,B。;Li,X.H。;Xu,H.M。;陈,J。;石振新。;戴奇。;Yao,Y.H.,基于进化信息和支持向量机的凋亡蛋白亚细胞定位预测,Artif。智力。医学,78,41-46,(2017)
[91] Xiao,X。;Cheng,X。;苏,S。;Nao,Q.,Ploc-mgpos:将关键基因本体信息合并到通用pseaac中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,《自然科学》。,9, 331-349, (2017)
[92] Xu,Y。;丁,J。;Wu,L.Y.,Isno-pseaac:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,e55844,(2013)
[93] Xu,Y。;Li,C.,Ipreny-pseaac:通过将两层序列偶联纳入pseaac,Med.Chem。,13444-551(2017)
[94] Yu,B。;张勇,结肠癌基因表达谱分析与信息基因提取,计算机学报。西奥。纳米科学。,1097-11032013年10月
[95] Yu,B。;Zhang,Y.,《基于小波变换预测跨膜蛋白的简单方法》,国际生物学杂志。科学。,9, 22-33, (2013)
[96] Yu,B。;李,S。;陈,C。;Xu,J.M。;邱伟业。;吴,X。;Chen,R.X.,使用小波去噪和Chou伪氨基酸组成的支持向量机预测革兰氏阴性细菌蛋白的亚细胞定位,Chemom。智力。实验室系统。,167, 102-112, (2017)
[97] Yu,B。;李,S。;邱伟业。;陈,C。;Chen,R.X。;王,L。;Wang,M.H。;Zhang,Y.,基于小波去噪结合Chou's pseaac和psepssm准确预测凋亡蛋白的亚细胞位置,Oncotarget,8,107640-107665,(2017)
[98] Yu,B。;Lou,L.F。;李,L。;Zhang,Y。;邱伟业。;吴,X。;Wang,M.H。;Tian,B.G.,使用Chou的伪氨基酸组成和小波去噪预测低相似度序列的蛋白质结构类,J.Mol.Graph。型号。,76, 260-273, (2017)
[99] Zakeri,P。;Moshiri,B。;Sadeghi,M.,基于序列各种特征的数据融合预测蛋白质亚线粒体位置,J.Theor。生物学,269208-216,(2011)·Zbl 1307.92094号
[100] 曾Y.H。;郭义忠。;肖瑞秋。;Yang,L。;Yu,L.Z。;Li,M.L.,基于自协方差方法,使用增广的周伪氨基酸组成预测蛋白质亚线粒体位置,J.Theor。生物学,259366-372,(2009)
[101] 翟建新。;曹天杰。;An,J.Y。;卞永堂,通过将平均块和PSSM信息合并到一般pseaac,J.Theor中,对蛋白质自相互作用进行高精度预测。生物,43280-86,(2017)·Zbl 1393.92016年
[102] Zhang,S.L。;Duan,X.,用过采样方法预测蛋白质亚细胞定位和Chou’s general pseaac,J.Theor。生物学,437,239-250,(2018)·Zbl 1394.92047号
[103] 朱,P.P。;Li,W.C。;钟振杰。;邓,E.Z。;丁·H。;Chen,W。;Lin,H.,通过将最佳三肽掺入伪氨基酸组合物的一般形式来预测分枝杆菌蛋白的亚细胞定位,Mol.Bioyst。,11, 558-563, (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。