×

使用伪氨基酸成分预测高尔基-寄居蛋白类型:具有位置特异性物理化学性质的方法。 (英语) Zbl 1343.92154号

摘要:了解高尔基体驻留蛋白的类型是了解其分子功能及其在生物过程中的作用的重要一步。在这篇论文中,我们开发了一种新的计算方法,利用位置特异的物理化学性质和基于方差分析的特征选择方法预测Golgi-resident蛋白质类型。我们的方法在只包含59个特征的省略交叉验证中实现了86.9%的预测准确率。我们的方法有潜力应用于预测广泛的蛋白质属性。

MSC公司:

92C40型 生物化学、分子生物学
92年10月 分子结构(图形理论方法、微分拓扑方法等)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿里,F。;Hayat,M.,使用投票特征区间结合Chou的伪氨基酸组成对膜蛋白类型进行分类,J.Theor。生物学,384,78-83(2015)·Zbl 1343.92006年
[2] 阿尔特舒尔,S.F。;Madden,T.L。;Schäffer,A.A。;张杰。;张,Z。;Miller,W。;Lipman,D.J.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[3] 曹,D.-S。;徐Q-S。;Liang,Y.-Z.,propy:生成周氏PseAAC各种模式的工具,生物信息学,29960-962(2013)
[4] Chang,C。;Chang,C。;Lin,C.,LIBSVM:支持向量机库,ACM Trans。智力。系统。Technol公司。(2011)
[5] Chen,W。;冯·P。;丁,H。;Lin,H。;Chou,K.-C.,iRNA-甲基:使用伪核苷酸组成识别N(6)-甲基腺苷位点,分析。生物化学。,490, 26-33 (2015)
[6] Chen,W。;冯,P.-M。;Deng,E.-Z。;Lin,H。;Chou,K.-C.,iTIS-PseTNC:一种基于序列的预测因子,用于使用伪三核苷酸组成识别人类基因中的翻译起始位点,Ana。生物化学。,462, 76-83 (2014)
[7] Chen,W。;冯,P.-M。;Lin,H。;Chou,K.-C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[8] Chen,W。;Lei,T.-Y。;金,D.-C。;Lin,H。;Chou,K.-C.,PseKNC:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60 (2014)
[9] Chen,W。;Lin,H。;Chou,K.-C.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[10] Chen,W。;张,X。;布鲁克,J。;Lin,H。;张,L。;Chou,K.-C.,PseKNC-General:生成各种模式伪核苷酸组成的跨平台软件包,生物信息学,31,119-120(2015)
[11] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[12] Chou,K.-C.,《关于预测分子生物系统中多标签属性的一些评论》,《分子生物学》。,9, 1092-1100 (2013)
[13] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[14] Chou,K.-C.,《伪氨基酸组成及其在生物信息学中的应用》,蛋白质组学。系统。生物电流。蛋白质组。,6, 262-274 (2009)
[15] Chou,K.-C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[16] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[17] Chou,K.C.,使用亚基偶联预测信号肽,蛋白质工程,14,75-79(2001)
[18] 周,K.-C。;Cai,Y.-D.,通过伪氨基酸组成预测蛋白质四元结构,蛋白质,53228-289(2003)
[19] 周,K.-C。;Shen,H.-B.,Cell-PLoc:一个用于预测各种生物体中蛋白质亚细胞定位的Web服务器包,《自然协议》。,3, 153-162 (2008)
[20] 周,K.-C。;吴振中。;Xiao,X.,iLoc-Hum:利用累积-标签尺度预测人类蛋白质在单位点和多位点的亚细胞位置,Mol.Biosyst。,8, 629-641 (2012)
[21] 周,K.-C。;吴振中。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白Plos亚细胞定位的多标记分类器。ONE,6,e18258(2011)
[22] Chou,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。分子生物学。,30, 275-349 (1995)
[23] Dehzangi,A。;Heffernan,R。;Sharma,A。;Lyons,J。;帕利瓦尔,K。;Sattar,A.,通过将基于进化的描述符纳入Chou的一般PseAAC,J.Theor,对革兰氏阳性和革兰氏阴性蛋白进行亚细胞定位。《生物学》,364,284-294(2015)·Zbl 1405.92092号
[24] 丁,H。;邓永中。;袁,L.-F。;刘,L。;Lin,H。;Chen,W。;Chou,K.-C.,iCTX-type:一种基于序列的预测因子,用于识别靶向离子通道中芋螺毒素的类型,Biomed。Res.Int.,2014,286419(2014)
[25] 丁,H。;郭,S.-H。;邓永中。;袁,L.-F。;郭,F.-B。;黄,J。;Rao,N。;Chen,W。;Lin,H.,利用特征选择技术预测高尔基体驻留蛋白类型,化学。智力。实验室系统。,124, 9-13 (2013)
[26] 丁,H。;刘,L。;郭,F.-B。;黄,J。;Lin,H.,用改进的马氏判别算法和伪氨基酸组成识别高尔基体蛋白类型,protein Pept。莱特。,18, 58-63 (2011)
[27] 杜,P。;曹,S。;Li,Y.,SubChlo:利用伪氨基酸成分和循证K-最近邻(ET-KNN)算法预测蛋白质亚叶绿体位置,J.Theor。生物学,261330-335(2009)·Zbl 1403.92063号
[28] 杜,P。;顾S。;Jiao,Y.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014)
[29] 杜,P。;李·T。;Wang,X.,预测蛋白质亚亚细胞位置的最新进展,蛋白质专家评论。,8, 391-404 (2011)
[30] 杜,P。;Li,Y.,通过将伪氨基酸组成与分段序列的各种物理化学特征杂交来预测蛋白质亚线粒体位置,BMC Bioinf。,7, 518 (2006)
[31] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC-Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[32] 杜,P。;Xu,C.,预测多位点蛋白质亚细胞位置:进展和挑战,蛋白质专家评论。,10, 227-237 (2013)
[33] 杜,P。;Yu,Y.,SubMito-PSPCP:通过位置特异性物理化学特性与伪氨基酸成分杂交预测蛋白质亚线粒体位置,生物医学。Res.Int.,2013,263829(2013)
[34] 杜,P。;Yu,Y.,SubMito-PSPCP:通过将位置特异性物理化学特性与伪氨基酸成分杂交来预测蛋白质线粒体下位置,生物医学。Res.Int.,2013(2013)
[35] 郭,S.-H。;邓永中。;Xu,L.-Q。;丁,H。;Lin,H。;Chen,W。;Chou,K.-C.,iNuc-PseKNC:一种基于序列的预测因子,用于预测具有伪K元组核苷酸组成的基因组中的核小体定位,生物信息学,30,1522-1529(2014)
[36] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物学》,377,47-56(2015)
[37] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,《通过将物理化学特性和平稳小波变换纳入伪氨基酸组成来识别蛋白质结合位点》,J.Biomol。结构。动态。,1-16 (2015)
[38] 川岛,S。;Pokarowski,P。;波卡罗夫斯卡,M。;科林斯基,A。;Katayama,T。;Kanehisa,M.,AAindex:氨基酸指数数据库,2008年进度报告,核酸研究,36,D202-D205(2008)
[39] 库马尔,R。;Srivastava,A。;库马里,B。;Kumar,M.,用Chou伪氨基酸组成和支持向量机预测β-内酰胺酶及其分类,J.Theor。生物,365,96-103(2015)·Zbl 1314.92055号
[40] Lin,H。;Chen,W。;袁,L.-F。;李,Z.-Q。;Ding,H.,使用过度代表的四肽预测蛋白质亚线粒体的位置,生物学报。,61, 259-268 (2013)
[41] Lin,H。;邓永中。;丁,H。;Chen,W。;Chou,K.-C.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪K元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[42] 林,W.-Z。;方,J.-A。;Xiao,X。;Chou,K.-C.,iLoc-Animal:预测动物蛋白质亚细胞定位的多标记学习分类器,分子生物学。,9, 634-644 (2013)
[43] 刘,B。;方,L。;刘,F。;王,X。;陈,J。;Chou,K.-C.,用伪结构-状态-组成方法鉴定真实的微小RNA前体,Plos。ONE,10,e0121501(2015)
[44] 刘,B。;方,L。;刘,F。;王,X。;Chou,K.-C.,iMiRNA-PseDPC:用伪距离-对合成方法鉴定microRNA前体,J.Biomol。结构。动态。,1-13 (2015)
[45] 刘,B。;方,L。;王,S。;王,X。;李,H。;Chou,K.C.,用简并K-tuple或Kmer策略鉴定微RNA前体,J.Theor。生物学,385153-159(2015)
[46] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.-C.,repDNA:一个Python软件包,通过结合用户定义的物理化学特性和序列顺序效应,为DNA序列生成各种模式的特征向量,生物信息学,311307-1309(2015)
[47] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.C.,repRNA:一个生成RNA序列各种特征向量的网络服务器,分子遗传学。基因组。(2015)
[48] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[49] 刘,B。;徐,J。;风扇,S。;Xu,R。;周,J。;Wang,X.,PseDNA-Pro:通过结合Chou的PseAAC和物理化学距离变换鉴定DNA结合蛋白,分子信息,34,8-17(2015)
[50] 刘,B。;徐,J。;兰,X。;Xu,R。;周,J。;王,X。;Chou,K.-C.,iDNA-Prot|dis:通过将氨基酸距离对和减少的字母谱结合到一般的伪氨基酸组成Plos中来鉴定DNA结合蛋白。ONE,9,e106691(2014)
[51] 刘,Z。;Xiao,X。;邱伟荣。;Chou,K.-C.,iDNA-Methyl:通过伪三核苷酸组成识别DNA甲基化位点,Ana。生物化学。,474, 69-77 (2015)
[52] Pacharawongsakda,E。;Theeramunkong,T.,通过半监督学习和Chou的PseAAC、IEEE Trans的降维通用模式预测单复合体和多重蛋白质的亚细胞位置。纳米生物学。,12, 311-320 (2013)
[53] 沈海波。;Chou,K.-C.,PseAAC:一个灵活的网络服务器,用于生成各种蛋白质伪氨基酸组成,Ana。生物化学。,373, 386-388 (2008)
[54] 沈,H.-B。;Chou,K.-C.,Nuc-PLoc:一种新的网络服务器,用于通过融合PseAA组成和PsePSSM预测蛋白质亚核定位,蛋白质工程设计。选择。,20, 561-567 (2007)
[55] 沈海波。;Chou,K.-C.,《病毒-PLoc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器》,生物聚合物,85,233-240(2007)
[56] 沈海波。;Yang,J.等人。;Chou,K.-C.,Euk-PLoc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67(2007)
[57] 沈海波。;Yi,D.-L。;姚,L.-X。;Yang,J.等人。;Chou,K.C.,基于知识的计算智能开发,用于从序列预测蛋白质二级结构,专家。修订版Proteom。,5, 653-662 (2008)
[58] 施,S.-P。;邱J.-D。;太阳,X.-Y。;黄,J.-H。;黄,S.-Y。;索,S.-B。;梁,R.-P。;Zhang,L.,用伪氨基酸成分识别亚线粒体和亚叶绿体位置:基于离散小波变换特征提取策略的方法,Biochim。生物物理学。《学报》,1813,424-430(2011)
[59] van Dijk,A.D.J。;博世,D。;ter Braak,C.J.F。;van der Krol,A.R。;van Ham,R.C.H.J.,预测II型膜蛋白的亚高尔基体定位,生物信息学,241779-1786(2008)
[60] Vapnik,V.,《统计学习理论的本质》(1995),施普林格出版社:纽约施普林格·Zbl 0833.62008号
[61] 王,X。;张伟。;张,Q。;Li,G.-Z.,MultiP-SChlo:利用Chou的伪氨基酸成分和新的多标签分类器进行多标签蛋白质亚叶绿体定位预测,生物信息学,31,2639-2645(2015)
[62] 吴振中。;Xiao,X。;Chou,K.-C.,iLoc-Gpos:预测单复合体和复合革兰氏阳性细菌蛋白的亚细胞定位的多层分类器,Protein Pept。莱特。,19, 4-14 (2012)
[63] 吴振中。;Xiao,X。;Chou,K.-C.,iLoc-Plant:一种多标记分类器,用于预测具有单位点和多位点的植物蛋白质的亚细胞定位,Mol.Biosyst。,7, 3287-3297 (2011)
[64] Xiao,X。;王,P。;林,W.-Z。;贾俊华。;Chou,K.-C.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177 (2013)
[65] Xiao,X。;吴振中。;Chou,K.-C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。生物学,284,42-51(2011)·Zbl 1397.92238号
[66] Xu,Y。;邵晓杰。;Wu,L.-Y。;邓,N.-Y。;Chou,K.-C.,iSNO-AAPair:将氨基酸成对偶联到PseAAC中以预测蛋白质中半胱氨酸S-亚硝基化位点,PeerJ.,1,e171(2013)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。