×

使用Chou伪氨基酸组成的一般形式预测Golgi-resident蛋白质类型:最小冗余最大相关特征选择方法。 (英语) Zbl 1343.92378号

摘要:最近,在预测Golgi-resident蛋白方面做出了一些努力。然而,鉴定Golgi-resident蛋白的类型仍然是一项具有挑战性的任务。准确预测Golgi-resident蛋白的类型对于理解其在各种生物过程中的分子功能至关重要。在本文中,我们提出了一种基于互信息的特征选择方案,该方案采用广义形式的Chou伪氨基酸组成来预测Golgi-resident蛋白质类型。在周氏伪氨基酸成分中应用了位置特异性物理化学性质。在包含49个选定特征的折刀测试中,我们实现了91.24%的预测准确率。在所有现有预测因子中,它的性能最好。这一结果表明,我们的计算模型可以用于识别Golgi-resident蛋白类型。

MSC公司:

92D20型 蛋白质序列,DNA序列
92C40型 生物化学、分子生物学
92-04 生物相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿里,F。;Hayat,M.,使用投票特征区间结合周的伪氨基酸组成对膜蛋白类型进行分类,J.Theor。生物学,384,78-83(2015)·Zbl 1343.92006年
[2] Altschul,S.F。;Madden,T.L。;Schäffer,A.A。;张杰。;张,Z。;Miller,W.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[3] 曹博士。;Xu,Q.-S。;Liang,Y.-Z.,Propy:一种生成Chou’s PseAAC各种模式的工具,生物信息学,29960-962(2013)
[4] Chang,C.-C。;Lin,C.-J.,LIBSVM:支持向量机库,ACM Trans。智力。系统。技术。,2, 27, 1-27 (2011)
[5] Chen,L。;曾伟民。;蔡,Y.-D。;Feng,K.-Y。;Chou,K.-C.,《通过整合化学-化学相互作用和相似性预测药物的解剖治疗化学(ATC)分类》,《公共科学图书馆·综合》,第7期,e35254页(2012年)
[6] Chen,W。;林,H。;Chou,K.-C.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol Biosyst。,11, 2620-2634 (2015)
[7] Chen,W。;冯,P.-M。;林,H。;Chou,K.-C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[8] Chen,W。;Lei,T.-Y。;金博士。;林,H。;Chou,K.-C.,PseKNC:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60 (2014)
[9] Chen,W。;丁·H。;冯·P。;林,H。;Chou,K.-C.,iACP:一种基于序列的抗癌肽识别工具,Oncotarget(2016)
[10] Chen,W。;冯·P。;丁·H。;林,H。;Chou,K.-C.,使用变形能量分析基因组中的核小体定位,基因组学,107,69-75(2016)
[11] Chen,W。;张,X。;布鲁克,J。;林,H。;张,L。;Chou,K.-C.,PseKNC-General:生成各种模式伪核苷酸组成的跨平台软件包,生物信息学,31,119-120(2015)
[12] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[13] Chou,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。分子生物学。,30, 275-349 (1995)
[14] Chou,K.-C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[15] Chou,K.-C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组。,6, 262-274 (2009)
[16] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[17] Chou,K.-C.,《关于预测分子生物系统中多标签属性的一些评论》,《分子生物学》。,9, 1092-1100 (2013)
[18] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[19] 周,K.-C。;蔡永德,用伪氨基酸组成预测蛋白质四级结构,蛋白质,53282-289(2003)
[20] 周,K.-C。;Shen,H.-B.,Cell PLoc:一套用于预测蛋白质在各种生物体中的亚细胞定位的网络服务器,Nat.Protoc。,3, 153-162 (2008)
[21] 周,K.-C。;Shen,H.-B.,Plant-mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,《公共科学图书馆·综合》,5,e11335(2010)
[22] 周,K.-C。;吴振中。;Xiao,X.,iLoc-Euk:预测单复合和复合真核蛋白亚细胞定位的多标签分类器,《公共科学图书馆·综合》,6(2011)
[23] 周,K.-C。;吴振中。;Xiao,X.,iLoc-Hum:使用累积-标签尺度预测人类蛋白质在单位点和多位点的亚细胞位置,分子生物学系统。,8, 629-641 (2012)
[24] Dehzangi,A。;Heffernan,R。;Sharma,A。;Lyons,J。;Paliwal,K。;Sattar,A.,通过将基于进化的描述符纳入Chou的一般PseAAC,J.Theor,对革兰氏阳性和革兰氏阴性蛋白质进行亚细胞定位。《生物学》,364,284-294(2015)·Zbl 1405.92092号
[25] 丁,C。;Peng,H.,从微阵列基因表达数据中选择最小冗余特征,生物信息杂志。计算。生物学,3185-205(2005)
[26] 丁·H。;刘,L。;郭,F.-B。;黄,J。;Lin,H.,用改进的马氏判别算法和伪氨基酸组成识别高尔基体蛋白类型,protein Pept。莱特。,18, 58-63 (2011)
[27] 丁·H。;郭,S.-H。;邓永中。;袁,L.-F。;郭,F.-B。;Huang,J.,利用特征选择技术预测高尔基体驻留蛋白类型,化学。智力。实验室系统。,124,9-13(2013)
[28] 杜,P。;Li,Y.,通过将假氨基酸成分与分段序列的各种物理化学特征杂交来预测蛋白质亚线粒体位置,BMC生物信息学,7518(2006)
[29] 杜,P。;Yu,Y.,SubMito-PSPCP:通过位置特异性物理化学特性与伪氨基酸成分杂交预测蛋白质亚线粒体位置,BioMed。Res.Int.,2013,1-7(2013)
[30] 杜,P。;曹,S。;Li,Y.,SubChlo:利用伪氨基酸成分和循证K-最近邻(ET-KNN)算法预测蛋白质亚叶绿体位置,J.Theor。生物学,261330-335(2009)·Zbl 1403.92063号
[31] 杜,P。;李·T。;Wang,X.,预测蛋白质亚亚细胞位置的最新进展,蛋白质专家评论。,8, 391-404 (2011)
[32] 杜,P。;顾S。;Jiao,Y.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014)
[33] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC构建器:一个跨平台独立程序,用于生成各种特殊的周氏伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[34] Y.Fujita。;Ohama,E。;高田,M。;Al-Sarraj,S。;Okamoto,K.,帕金森病患者黑质神经元高尔基体与α-同核阳性内含物的碎片化,神经病理学学报。,112, 261-265 (2006)
[35] Gonatas,N.K。;Gonatas,J.O。;Stieber,A.,《高尔基体在肌萎缩性侧索硬化、阿尔茨海默病和蓖麻毒素中毒发病机制中的作用》,《组织化学》。细胞生物学。,109, 591-600 (1998)
[36] 郭,S.-H。;邓永中。;徐立清。;丁·H。;林,H。;Chen,W.,iNuc-PseKNC:一种基于序列的预测因子,用于预测具有伪k元组核苷酸组成的基因组中的核小体定位,生物信息学,301522-1529(2014)
[37] 胡,L。;黄,T。;施,X。;卢,W.C。;蔡,Y.-D。;Chou,K.-C.,基于加权蛋白质相互作用网络和蛋白质杂交特性预测小鼠蛋白质功能,《公共科学图书馆·综合》,6,e14556(2011)
[38] 黄,T。;Chen,L。;蔡,Y.-D。;Chou,K.-C.,《利用图形特性、生物化学和物理化学特性以及功能特性对调控途径进行分类和分析》,《公共科学图书馆·综合》,6,e25297(2011)
[39] 黄,T。;Wang,J。;蔡,Y.-D。;Yu,H。;Chou,K.-C.,基于丙型肝炎病毒网络的肝细胞性肝硬化和肝癌分类,《公共科学图书馆·综合》,7,e34460(2012)
[40] 黄,T。;牛,S。;徐,Z。;黄,Y。;孔,X。;Cai,Y.-D.,基于杂交特性预测多位点p53突变体的转录活性,PLoS One,6,e22940(2011)
[41] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物学》,377,47-56(2015)
[42] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[43] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.C.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[44] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPBS-Opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集来识别蛋白质结合位点,Molecules,21(2016)
[45] Jiao,Y.-S。;Du,P.-F.,《使用伪氨基酸成分预测高尔基-寄居蛋白类型:具有位置特异性物理化学性质的方法》,J.Theor。生物学,391,35-42(2016)·Zbl 1343.92154号
[47] 川岛,S。;Pokarowski,P。;波卡洛斯卡,M。;科林斯基,A。;Katayama,T。;Kanehisa,M.,AAindex:氨基酸指数数据库,2008年进展报告,核酸研究,36(2008)
[48] 库马尔,R。;Srivastava,A。;库马里,B。;Kumar,M.,用Chou伪氨基酸组成和支持向量机预测β-内酰胺酶及其分类,J.Theor。生物,365,96-103(2015)·Zbl 1314.92055号
[49] 李,B.-Q。;胡,L.-L。;Chen,L。;Feng,K.-Y。;蔡,Y.-D。;Chou,K.-C.,用mRMR特征选择和分析预测蛋白质结构域,PLoS One,7,e39308(2012)
[50] 李碧琴。;黄,T。;刘,L。;蔡,Y.-D。;Chou,K.-C.,在蛋白质相互作用网络中用mRMR和最短路径识别结直肠癌相关基因,PLoS One,7,e33393(2012)
[51] 林,W.-Z。;方,J.-A。;Xiao,X。;Chou,K.-C.,iLoc-Animal:预测动物蛋白质亚细胞定位的多标记学习分类器,分子生物学。,9, 634 (2013)
[52] 刘,B。;朗·R。;Chou,K.-C.,iDHS-EL:通过将三种不同模式的假do核苷酸合成融合到集成学习框架中来识别DNase I超敏位点,生物信息学(2016)
[53] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.-C.,repDNA:一个python包,通过结合用户定义的物理化学特性和序列顺序效应,为DNA序列生成各种模式的特征向量,生物信息学,311307-1309(2015)
[54] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.C.,repRNA:一个生成RNA序列各种特征向量的网络服务器,分子遗传学。基因组。(2015)
[55] 刘,B。;方,L。;王,S。;王,X。;李,H。;Chou,K.C.,用简并K-tuple或Kmer策略鉴定微RNA前体,J.Theor。生物学,385153-159(2015)
[56] 刘,B。;方,L。;刘,F。;王,X。;Chou,K.-C.,iMiRNA-PseDPC:用伪距离-对合成方法鉴定microRNA前体,J.Biomol。结构。动态。,1-13 (2015)
[57] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[58] 刘,B。;徐,J。;风扇,S。;Xu,R。;周,J。;Wang,X.,PseDNA-Pro:通过结合Chou的PseAAC和物理化学距离转换鉴定DNA结合蛋白,Mol.Inf.,34,8-17(2015)
[59] 刘,B。;方,L。;朗·R。;兰,X。;Chou,K.-C.,iEnhancer-2L:通过伪K元组核苷酸组成识别增强子及其强度的双层预测因子,生物信息学,32,362-369(2016)
[60] 刘,Z。;Xiao,X。;邱伟荣。;Chou,K.-C.,iDNA-Methyl:通过伪三核苷酸组成识别DNA甲基化位点,Ana。生物化学。,474, 69-77 (2015)
[61] 刘,Z。;Xiao,X。;Yu,D.-J。;贾,J。;邱伟荣。;Chou,K.-C.,pRNAm-PC:通过物理化学性质预测RNA序列中的N(6)-甲基腺苷位点,分析。生物化学。,497, 60-67 (2016)
[62] 彭汉川;龙,福慧;Ding,C.,基于最大依赖性、最大相关性和最小冗余度的互信息标准的特征选择,IEEE Trans。模式分析。机器。智力。,27, 1226-1238 (2005)
[63] 沈海波。;Chou,K.-C.,《病毒-PLoc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器》,生物聚合物,85,233-240(2007)
[64] 沈海波。;Chou,K.-C.,Nuc-PLoc:通过融合PseAA成分和PsePSSM预测蛋白质亚核定位的新网络服务器,蛋白质工程设计。选择。,20, 561-567 (2007)
[65] 沈海波。;Chou,K.-C.,PseAAC:一个灵活的网络服务器,用于生成各种蛋白质伪氨基酸组成,Ana。生物化学。,373, 386-388 (2008)
[66] 沈海波。;杨,J。;Chou,K.-C.,Euk-PLoc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67(2007)
[67] 沈海波。;Yi,D.-L。;姚,L.-X。;杨,J。;Chou,K.-C.,基于知识的计算智能开发,用于从序列预测蛋白质二级结构,蛋白质专家评论。,653-662(2008年)
[68] 范迪克,A.D.J。;Bosch博士。;ter Braak,C.J.F。;van der Krol,A.R。;van Ham,R.C.H.J.,预测II型膜蛋白的亚高尔基体定位,生物信息学,241779-1786(2008)
[69] Vapnik,V.N.,《统计学习理论的本质》(2000年),施普林格:施普林格纽约,纽约州纽约市(2015年12月15日)·兹比尔0934.62009
[70] 王,P。;胡,L。;刘,G。;蒋,N。;陈,X。;Xu,J.,基于序列比对和特征选择方法的抗菌肽预测,PLoS One,6,e18476(2011)
[71] 吴振中。;Xiao,X。;Chou,K.-C.,iLoc-Plant:一种多标记分类器,用于预测具有单位点和多位点的植物蛋白质的亚细胞定位,Mol.Biosyst。,7, 3287 (2011)
[72] 吴振中。;Xiao,X。;Chou,K.-C.,iLoc-Gpos:预测单复合体和多重革兰氏阳性细菌蛋白质亚细胞定位的多层分类器,蛋白质肽Lett。,19, 4-14 (2012)
[73] Xiao,X。;吴振中。;Chou,K.-C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。《生物学》,284,42-51(2011)·Zbl 1397.92238号
[74] Xiao,X。;王,P。;林,W.-Z。;贾俊华。;Chou,K.-C.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177 (2013)
[75] Xiao,X。;Min,J.-L。;林,W.-Z。;刘,Z。;Cheng,X。;Chou,K.C.,iDrug-Target:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。动态。,33, 2221-2233 (2015)
[76] Xu,Y。;Chou,K.-C.,预测蛋白质翻译后修饰位点的最新进展,Curr。顶部。医药化学。,16, 591-603 (2016)
[77] 郑,L.-L。;李玉霞。;丁,J。;郭晓凯。;Feng,K.-Y。;Wang,Y.-J.,识别毒力因子的计算方法比较,PLoS One,7,e42517(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。