×

兹马思-数学第一资源

利用周氏伪氨基酸组成的一般形式预测高尔基体蛋白质类型:最小冗余最大相关特征选择方法。(英语) Zbl 1343.92378
摘要:近年来,人们在预测高尔基体驻留蛋白方面做出了一些努力。然而,鉴定高尔基体驻留蛋白的类型仍然是一项具有挑战性的任务。准确预测高尔基体驻留蛋白的类型对于理解其在各种生物过程中的分子功能起着关键作用。本文提出了一种基于互信息的特征选择方案,并结合一般形式的Chou的伪氨基酸组成来预测高尔基体的蛋白质类型。利用位置特异性的理化性质研究了周氏伪氨基酸的组成。我们用49个特征进行了刀切试验,获得了91.24%的预测准确率。在现有的预测因子中,它的性能最好。这一结果表明,我们的计算模型可用于识别高尔基体驻留蛋白类型。

理学硕士:
92D20 蛋白质序列,DNA序列
92C40型 生物化学、分子生物学
92-04年 有关生物学问题的软件、源代码等
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 阿里,F。;Hayat,M.,《使用投票特征区间结合周氏伪氨基酸组成对膜蛋白类型进行分类》,J.Theor。生物学,384,78-83,(2015年)·Zbl 1343.92006
[2] 阿尔特舒尔公司。;马登,T.L。;舍弗,A.A。;张杰。;张,Z。;Miller,W.,间隙爆破和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402,(1997)
[3] 曹博士。;徐Q-S。;Liang,Y.-Z.,Propy:一种生成周氏pseaac各种模式的工具,生物信息学,29960-962,(2013)
[4] 昌,C.-C。;Lin,C.-J.,LIBSVM:支持向量机库,ACM Trans。因特尔。系统。技术,2,27,1-27,(2011)
[5] 陈,L。;曾文敏。;蔡,Y.-D。;冯克英。;周国庆,藉由整合化学-化学相互作用与相似性来预测药物之解剖治疗化学(ATC)分类,PLoS One,7,e35254,(2012)
[6] 陈,W。;林,H。;Chou,K.-C.,伪核苷酸组成或pseknc:分析基因组序列的有效配方,Mol Biosyst.,112620-2634,(2015)
[7] 陈,W。;冯,下午。;林,H。;Chou,K.-C.,Irspot psednc:识别具有伪二核苷酸成分的重组点,核酸研究,41,e68,(2013)
[8] 陈,W。;雷,T.-Y。;金,哥伦比亚特区。;林,H。;周国庆,Pseknc:一个用于生成伪K元组核苷酸组成的灵活的web服务器,Anal。生物化学,45653-60,(2014)
[9] 陈,W。;丁,H。;冯,P。;林,H。;Chou,K.-C.,Iacp:一种基于序列的抗癌肽识别工具,Oncotarget,(2016)
[10] 陈,W。;冯,P。;丁,H。;林,H。;周,K.-C.,用变形能分析核小体在基因组中的定位,基因组学,10769-75,(2016)
[11] 陈,W。;张,X。;布鲁克,J。;林,H。;张,L。;周国康,Pseknc-general:产生不同模式伪核苷酸组成的跨平台软件包,生物信息学,31119-120,(2015)
[12] 周国庆,用伪氨基酸组成预测蛋白质细胞属性,蛋白质,43246-255,(2001)
[13] 周国庆。;张春涛,蛋白质结构类群预测。版次。生物化学。《分子生物学》,30275-349,(1995年)
[14] 周国庆,利用两亲性伪氨基酸组成预测酶亚家族类别,生物资讯学,21,10-19,(2005)
[15] 周国庆,伪氨基酸组成及其在生物信息学、蛋白质组学及系统生物学中的应用,当代。蛋白质组学,62262-274,(2009年)
[16] 周国庆,蛋白质属性预测与伪氨基酸组成之探讨,理论。《生物学》,273236-247,(2011年)·Zbl 1405.92212
[17] 周国强,分子生物系统中多标记属性预测的一些评论,分子生物学,91092-1100,(2013)
[18] 周国庆,生物信息学对药物化学的影响,医学。《化学》,11218-234,(2015年)
[19] 周国庆。;蔡英德,用伪氨基酸组成预测蛋白质四级结构,蛋白质,53282-289,(2003)
[20] 周国庆。;Shen,H.-B.,Cell ploc:一个用于预测蛋白质在各种生物体中亚细胞定位的web服务器包,Nat。方案,3153-162,(2008年)
[21] 周国庆。;沈海波,植物mploc:一种自上而下的增强植物蛋白质亚细胞定位能力的策略,公共科学图书馆,第5期,e11335,(2010)
[22] 周国庆。;吴志中。;《多重真核生物识别与定位》,Xiao Plox,2011年
[23] 周国庆。;吴志中。;Xiao,X.,Iloc hum:使用累积标记量表预测人类蛋白质的亚细胞位置,Mol.BioSyst.,8629-641,(2012)
[24] 西藏,A。;赫弗南,R。;夏尔玛,A。;里昂,J。;帕里瓦尔,K。;Sattar,A.,革兰氏阳性和革兰氏阴性蛋白质亚细胞定位,通过将进化基描述符纳入周׳的通用pseaac,J.Theor。生物,364284-294,(2015年)·Zbl 1405.92092
[25] 丁,C。;Peng,H.,从微阵列基因表达数据中选择最小冗余特征,生物信息学杂志。计算机。生物学,3185-205,(2005)
[26] 丁,H。;刘,L。;郭富民。;黄,J。;Lin,H.用改进的马氏体判别算法和伪氨基酸组成,蛋白质Pept识别高尔基体蛋白质类型。Lett.,18,58-63,(2011年)
[27] 丁,H。;郭,S.-H。;邓恩哲。;元,L.-F。;郭富民。;Huang,J.,用特征选择技术预测高尔基体蛋白质类型,化学计量学。因特尔。实验室系统,1249-13,(2013)
[28] 杜,P。;Li,Y.,通过将假氨基酸组成与片段序列的各种物理化学特征杂交来预测蛋白质亚软骨的位置,BMC生物信息学,7518,(2006)
[29] 杜,P。;Yu,Y,Submito PSPCP:通过将位置特异的物理化学性质与假氨基酸组成进行杂交来预测蛋白质亚软骨的位置,生物医学。国际研究,2013年1月7日,(2013年)
[30] 杜,P。;曹,S。;李玉英,亚氯仿:用伪氨基酸组成预测蛋白质亚叶绿体位置和证据理论K近邻(ET-KNN)算法,理论与实践。生物学,261330-335,(2009年)·Zbl 1403.92063
[31] 杜,P。;李,T。;Wang,X.,蛋白质亚细胞定位预测的最新进展,专家评论。蛋白质组学,8391-404,(2011年)
[32] 杜,P。;顾,S。;Jiao,Y.,Pseaac general:为大规模蛋白质数据集快速构建周氏伪氨基酸组成的各种通用模式,国际分子科学杂志,15,3495-3506,(2014)
[33] 杜,P。;王,X。;徐,C。;Gao,Y.,Pseaac builder:一个跨平台的独立程序,用于生成各种特殊的周氏伪氨基酸组成,Anal。生物化学,425117-119,(2012年)
[34] 藤田市。;大阪市。;Takatama,M。;Al Sarraj,S。;Okamoto,K.,《帕金森病患者中α-突触核蛋白阳性内含物的黑质神经元高尔基体断裂》,《神经病学学报》,112261-265,(2006)
[35] 新罕布什尔州戈纳塔斯。;戈纳塔斯,J.O。;Stieber,A.,《高尔基体参与肌萎缩侧索硬化症、阿尔茨海默病和蓖麻毒素中毒的发病机制》,组织化学。《细胞生物学》,109591-600,(1998)
[36] 郭,S.-H。;邓恩哲。;徐立奎。;丁,H。;林,H。;Chen,W.,Inuc-pseknc:一种基于序列的预测因子,用于用伪k-元组核苷酸组成预测基因组中的核小体定位,生物信息学,30,1522-1529,(2014)
[37] 胡,L。;黄,T。;史,X。;鲁西南。;蔡,Y.-D。;周国庆,基于加权蛋白质相互作用网络和蛋白质杂交特性预测小鼠蛋白质功能,公共科学图书馆,6,e14556,(2011)
[38] 黄,T。;陈,L。;蔡,Y.-D。;周国庆,利用图形特性、生化和理化性质及功能特性对调控途径的分类与分析,公共科学图书馆,6,e25297,(2011)
[39] 黄,T。;王,J。;蔡,Y.-D。;于,H。;周国强,基于丙型肝炎病毒网络的肝细胞性肝硬化和肝癌分类,公共科学图书馆,7,e34460,(2012)
[40] 黄,T。;妞妞。;徐,Z。;黄,Y。;孔,X。;Cai,Y.-D.,基于杂交特性预测多位点p53突变体的转录活性,公共科学图书馆,6,e22940,(2011)
[41] 贾杰。;刘,Z。;肖,X。;刘,B。;周国庆,Ippi-esml:一种通过将蛋白质的物理化学性质和小波变换整合到pseaac中来识别蛋白质相互作用的集成分类器,J.Theor。生物,377,47-56,(2015年)
[42] 贾杰。;刘,Z。;肖,X。;刘,B。;Chou,K.-C.,Isuc pseopt:通过将序列耦合效应纳入伪组分和优化不平衡训练数据集来识别蛋白质中赖氨酸琥珀酰化位点,分析。生物化学,497,48-56,(2016年)
[43] 贾杰。;刘,Z。;肖,X。;刘,B。;周国庆,Psuc赖氨酸:用pseaac和系综随机森林方法预测蛋白质中赖氨酸琥珀酰化位点,理论杂志。生物,394223-230,(2016年)·Zbl 1343.92153
[44] 贾杰。;刘,Z。;肖,X。;刘,B。;Chou,K.-C.,Ippbs opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集识别蛋白质-蛋白质结合位点,分子,21,(2016)
[45] 焦永山。;Du,P.-F.,使用伪氨基酸成分预测高尔基体驻留蛋白质类型:位置特异性物理化学性质的方法,理论杂志。生物,391,35-42,(2016年)·Zbl 1343.92154
[46] Jiao,Y.,Du,P.,Su,X.,通过将N-末端跨膜结构域信息纳入Chou的假氨基酸组成的一般形式来预测植物中高尔基体驻留蛋白。第八届系统生物学国际会议(ISB),2014年:第226-229页。doi:10.1109/ISB.2014.6990759〉.
[47] 川岛南部。;博卡罗夫斯基,P。;博卡罗夫斯卡,M。;科林斯基,A。;Katayama,T。;Kanehisa,M.,Aaindex:氨基酸指数数据库,2008年进展报告,核酸研究,36,(2008年)
[48] 库马尔,R。;斯利瓦斯塔瓦,A。;库马里,B。;库马尔,M.用周氏伪氨基酸组成和支持向量机预测β-内酰胺酶及其分类,理论。生物学,365,96-103,(2015年)·Zbl 1314.92055
[49] 李伯强。;胡,L.-L。;陈,L。;冯克英。;蔡,Y.-D。;周国庆,应用磁共振波谱特征选择与分析预测蛋白质结构域,公共科学图书馆,7,e39308,(2012)
[50] 李伯强。;黄,T。;刘,L。;蔡,Y.-D。;周国强,应用磁共振波谱和蛋白质相互作用网络中的最短路径识别结直肠癌相关基因,公共科学图书馆,7,e33393,(2012)
[51] 林文泽。;方,J.-A。;肖,X。;周国强,Iloc动物:用于预测动物蛋白质亚细胞定位的多标记学习分类器,分子生物学系统,9634,(2013)
[52] 刘,B。;长,右。;Chou,K.-C.,Idhs EL:通过将三种不同模式的pseu-do核苷酸组成融合到一个集成学习框架中来识别DNA酶I超敏感位点,生物信息学,(2016)
[53] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.-C.,Repdna:一个python软件包,通过结合用户定义的物理化学特性和序列顺序效应生成DNA序列的各种模式的特征向量,生物信息学,311307-1309,(2015)
[54] 刘,B。;刘,F。;方,L。;王,X。;周国庆,Reprna:一个生成RNA序列各种特征向量的网络服务器,分子遗传学。热那姆(2015)
[55] 刘,B。;方,L。;王,S。;王,X。;李,H。;周国庆,用简并K-tuple或kmer策略鉴定microrna前体。生物学,385153-159,(2015年)
[56] 刘,B。;方,L。;刘,F。;王,X。;周国庆,亚胺RNA psedpc:用伪距离对组成法鉴定microrna前体,生物化学杂志。结构。Dyn.,1-13,(2015年)
[57] 刘,B。;刘,F。;王,X。;陈杰。;方,L。;周,K.-C.,Pse-in-one:一个用于生成DNA、RNA和蛋白质序列的各种模式的网络服务器,核酸研究,43,W65-W71,(2015)
[58] 刘,B。;徐杰。;风扇。;徐,R。;周杰。;Wang,X.,Psedna-pro:结合周氏pseaac和理化距离转换法鉴定DNA结合蛋白,分子信息,34,8-17,(2015)
[59] 刘,B。;方,L。;长,右。;兰,X。;Chou,K.-C.,Ienhancer-2L:通过伪K-元组核苷酸组成识别增强子及其强度的两层预测因子,生物信息学,32,362-369,(2016)
[60] 刘,Z。;肖,X。;邱文瑞。;周,K.-C.,DNA甲基化:通过伪三核苷酸组成鉴定DNA甲基化位点。生物化学,474,69-77,(2015年)
[61] 刘,Z。;肖,X。;于,D.-J。;贾杰。;邱文瑞。;周国庆,张国强,中华民国电脑:透过物理化学性质预测核糖核酸序列中N(6)-甲基腺苷位点。生物化学,497,60-67,(2016年)
[62] 彭汉川;龙,福辉;Ding,C.,基于最大依赖、最大关联和最小冗余的互信息准则的特征选择,IEEE Trans。肛门模式。机器。国际,27,1226-1238,(2005年)
[63] 沈海波。;周国庆,病毒ploc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器,生物聚合物,85233-240,(2007)
[64] 沈海波。;周国庆,Nuc-ploc:一个新的通过融合pseaa成分和PSEPSM预测蛋白质亚核定位的网络服务器。Sel.,20561-567,(2007年)
〔65〕 沈海波。;周国庆,Pseaac:一个用于生成各种蛋白质伪氨基酸组成的灵活网络服务器。生物化学,373386-388,(2008年)
[66] 沈海波。;杨,J。;周国庆,Euk-C.,Euk-ploc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67,(2007)
[67] 沈海波。;易,D.-L。;姚,L.-X。;杨,J。;周国庆,以知识为基础的计算智能发展从序列预测蛋白质二级结构,专家评论。蛋白质组学,5653-662,(2008)
[68] van Dijk,公元前J。;博世,D。;特里布拉克,C.J.F。;范德克罗尔,A.R。;van Ham,R.C.H.J.,预测II型膜蛋白的亚高尔基体定位,生物信息学,241779-1786,(2008)
〔69〕 Vapnik,V.N.,统计学习理论的本质,(2000),Springer纽约,纽约,(15.12.15访问)·Zbl 0934.62009
[70] 王,P。;胡,L。;刘G。;江,N。;陈,X。;徐,J.,基于序列比对和特征选择方法的抗菌肽预测,公共科学图书馆,6,e18476,(2011)
[71] 吴志中。;肖,X。;周国强,Iloc-plant:一种多标记分类器,用于预测植物蛋白质的亚细胞定位,分子生物学系统,73287,(2011)
[72] 吴志中。;肖,X。;Chou,K.-C.,Iloc-gpos:用于预测单丛和多重革兰氏阳性细菌蛋白质亚细胞定位的多层分类器,蛋白质肽Lett.,19,4-14,(2012)
[73] 肖,X。;吴志中。;周国庆,Iloc病毒:一种识别病毒蛋白亚细胞定位的多标记学习分类器,J.Theor。《生物学》,284,42-51,(2011年)·Zbl 1397.92238
[74] 肖,X。;王,P。;林文泽。;贾建华。;周国康,Iamp-2L:一种用于识别抗菌肽及其功能类型的两级多标记分类器,Anal。生物化学,436168-177,(2013年)
[75] 肖,X。;最小,J.-L。;林文泽。;刘,Z。;程,X。;周,K.-C.,Idrug靶点:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。戴恩,332221-2233,(2015年)
[76] 徐,Y。;周国庆,蛋白质翻译后修饰位点预测的最新进展,当代。顶部。医学。《化学》,16591-603,(2016年)
[77] 郑,L.-L。;李,Y.-X。;丁,J。;郭克强。;冯克英。;王英杰,毒力因子识别的计算方法比较,公共科学图书馆,7,e42517,(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。