×

通过结合功能域富集分数和伪氨基酸组成预测蛋白亚高尔基体位置。 (英语) Zbl 1414.92206号

高尔基体是参与分泌途径的重要亚细胞器。高尔基体在细胞过程中的作用与高尔基滞留蛋白有关。了解高尔基体旁蛋白的亚高尔基体位置有助于了解其分子功能。在这项工作中,我们提出了一种计算方法来预测高尔基体附近蛋白质的亚高尔基体位置。我们考虑了三个亚高尔基地区:顺式-高尔基网络(CGN)、高尔基堆栈和反式-高尔基网络(TGN)。通过结合伪氨基酸组成(Type-II PseAAC)和功能域富集分数(FunDES),我们的方法不仅取得了比现有方法更好的性能,而且能够识别高尔基体堆栈位置的蛋白质,这在其他最新研究中从未考虑过。

MSC公司:

92D20型 蛋白质序列,DNA序列
92立方37 细胞生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾哈迈德·J。;贾维德,F。;Hayat,M.,使用过采样和fisher特征选择方法分类亚高尔基体蛋白的智能计算模型,Artif。智力。医学,78,14-22(2017)
[3] Chang,C.-C。;Lin,C.-J.,LIBSVM:支持向量机库,ACM Trans。智力。系统。技术。,2, 27, 1-27 (2011), 27
[4] Chen,W。;冯,P.-M。;Lin,H。;Chou,K.-C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[5] Chen,W。;Lei,T.-Y。;金,D.-C。;Lin,H。;Chou,K.-C.,PseKNC:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60 (2014)
[6] Chen,W。;Lin,H。;Chou,K.-C.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[7] Chen,W。;张,X。;布鲁克,J。;Lin,H。;张,L。;Chou,K.-C.,PseKNC-general:用于生成各种模式伪核苷酸组成的跨平台软件包,Bioinforma。牛津大学。英语。,31, 119-120 (2015)
[8] 陈,Z。;赵,P。;李,F。;Leier,A。;Marquez-Lago,T.T。;Wang,Y。;韦伯,G.I。;史密斯,A.I。;Daly,R.J。;周,K.-C。;Song,J.,iFeature:一个Python包和网络服务器,用于从蛋白质和肽序列中提取和选择特征,Bioinforma。牛津大学。英语。,34, 2499-2502 (2018)
[9] Cheng,X。;Xiao,X。;Chou,K.-C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,Bioinforma。牛津大学。英语。,34, 1448-1456 (2018)
[10] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[11] Chou,K.-C.,使用两亲性伪氨基酸组成预测酶亚科类别,Bioinforma。牛津大学。英语。,21, 10-19 (2005)
[12] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[13] Chou,K.-C.,《关于预测分子生物系统中多标签属性的一些评论》,《分子生物学》。,9, 1092-1100 (2013)
[14] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。谢里卡阿拉伯联合酋长国。,11, 218-234 (2015)
[15] 周,K.-C。;Cai,Y.-D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.Biol。化学。,277, 45765-45769 (2002)
[16] 周,W.C。;Yin,Y。;Xu,Y.,GolgiP:植物中Golgi-resident蛋白的预测,生物信息学。牛津大学。英语。,26, 2464-2465 (2010)
[17] 丁·H。;郭,S.-H。;Deng,E.-Z。;袁,L.-F。;郭,F.-B。;黄,J。;Rao,N。;Chen,W。;Lin,H.,利用特征选择技术预测高尔基滞留蛋白类型,化学。智力。实验室系统。,124, 9-13 (2013)
[18] 丁·H。;刘,L。;郭,F.-B。;黄,J。;Lin,H.,用改进的马氏判别算法和伪氨基酸组成识别高尔基体蛋白类型,protein Pept。莱特。,18, 58-63 (2011)
[19] 杜,P。;曹,S。;Li,Y.,SubChlo:利用伪氨基酸成分和循证K-最近邻(ET-KNN)算法预测蛋白质亚叶绿体位置,J.Theor。生物学,261330-335(2009)·Zbl 1403.92063号
[20] 杜,P。;顾S。;Jiao,Y.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014)
[21] 杜,P。;李·T。;王,X。;Xu,C.,SubChlo-GO:利用加权基因本体得分预测蛋白质亚叶绿体位置,Curr。生物信息学。,8, 193-199 (2013)
[22] 杜,P。;田,Y。;Yan,Y.,利用预测的基因本体得分预测人类内部和细胞器膜蛋白的亚细胞定位,J.Theor。《生物学》,31361-67(2012)
[23] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC-Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[24] Du,P.-F.,Chou伪氨基酸组成的软件实现和算法增强的简要综述,Curr。蛋白质组学,13,105-112(2016)
[25] Du,P.-F.,预测蛋白质亚线粒体位置:十周年,Curr。基因组学,18,316-321(2017)
[26] 杜,P.-F。;赵伟。;苗Y.-Y。;魏立英。;Wang,L.,UltraPse:表示生物序列的通用和可扩展软件平台,国际分子科学杂志。,18 (2017)
[27] Fu,L。;牛,B。;朱,Z。;Wu,S。;Li,W.,CD-HIT:加速对下一代测序数据进行聚类,Bioinforma。牛津大学。英语。,28, 3150-3152 (2012)
[28] 郭,S.-H。;邓永中。;Xu,L.-Q。;丁·H。;Lin,H。;Chen,W。;Chou,K.C.,iNuc-PseKNC:一种基于序列的预测因子,用于预测具有伪K元组核苷酸组成的基因组中的核小体定位,Bioinforma。牛津大学。英语。,30, 1522-1529 (2014)
[29] Han,G.S。;Yu,Z.G。;Anh,V。;Krishnajith,A.P.D。;Tian,Y.-C.,一种从初级蛋白质结构预测亚核定位的集成方法,PLOS One,8,e57225(2013)
[30] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iCar-PseCp:通过蒙特卡罗采样确定蛋白质中的羰基化位点,并将序列耦合效应纳入一般PseAAC,Oncotarget,734558-34570(2016)
[31] 焦,Y。;Du,P.,评估基于机器学习的分类生物信息学预测因子的性能度量,Quant。生物学,4320-330(2016)
[32] Jiao,Y.-S。;Du,P.-F.,《使用伪氨基酸成分预测高尔基-寄居蛋白类型:具有位置特异性物理化学性质的方法》,J.Theor。生物学,391,35-42(2016)·Zbl 1343.92154号
[33] Jiao,Y.S。;Du,P.F.,《使用Chou伪氨基酸组成的一般形式预测高尔基-寄居蛋白类型:最小冗余最大相关特征选择方法》,J.Theor。《生物学》,40238-44(2016)·Zbl 1343.92378号
[34] Jiao,Y.-S。;Du,P.-F.,通过将特定位置的物理化学性质纳入Chou的一般伪氨基酸成分中来预测蛋白质的亚线粒体位置,J.Theor。生物学,41681-87(2017)
[35] 朱,Z。;曹建忠。;Gu,H.,通过将k间距氨基酸对合并到Chou’s general PseAAC中,用模糊{SVM}预测赖氨酸磷酸甘油化,J.Theor。生物学,397145-150(2016)
[36] 川岛,S。;Kanehisa,M.,《氨基酸指数:氨基酸指数数据库》,《核酸研究》,28,374(2000)
[37] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.-C.,repDNA:一个Python包,通过结合用户定义的物理化学特性和序列顺序效应,为DNA序列生成各种模式的特征向量,Bioinforma。牛津大学。英语。,31, 1307-1309 (2015)
[38] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[39] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.C.,repRNA:一个生成RNA序列各种特征向量的网络服务器,分子遗传学。基因组学MGG,291,473-481(2016)
[40] Marchler Bauer,A。;德比郡,M.K。;新泽西州冈萨雷斯。;卢,S。;Chitsaz,F。;Geer,L.Y。;吉尔·R.C。;He,J。;瓜兹,M。;D.I.Hurwitz。;Lanczycki,C.J。;卢·F。;Marchler,G.H。;Song,J.S。;Thanki,N。;王,Z。;Yamashita,R.A。;张,D。;郑,C。;Bryant,S.H.,CDD:nCBI的保守域数据库,核酸研究,43,D222-D226(2015)
[41] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Chou,K.-C.,iPTM-mLys:鉴定多个赖氨酸PTM位点及其不同类型,生物信息学。牛津大学。英语。,32, 3116-3123 (2016)
[42] 邱伟荣。;Xiao,X。;林,W.-Z。;Chou,K.-C.,iMethyl-PseAAC:通过伪氨基酸组成方法鉴定蛋白质甲基化位点,生物医药研究国际,2014,第947416页(2014)
[43] 拉赫曼(M.Saifur Rahman);拉赫曼,M.K。;Kaykobad,M。;Rahman,M.Sohel,isGPT:使用SVM和基于随机森林的特征选择Artif识别亚高尔基体蛋白类型的优化模型。智力。医学,84,90-100(2018)
[44] UniProt:通用蛋白质知识库,核酸研究,45,D158-D169(2017)
[45] van Dijk,A.D.J。;博世,D。;ter Braak,C.J.F。;范德克罗尔,A.R。;van Ham,R.C.H.J.,预测II型膜蛋白的亚高尔基体定位,生物信息学。牛津大学。英语。,24, 1779-1786 (2008)
[46] 王,S。;Liu,S.,基于有效融合表示和降维算法LDA的蛋白质亚核定位,国际分子科学杂志。,16, 30343-30361 (2015)
[47] 王,S。;Yue,Y.,基于新的有效表示和二分贪婪遗传算法智能核线性判别分析的蛋白质亚核定位,PLOS One,13,Article e0195636 pp.(2018)
[48] 王,X。;张伟。;张,Q。;Li,G.-Z.,MultiP-SChlo:使用Chou的伪氨基酸成分和新的多标记分类器Bioinforma进行多标记蛋白质亚叶绿体定位预测。牛津大学。英语。,31, 2639-2645 (2015)
[49] Yang,R。;张,C。;高,R。;Zhang,L.,一种基于特征选择的新特征提取方法,用于从不平衡数据中识别Golgi-resident蛋白质类型,国际分子科学杂志。,17, 218 (2016)
[50] 赵伟。;Wang,L。;张,T.-X。;Z.-N.赵。;Du,P.-F.,《为所有类型的生物序列生成Chou伪因子表示的软件工具简评》,Protein Pept。莱特。,25, 822-829 (2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。