×

将自交叉相关和PSSM整合到Chou’s PseAAC中预测凋亡蛋白亚细胞定位。 (英语) Zbl 1406.92230号

摘要:预测凋亡蛋白的亚细胞定位仍然是一项具有挑战性的任务,现有的方法主要基于蛋白质的一级序列。在本研究中,我们通过将Moran自相关和互相关与PSSM相结合,提出了一种新的模型MACC-PSSM。然后构建3600维特征向量来预测凋亡蛋白的亚细胞定位。最后,使用主成分分析(PCA)在ZW公司225个数据集,采用支持向量机作为分类器。为了评估所提方法的性能,对两个广泛使用的基准数据集进行了折刀交叉验证测试:ZW公司225和317.我们的模型在预测精度方面取得了竞争性的表现,特别是在数据集的总体预测精度方面ZW公司225和317例,分别达到84.9%和90.5%。我们的结果与其他方法的比较表明,MACC-PSSM模型可以作为准确预测凋亡蛋白亚细胞定位的潜在候选者。

MSC公司:

92C40型 生物化学、分子生物学
92立方37 细胞生物学
92D20型 蛋白质序列,DNA序列
68T05年 人工智能中的学习和自适应系统
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Ahmad,K。;Waris,M。;Hayat,M.,《通过将二肽成分纳入周氏一般伪氨基酸成分预测蛋白质亚线粒体位置》,J.Membr。生物学,249293-304(2016)
[2] Altschul,S.F。;Madden,T.L。;Schaffer,A.A。;张,J。;张,Z。;米勒,W。;Lipman,D.J.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[3] 布拉舍夫斯卡,A。;Eils,R.,使用基于马尔可夫链的贝叶斯分类器的层次集成预测蛋白质亚细胞位置,BMC生物信息学,7298(2006)
[4] Chang,C.C.,Lin,C.J.,2001年。LIBSVM:支持向量机库。;Chang,C.C.,Lin,C.J.,2001年。LIBSVM:支持向量机库。
[5] Chen,W.,ISS-pseDNC:使用伪二核苷酸成分识别剪接位点,生物识别。Res.Int.(BMRI),2014,623149(2014)
[6] Chen,W.,IACP:识别抗癌肽的基于序列的工具,Oncotarget,7,13,16895-16909(2016)
[7] Chen,W.,IRNA-3型:鉴定RNA腺苷位点的3种修饰,鼹鼠。疗法。核酸,11468-474(2018)
[8] Chen,W。;丁·H。;冯·P。;Lin,H.,IACP:识别抗癌肽的基于序列的工具,Oncotarget,716895-16909(2016)
[9] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.C.,IRNA-AI:识别RNA序列中腺苷-肌苷编辑位点,Oncotarget,84208-4217(2017)
[10] Chen,W。;冯,P.M。;Lin,H.,IRSpot-pseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[11] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,ISS-pseDNC:使用伪二核苷酸成分识别剪接位点,生物医学。Res.Int.(BMRI),2014,623149(2014)
[12] Chen,W。;Lei,T.Y。;Jin,D.C。;Lin,H.,PseKNC:生成伪k元组核苷酸组成的灵活网络服务器,Ana。生物化学。,456, 53-60 (2014)
[13] Chen,W。;Lin,H.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[14] Chen,Y.L。;Li,Q.Z.,利用多样性测量算法预测亚细胞位置凋亡蛋白,科学学报。国立大学,25413-417(2004)
[15] Chen,Y.L。;Li,Q.Z.,利用改进的杂交方法和伪氨基酸组成预测凋亡蛋白的亚细胞定位,J.Theor。《生物学》,248377-381(2007)·Zbl 1451.92113号
[16] Chen,Y.L。;李庆忠,凋亡蛋白亚细胞位置预测,J.Theor。生物学,245775-783(2007)·Zbl 1451.92112号
[17] Cheng,X.,pLoc-manimal:预测动物蛋白质在单位点和多位点的亚细胞定位,生物信息学,33,22,3524-3531(2017)
[18] Cheng,X.,pLoc-mplant:通过将最佳GO信息整合到通用PseAAC中来预测多位置植物蛋白的亚细胞定位,Mol.Bioyst。,13, 9, 1722-1727 (2017)
[19] Cheng,X.,pLoc-mvirus:通过将最佳GO信息合并到一般PseAAC中来预测多位置病毒蛋白的亚细胞定位,Gene,628,315-321(2017)
[20] Cheng,X.,pLoc-mEuk:通过将关键GO信息提取到一般PseAAC中来预测多标记真核蛋白的亚细胞定位,基因组学,110,1,50-58(2018)
[21] Cheng,X.,pLoc-mGneg:通过通用pseAA c的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学,110,4,231-239(2018)
[22] Cheng,X.,pLoc mhum:通过通用pseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,34,931448-1456(2018)
[23] Cheng,X.等,2018d。pLoc_bal-manimal:通过平衡训练数据集和pseAAC预测动物蛋白质的亚细胞定位。生物信息学。10.1093/bioinformatics/bty628;Cheng,X.等,2018d。pLoc_bal-manimal:通过平衡训练数据集和pseAAC预测动物蛋白质的亚细胞定位。生物信息学。10.1093/生物信息学/bty628
[24] 程,X。;Xiao,X.,pLoc-mEuk:通过将关键GO信息提取到通用PseAAC中来预测多标签真核蛋白的亚细胞定位,基因组学,110,50-58(2018)
[25] 程,X。;Xiao,X.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学,110,231-239(2018)
[26] 程,X。;Zhao,S.G.,IATC-mISF:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346(2017)
[27] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。遗传学。,43, 246-255 (2001)
[28] Chou,K.C.,使用缩放窗口预测信号肽,肽,221973-1979(2001)
[29] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[30] Chou,K.C.,伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用,Curr。蛋白质组。,6, 262-274 (2009)
[31] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273,1,236-247(2011)·Zbl 1405.92212号
[32] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[33] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,9, 1092-1100 (2013)
[34] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[35] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 3, 218-234 (2015)
[36] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 2337-2358 (2017)
[37] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 21, 2337-2358 (2017)
[38] Chou,K.C。;沈海斌,《综述:蛋白质亚细胞定位预测的最新进展》,《分析》。生物化学。,370, 1-16 (2007)
[39] Chou,K.C。;吴振聪。;Xiao,X.,Iloc-euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,《公共科学图书馆·综合》,6,e18258(2011)
[40] Dehzangi,A。;Heffernan,R。;Sharma,A。;Lyons,J。;Paliwal,K。;Sattar,A.,《通过将基于进化的描述符纳入周氏通用pseAAC,J.Theo.r Biol.,的革兰氏阳性和革兰氏阴性蛋白质亚细胞定位》。,364284-294(2015年)·Zbl 1405.92092号
[41] 丁Y.S。;Zhang,T.L.,使用chou的伪氨基酸组成预测凋亡蛋白的亚细胞定位:一种基于免疫遗传算法的集成分类器,模式识别的方法。莱特。,29, 1887-1892 (2008)
[42] Feng,P.等人,2018。iDNA6ma-pseKNC:通过将核苷酸的物理化学性质纳入pseKNC来识别DNA n6-甲基腺苷位点。基因组学。2016年10月10日/j.ygeno.2018.01.005;Feng,P.等人,2018年。iDNA6ma-pseKNC:通过将核苷酸的物理化学性质纳入pseKNC来识别DNA n6-甲基腺苷位点。基因组学。2016年10月10日/j.ygeno.2018.01.005
[43] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.C.,IRNA-psecoll:通过将核苷酸的集体效应纳入pseKNC,Mol.Ther,确定不同RNA修饰的发生位置。核酸,7155-163(2017)
[44] Feng,P.、Yang,H.、Ding,H..、Lin,H.,2018年。iDNA6ma-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC来识别DNA n6-甲基腺苷位点。基因组学。2016年10月10日/j.ygeno.2018.01.005;Feng,P.、Yang,H.、Ding,H..、Lin,H.,2018年。iDNA6ma-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC来识别DNA n6-甲基腺苷位点。基因组学。2016年10月10日/j.ygeno.2018.01.005
[45] Feng,P.M.,IHSP-PseRAAAC:使用伪还原氨基酸字母组成识别热休克蛋白家族,Ana。生物化学。,442, 1, 118-125 (2013)
[46] 海亚特,M。;Iqbal,N.,通过将伪平均化学位移合并到Chou的通用pseAAC和支持向量机来识别蛋白质结构类,计算。方法生物识别程序。,116, 184-192 (2014)
[47] 黄,Y。;Li,Y.,使用模糊k-NN方法预测蛋白质亚细胞位置,生物信息学,20,121-128(2004)
[48] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,Psuc-lys:使用pseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[49] Jian,X.Y。;魏,R。;Zhan,T.L。;Gu,Q.,使用周的伪氨基酸组成概念预测凋亡蛋白的亚细胞位置:近似熵方法,蛋白质Pept。莱特。,15, 392-396 (2008)
[50] Ju,Z。;Wang,S.Y.,通过将k间距氨基酸对纳入周氏一般伪氨基酸组成预测瓜氨酸化位点,Gene,664,78-83(2018)
[51] Liang,Y.Y。;Liu,S.Y。;Zhang,S.L.,Geary自相关和DCCA系数:通过PSSM预测凋亡蛋白亚细胞定位的应用,Physica A,467,296-306(2017)
[52] Lin,H。;邓,E.Z。;Ding,H.,Ipro54-pseKNC:基于序列的预测因子,用于识别具有伪k元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[53] Lin,H。;Wang,H。;丁·H。;Chen,Y.L。;李庆中,利用周氏伪氨基酸成分预测凋亡蛋白的亚细胞定位,生物学报。,57321-330(2009年)
[54] Liu,B.,用伪结构状态组成方法识别真实的microRNA前体,PLoS ONE,10,e0121501(2015)
[55] Liu,B.等人,2018a。增强子EL:用集成学习方法识别增强子及其强度。生物信息学。10.1093/bioinformatics/bty458;Liu,B.等人,2018a。ienhancer-EL:使用集成学习方法确定增强因子及其强度。生物信息学。10.1093/生物信息学/bty458
[56] Liu,B.,Ipromoter-2l:通过基于多窗口的pseKNC识别启动子及其类型的双层预测因子,生物信息学,34,1,33-40(2018)
[57] 刘斌等,2018c。iRO-3wpseKNC:通过基于三个窗口的pseKNC识别DNA复制源。生物信息学。10.1093/bioinformatics/bty312/4978052;刘斌等,2018c。iRO-3wpseKNC:通过基于三个窗口的pseKNC识别DNA复制源。生物信息学。10.1093/生物信息学/bty312/4978052
[58] 刘,B。;刘,F。;王,X。;陈,J。;Fang,L.,Pse-in-one:一个用于生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器,《核酸研究》,43,W65-W71(2015)
[59] 刘,B。;王,S。;Long,R.,IRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2017)
[60] 刘,B。;Wu,H.,Pse-in-one 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式,《自然科学》。(欧文),9,67-91(2017)
[61] 刘,B。;Yang,F.,2L-piRNA:用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,267-277(2017)
[62] 刘,B。;杨,F。;Huang,D.S.,Ipromoter-2l:通过基于多窗口的PseKNC识别启动子及其类型的双层预测因子,生物信息学,34,33-40(2018)
[63] 刘,T。;郑,X。;王,C。;Wang,J.,使用伪氨基酸成分预测凋亡蛋白的亚细胞位置:自协方差变换方法,蛋白质Pept。莱特。,17, 1263-1269 (2010)
[64] Liu,T.G。;Geng,X.B。;郑晓秋,利用PSI-BLAST谱的自协方差变换精确预测蛋白质结构类,氨基酸,422243-2249(2012)
[65] Meher,P.K。;Sahu,T.K。;塞尼,V。;Rao,A.R.,通过将成分、物理化学和结构特征纳入chou的一般PseAAC,Sci,预测抗菌肽,提高准确性。代表742362(2017)
[66] Moran,P.A.,《连续随机现象注释》,《生物统计学》,37,17-23(1950)·Zbl 0041.45702号
[67] Pacharawongsakda,E。;Theeramunkong,T.,通过半监督学习和chou的PseAAC、IEEE Trans的降维通用模式预测单复合体和多重蛋白质的亚细胞位置。纳米生物科学,12311-320(2013)
[68] 邱建德。;罗,S.H。;黄,J.H。;孙晓勇。;Liang,R.P.,基于小波变换和支持向量机预测凋亡蛋白的亚细胞定位,氨基酸,381201-1208(2010)
[69] 邱伟荣。;孙碧琴。;萧,X。;Xu,Z.C.,IPTM-mlys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123(2016)
[70] Saravanan,V.公司。;Lakshmi,P.T.V.,APSLAP:预测凋亡蛋白亚细胞定位的自适应增强技术,生物学报。,61, 481-497 (2013)
[71] Shen,H.B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。(欧文),163-92(2009)
[72] Su,Z.D.等人,2018年。iloc-lncRNA:通过将八聚体成分纳入一般pseKNC来预测lncRNA的亚细胞位置。生物信息学。10.1093/bioinformatics/bty508;Su,Z.D.等人,2018年。iloc-lncRNA:通过将八聚体成分纳入一般pseKNC来预测lncRNA的亚细胞位置。生物信息学。10.1093/生物信息学/bty508
[73] 铃木,M。;Youle,R.J。;Tjandra,N.,bax的结构:二聚体形成和细胞内位置的协同调节,《细胞》,103,645-654(2000)
[74] Wang,G.L。;Dunbrack,R.L.,《双鱼:蛋白质序列筛选服务器》,生物信息学,19589-1591(2003)
[75] Xiao,X.,Ploc-mgpos:将关键基因本体信息合并到通用pseAAC中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。(欧文),9,10,331-349(2017)
[76] Xiao,X.,Ploc_bal-mgpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[77] Xu,Y。;文,X。;Wen,L.S。;Wu,L.Y.,Initro-tyr:具有一般伪氨基酸组成的蛋白质中硝基酪氨酸位点的预测,PLoS ONE,9,e105018(2014)
[78] X.X.Xuan,X.Cheng,X.,Chen,G.,Mao,Q.,2018年。pLoc_bal-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位。基因组学。2016年10月10日/j.ygeno.2018.05.017;X.X.Xuan,X.Cheng,X.,Chen,G.,Mao,Q.,2018年。pLoc_bal-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位。基因组学。2016年10月10日/j.ygeno.2018.05.017
[79] Yang,H.,IRSpot-Pse6NC:通过将六聚体成分并入普通PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学。,14, 883-891 (2018)
[80] Yao,Y.H。;石振新。;Dai,Q.,基于位置特异性评分矩阵的凋亡蛋白亚细胞位置预测,《计算机理论与纳米科学杂志》,102073-2078(2014)
[81] Yao,Y.H。;Xu,H.M。;何,P.A。;戴琦,蛋白质亚细胞定位预测的最新进展,《组织化学迷你评论》。,12481-492(2015年)
[82] 袁,Z。;Bailey,T.L。;Teasdak,R.D.,蛋白质b因子谱预测,蛋白质,58905-912(2005)
[83] 袁,Z。;Huang,B.,通过支持向量回归预测蛋白质可及表面积,蛋白质,57558-564(2004)
[84] 张长杰。;Tang,H。;李,W.C。;Lin,H。;Chen,W.,Iori-human:通过将二核苷酸的物理化学性质纳入伪核苷酸组成来确定人类复制起源,Oncotarget,76973-69793(2016)
[85] 张,L。;Liao,B。;李博士。;Zhu,W.,使用支持向量机预测凋亡蛋白亚细胞定位的新表示法,J.Theor。生物学,259361-365(2009)·Zbl 1402.92163号
[86] Zhang,S.L。;丁世勇。;Wang,T.M.,基于预测的二级结构对低相似度序列蛋白质结构类的高精度预测,Biochimie,93,710-714(2011)
[87] Zhang,S.L。;Feng,Y。;Yuan,X.G.,使用主成分分析和支持向量机通过PSSM预测低相似度序列的蛋白质结构类别,J.Biomol。结构。动态。,29, 634-642 (2012)
[88] 张振华。;王振华。;Z.R.Zhang。;王玉霞,基于分组权重和支持向量机的结合编码的凋亡蛋白亚细胞定位预测新方法,FEBS Lett。,580, 6169-6174 (2006)
[89] 周国平。;K.博士,凋亡蛋白的亚细胞定位预测,蛋白质结构。功能。遗传学。,50, 44-48 (2003)
[90] 周,X.B。;陈,C。;李,Z.C。;Zou,X.Y.,通过双层支持向量机改进对凋亡蛋白亚细胞位置的预测,氨基酸,35,383-388(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。