×

通过将一个新的特征集合并到Chou的通用PseAAC中来预测膜蛋白类型。 (英语) 兹比尔1406.92470

摘要:膜蛋白是一种重要的蛋白质,在细胞中充当通道、受体和能量传感器。它们执行各种重要功能,这些功能主要与它们的类型有关。它们也是各种疾病药物研发的诱人目标。因此,预测膜蛋白类型是生物信息学和蛋白质组学中一个关键而富有挑战性的研究领域。由于对数据库中未标记的蛋白质序列进行了大量的调查,传统的生物物理技术非常繁琐、昂贵,并且容易出错。随后,建立一种强有力、坚实、熟练的技术来预测膜蛋白类型是非常有吸引力的。在这项工作中,提出了一种新的特征集“基于交换群的蛋白质序列表示”(EGBPSR),用于膜蛋白的分类,该特征集采用了两种称为“交换群局部模式”(EGLP)和“氨基酸区间模式”(AIP)的新特征提取策略。决策树分类器通常能很好地处理非平衡数据集和大型数据集。由于采用了非平衡数据集,分析了各种决策树分类器(如决策树(DT)、分类回归树(CART)、集成方法(如adaboost、随机欠采样(RUS)boost、旋转森林和随机森林)的性能。预测膜蛋白类型的总准确率为96.45%。

MSC公司:

92D20型 蛋白质序列,DNA序列
92立方37 细胞生物学
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿里,F。;Hayat,M.,使用投票特征区间结合周的伪氨基酸组成对膜蛋白类型进行分类,J.Theor。生物学,384,78-83(2015)·Zbl 1343.92006年
[2] M.J.Berardi。;Shih,W.M。;Harrison,S.C.,通过核磁共振分子片段搜索确定线粒体解偶联蛋白2结构,《自然》,476,109-113(2011)
[3] Brownlee J.,2015年。https://machinelirningmastery.com; Brownlee J.,2015年。https://machinelirningmastery.com
[4] Butt,A.H。;汗,S.A。;北卡罗来纳州拉苏尔。;Khan,Y.D.,使用基于矩的特征的膜蛋白预测模型,Biomed。Res.国际(2016)
[5] Cai,Y.D。;Chou,K.C.,通过功能域组成和伪氨基酸组成预测膜蛋白类型,J.Theor。生物学,238395-400(2006)·Zbl 1445.92219号
[6] Cai,Y.D。;李嘉图,P.W。;Jen,C.H。;Chou,K.C.,SVM在预测膜蛋白类型中的应用,J.Theor。生物,226,4,373-376(2004)
[7] Cai,Y.D。;周国平。;Chou,K.C.,通过使用功能域组成预测膜蛋白类型的支持向量机,Biophys。J.,84,5,3257-3263(2003)
[8] Cedano,J。;阿洛伊,P。;佩雷斯·彭斯,J.A。;Querol,E.,氨基酸组成与蛋白质细胞位置的关系,《分子生物学杂志》。,266, 594-600 (1997)
[9] Chen,W。;丁·H。;Feng,P.,iACP:识别抗癌肽的基于序列的工具,Oncotarget,716895-16909(2016)
[10] Chen,W。;冯,P.M。;Lin,H.,iRSpot-PseDNC:用伪二核苷酸组成识别重组点,《核酸研究》,41,e68(2013)
[11] Chen,W。;Lei,T.Y。;Jin,D.C.,PseKNC:一种用于生成伪K元组核苷酸组成的灵活网络服务器,分析。生物化学。,456, 53-60 (2014)
[12] Chen,W。;Lin,H.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[13] Chen,Y.K。;Li,K.B.,通过将蛋白质拓扑结构、结构域、信号肽和物理化学性质纳入周氏伪氨基酸组成的一般形式来预测膜蛋白类型,J.Theor。生物学,3181-12(2013)·Zbl 1406.92450号
[14] Chen,W。;冯·P。;Yang,H.,iRNA-3typeA:识别RNA腺苷位点的3种修饰,分子治疗学。核酸(2018)
[15] Cheng,X。;Xiao,X.,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.Biosyst.,预测多位置植物蛋白的亚细胞定位。,13, 1722-1727 (2017)
[16] Cheng,X。;Xiao,X.,pLoc-mVirus:通过将最佳GO信息合并到通用PseAAC中来预测多位置病毒蛋白的亚细胞定位,Gene(勘误表:同上,2018年,第644卷,156-156),628,315-321(2017)
[17] Cheng,X。;Xiao,X.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学(2017)
[18] Cheng,X。;Xiao,X.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学(2017)
[19] Cheng,X。;Xiao,X.,pLoc-mEuk:通过将关键GO信息提取到通用PseAAC中来预测多标签真核蛋白的亚细胞定位,基因组学,110,50-58(2018)
[20] Cheng,X。;Zhao,S.G。;Lin,W.Z.,pLoc-mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,33,3524-3531(2017)
[21] Cheng,X。;Zhao,S.G。;Xiao,X.,iATC mHyb:一种用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget(2017)
[22] Cheng,X。;Zhao,S.G。;Xiao,X.,iATC-mISF:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346(2017)
[23] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。遗传学。,43, 246-255 (2001)
[24] Chou,K.C.,《对BACE2三级结构建模的见解》,J.Proteom。第3号决议,1069-1072(2004年)
[25] Chou,K.C.,《人类钾和钠通道三维结构建模的见解》,J.Proteom。研究,3856-861(2004)
[26] Chou,K.C.,结构生物信息学及其对生物医学科学的影响,当代。医药化学。,11, 2105-2134 (2004)
[27] Chou,K.C.,《DNA-CBF3b复合体三维结构建模的见解》,J.Proteom。第41657-1660号决议(2005年)
[28] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[29] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,9, 1092-1100 (2013)
[30] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[31] Chou,K.C.,生物科学的进步推动了药物化学的一场前所未有的革命,Curr。顶部。医药化学。(2017)
[32] Chou,K.C。;Cai,Y.D.,通过结合两性效应预测膜蛋白类型,《化学杂志》。信息模型。,45, 2, 407-413 (2005)
[33] Chou,K.C。;Cai,Y.D.,《使用GO-PseAA预测因子识别膜蛋白及其类型》,《生物化学》。生物物理学。Res.Commun.公司。,327, 3, 845-847 (2005)
[34] Chou,K.C。;Elrod,D.W.,膜蛋白类型和亚细胞位置的预测,蛋白质结构。功能。生物信息。,34, 1, 137-153 (1999)
[35] Chou,K.C。;Shen,H.B.,MemType-2L:一个通过Pse PSSM整合进化信息来预测膜蛋白及其类型的网络服务器,Biochem。生物物理学。Res.Commun.公司。,360, 2, 339-345 (2007)
[36] 德夫·J。;帕克·D。;傅琦。;陈,J。;哈·H·J。;Ghantous,F。;Herrmann,T。;Chang,W。;刘,Z。;弗雷·G。;Seaman,M.S.,HIV-1包膜钉膜锚固的结构基础,《科学》,353172-175(2016)
[37] 冯,Z.P。;张春涛,基于氨基酸疏水指数的膜蛋白类型预测,蛋白质化学杂志。,19, 269-275 (2000)
[38] 冯·P。;丁·H。;Yang,H。;Chen,W.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,识别不同RNA修饰的发生位点。核酸,7155-163(2017)
[39] 冯·P。;Yang,H。;丁·H。;Lin,H.,iDNA6mA-PseKNC:通过将核苷酸物理化学性质结合到PseKNC中来鉴定DNA N6-甲基腺苷位点,基因组学(2018)
[40] 高庆斌。;Ye,X.F。;Jin,Z.C。;He,J.,《通过融合不同形式的伪氨基酸成分来提高外膜蛋白的区分能力》,J.Anal。生物化学。,398, 52-59 (2010)
[41] Golmohammadi,K.S.K。;克劳利,L。;Reformat,M.,细胞膜蛋白的分类,前沿。生物科学召集人。技术信息。,153-158 (2007)
[42] Golmohammadi,S.K。;库根,L。;克劳利,B。;Reformat,M.,《基于氨基酸序列的细胞膜蛋白类型预测方法》,《国际杂交信息技术杂志》。,1, 1, 95-109 (2008)
[43] Han,G.S。;Yu,Z.G。;Anh,V.,通过将氨基酸分类和物理化学性质纳入Chou的PseAAC,J.Theor的一般形式,预测膜蛋白类型的两阶段SVM方法。生物学,344,31-39(2014)·Zbl 1412.92242号
[44] 海亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,262,10-17(2011)·兹比尔1405.92217
[45] 海亚特,M。;Khan,A.,Mem-PHybrid:基于杂交特征的膜蛋白类型分类预测系统,Ana。生物化学。,424, 35-44 (2012)
[46] 海亚特,M。;Khan,A.,MemHyb:通过SAAC和PSSM杂交预测膜蛋白类型,J.Theor。生物,29293-102(2012)·Zbl 1307.92308号
[47] 海亚特,M。;A.Khan。;酵母素,M.,使用分裂氨基酸和集合分类预测膜蛋白,氨基酸,42,6,2447-2460(2012)
[48] Howe,W.J.,β-分泌酶酶原三级结构的预测,生物化学。生物物理学。Res.Commun.公司。,292, 702-708 (2002)
[49] Huang,C.等人。;Yuan,J.Q.,基于Chou伪氨基酸组成的多标签模型,用于识别具有单一和多功能类型的膜蛋白,J.Membr。生物,246,4,327-334(2013)
[50] 贾,J。;刘,Z。;Xiao,X.,iSuc-PseOpt:通过将序列耦合效应纳入伪成分和优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[51] 贾,J。;刘,Z。;Xiao,X.,iPPBS-Opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集来识别蛋白质结合位点,Molecules,21,95(2016)
[52] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[53] 贾,J。;张,L。;Liu,Z.,pSumo-CD:通过将序列耦合效应纳入一般PseAAC,使用协方差判别算法预测蛋白质中的sumoylation位点,生物信息学,32,3133-3141(2016)
[54] 贾,P。;钱,Z。;Feng,K。;卢·W。;Li,Y.,杂交空间中膜蛋白类型的预测,蛋白质学杂志。第71131-1137号决议(2008年)
[55] Lin,H。;邓,E.Z。;Ding,H.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪k元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[56] 刘,B。;Wu,H.,Pse-in-One 2.0:一个改进的web服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式,自然科学。,9, 67-91 (2017)
[57] 刘,B。;Yang,F.,2L-piRNA:用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,267-277(2017)
[58] 刘,B。;王,S。;Long,R.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2017)
[59] 刘,B。;刘,F。;Wang,X.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,43,W65-W71(2015)
[60] 刘,B。;方,L。;Long,R.,iEnhancer-2L:通过伪k元组核苷酸组成鉴定增强子及其强度的两层预测因子,生物信息学,32,362-369(2016)
[61] 刘,B。;Long,R.,iDHS-EL:通过将三种不同模式的伪核苷酸组成融合到集成学习框架中来识别DNase I超敏位点,生物信息学,32,2411-2418(2016)
[62] 刘,H。;Wang,J.M。;薛,L。;Chou,K.C.,《利用傅里叶光谱分析和伪氨基酸组成预测膜蛋白类型》,《蛋白质杂志》,24,6,385-389(2005)
[63] 刘,H。;王,M。;Chou,K.C.,预测膜蛋白类型的低频傅里叶光谱,生物化学。生物物理学。Res.Commun.公司。,336, 3, 737-739 (2005)
[64] 刘,Z。;Xiao,X。;邱,W.R.,iDNA-甲基:通过伪三核苷酸组成鉴定DNA甲基化位点,Ana。生物化学。,474, 69-77 (2015)
[65] 刘,Z。;Xiao,X。;Yu,D.J.,pRNAm-PC:通过物理化学性质预测RNA序列中的N-甲基腺苷位点,Ana。生物化学。,497, 60-67 (2016)
[66] 刘,B。;Yang,F。;Huang,D.S.,iPromoter-2L:通过基于多窗口的PseKNC识别启动子及其类型的双层预测因子,生物信息学,34,33-40(2018)
[67] Mahdavi,A。;Jahandeh,S.,密度相似性在基于伪氨基酸组成预测膜蛋白类型中的应用,J.Theor。生物学,276132-137(2011)·Zbl 1405.92218号
[68] Nanni,L。;Lumini,A.,直接从氨基酸序列预测膜蛋白类型的支持向量机集合,《氨基酸》,35,3,573-580(2008)
[69] 欧阳,B。;谢S。;M.J.Berardi。;赵晓明。;德夫,J。;Yu,W.,丙型肝炎病毒p7通道的不同寻常架构师,《自然》,498,521-525(2013)
[70] 类氧化剂,K。;Dong,Y.S。;曹,C。;崔,T。;桑卡,Y。;Markhard,A.L。;格拉巴雷克,Z。;Kong,L。;刘,Z。;欧阳,B。;Cong,Y.,线粒体钙单转运蛋白的结构,《自然》,533,269-273(2016)
[71] Pu,X。;郭杰。;Leung,H。;Lin,Y.,《从序列和位置特异性评分矩阵预测膜蛋白类型》,J.Theor。生物学,247,2,259-265(2007)·兹比尔1455.92115
[72] 邱,J.D。;Sun,X.U。;黄,J.H。;Liang,R.P.,基于离散小波变换和支持向量机的膜蛋白类型预测,J.Protein,29114-119(2010)
[73] 邱伟荣。;孙碧琴。;Xiao,X.,iPTM-mLys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123(2016)
[74] Rezaei,医学硕士。;Maleki,P.A。;卡拉米,Z。;Asadabadi,E.B。;医学硕士Sherafat。;莫哈德大坝,K.A。;法代,M。;Forouzanfar,M.,《利用小波分析和级联神经网络预测膜蛋白类型》,J.Theor。生物学,255,817-820(2008)·Zbl 06959978号
[75] 桑卡里,E.S。;Manimegalai,D.,基于不平衡数据集的各种通用PseAAC模式,使用各种决策树分类器预测膜蛋白类型,J.Theor。生物学,435208-217(2017)
[76] Schnell,J.R。;Chou,J.J.,甲型流感病毒M2质子通道的结构和机制,《自然》,451,591-595(2008)
[77] Shen,H.B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63-92 (2009)
[78] 沈,H。;Chou,K.C.,使用优化的证据理论K最近邻分类器和伪氨基酸组成预测膜蛋白类型,《生物化学》。生物物理学。Res.Commun.公司。,334, 1, 288-292 (2005)
[79] 沈海波。;杨,J。;Chou,K.C.,根据伪氨基酸成分预测膜蛋白类型的模糊KNN,J.Theor。生物学,240,1,9-13(2006)·Zbl 1447.92312号
[80] 沈海生。;Chou,K.C.,使用集成分类器识别膜蛋白类型,氨基酸,32,483-488(2007)
[81] 宋,J。;李,F。;Takemoto,K。;Haffari,G.,PREvaIL,《利用机器学习框架中的序列、结构和网络特征推断催化残基的综合方法》,J.Theor。生物学,443125-137(2018)
[82] 宋,J。;Wang,Y。;李,F。;Akutsu,T。;罗林斯,N.D.,iProt-Sub:一个用于准确绘制和预测蛋白酶特异性底物和切割位点的综合软件包,简介。生物信息。(2018)
[83] Wan,S。;Mak,M.W。;Kung,S.Y.,Mem-mEN:通过可解释的弹性网络预测膜蛋白的多功能类型,IEEE/ACM Trans。计算。生物信息学。(2015)
[84] Wan,S。;Mak,M.W。;Kung,S.Y.,识别多功能类型膜蛋白的基准数据,《数据简报》,8,105-107(2016)
[85] Wan,S。;Mak,M.W。;Kung,S.Y.,Mem-ADSVM:识别多功能膜蛋白类型的双层多标记预测因子,J.Theor。《生物》,398,32-42(2016)
[86] Wang,J。;李毅。;王,Q。;你,X。;Man,J.,ProClusEnsem:通过融合不同模式的伪氨基酸组成预测膜蛋白类型,计算。生物医学,42,564-574(2012)
[87] Wang,L。;袁,Z。;陈,X。;周,Z.,用NPE预测膜蛋白类型,IEICE Electron。快递,6397-402(2010)
[88] 王,M。;杨,J。;刘国平。;徐志杰。;Chou,K.C.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计。选择。,17, 6, 509-516 (2004)
[89] 王,M。;杨,J。;Xu,Z.J。;Chou,K.C.,SLLE预测膜蛋白类型,J.Theor。生物学,232,1,7-15(2005)·Zbl 1442.92118号
[90] 王世清。;杨,J。;Chou,K.C.,基于伪氨基酸组成,使用叠加泛化预测膜蛋白类型,J.Theor。生物,242,4,941-946(2006)·Zbl 1447.92315号
[91] Wang,T。;夏,T。;胡晓明,预测膜蛋白类型的几何保持投影算法,J.Theor。生物学,262,2,208-213(2010)·Zbl 1403.92225号
[92] Wang,T。;杨,J。;Shen,H.B。;Chou,K.C.,通过LLDA算法预测膜蛋白类型,protein Pept。莱特。,15, 915-921 (2008)
[93] 吴振聪。;Xiao,X.,iLoc-Hum:使用累积-标签尺度预测人类蛋白质的亚细胞位置,单位点和多位点,分子生物学。,8629-641(2012年)
[94] Xiao,X。;Min,J.L。;Lin,W.Z.,iDrug-Target:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。动态。,33, 2221-2233 (2015)
[95] Xiao,X。;王,P。;Lin,W.Z.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177 (2013)
[96] Xiao,X。;邹海林(Zou,H.L.)。;Lin,W.Z.,iMem-Seq:预测膜蛋白类型的多标记学习分类器,J.Membr。生物,248,4,745-752(2015)
[97] Yang,X.G。;罗瑞英。;Feng,Z.P.,《利用氨基酸和肽组成预测膜蛋白类型》,《生物化学》。生物物理学。Res.Commun.公司。,353, 1, 164-169 (2007)
[98] Yang,H。;邱伟荣。;刘,G。;Guo,F.B.,iRSpot-Pse6NC:通过将六聚体成分纳入一般PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学。(2018)
[99] Zaki,N。;El Hajj,W.,使用结构域间连接子知识预测膜蛋白类型,(生物工程学报(2010)),209-214
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。