×

通过将平均区块和PSSM信息合并到一般PseAAC中,可以高度准确地预测蛋白质自身相互作用。 (英语) Zbl 1393.92016年

摘要:蛋白质能否与伴侣相互作用是基础研究的一项挑战性任务。蛋白质自我作用(SIP)是PPI的一种特殊情况,在细胞功能调节中起着关键作用。由于实验性自交联鉴定的局限性,开发一种基于蛋白质序列预测SIP的有效生物工具非常重要。在这项研究中,我们开发了一种新的计算方法,称为RVM-AB,它结合了相关向量机(RVM)模型和平均块(AB),用于检测蛋白质序列中的SIP。首先,采用平均块(AB)特征提取方法在位置特定评分矩阵(PSSM)上表示蛋白质序列。其次,采用主成分分析(PCA)方法降低AB向量的维数,以减小噪声的影响。然后,利用相关向量机(RVM)算法对RVM-AB的性能进行了评估,并与最新的支持向量机(SVM)分类器和其他现有方法进行了比较酵母人类数据集。通过五次测试实验,RVM-AB模型在酵母人类分别是数据集,显著优于基于SVM分类器的方法和其他先前的方法。实验结果证明了RVM-AB预测模型的有效性和鲁棒性。它可以成为检测SIP的自动决策支持工具。为了促进未来蛋白质组学研究的广泛研究,RVMAB服务器可在网址:http://219.219.62.123:8888/SIP_AB.

MSC公司:

92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul,S.F。;Koonin,E.V.,《利用PSI-BLAST-在蛋白质数据库中发现的工具进行重复的个人资料搜索》,《趋势生物化学》。科学。,23, 11, 444-447 (1998)
[2] Baisamy,L。;Jurisch,N。;Divani,D.,Leucine拉链介导的同源异构化调节AKAP-Lbc的Rho-GEF活性,J.Biol。化学。,280, 15, 15405-15412 (2005)
[3] Breuer,K.,InnateDB:先天免疫及其后的系统生物学-最新更新和持续管理,核酸研究,41,数据库问题,D1228-D1233(2012)
[4] Chang,C.C。;Lin,C.J.,LIBSVM:支持向量机库,ACM Trans。智力。系统。技术。,2, 3, 389-396 (2011)
[5] Chatraryamontri,A.,The BioGRID交互数据库:2015年更新,核酸研究,43,数据库问题,470-478(2015)
[6] Chen,W.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,6,e68(2013)
[7] Chen,W.,iRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,8,3,4208(2017)
[8] Cheng,X.,iATC-mHyb:用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget(2017)
[9] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学。,21, 1, 10-19 (2005)
[10] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273,1,236-247(2011)·Zbl 1405.92212号
[11] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 3, 218 (2015)
[12] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 2337-2358 (2017)
[13] Chou,K.C。;沈海斌,《综述:开发预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 2, 63-92 (2009)
[14] 联合会,U.P.,UniProt:蛋白质信息中心,《核酸研究》,43,D204-D212(2014),(D1)
[15] Dehzangi,A.,通过将基于进化的描述符纳入Chou的一般PseAAC,J.Theor,对革兰氏阳性和革兰氏阴性蛋白进行亚细胞定位。《生物学》,364,284(2015)·Zbl 1405.92092号
[16] Du,Q.,氨基酸主成分分析(AAPCA)及其在蛋白质结构类别预测中的应用,J.Biomol。结构。动态。,23, 6, 635 (2006)
[17] 杜秀全;J.C。;郑婷婷;段,郑;钱福兰,基于集成编码的蛋白质相互作用预测特征提取新方法,国际分子科学杂志。,15, 7, 12731-12749 (2014)
[18] Feng,P.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,确定不同RNA修饰的发生位置。核酸,7155-163(2017),(C)
[19] Feng,P.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,确定不同RNA修饰的发生位置。核酸,7155-163(2017)
[20] Georgiou,D.N.,使用度量空间和模糊集对遗传序列的熵/清晰度的研究,J.Theor。生物学,267,195-105(2010)·Zbl 1410.92084号
[21] Georgiou,D.N。;卡拉卡西迪斯,T.E。;《关于遗传序列、周氏伪氨基酸组成及其与模糊集理论的结合的简短调查》,马特。中国儿童保健,7,1,41-48(2013)
[22] 格里布斯科夫,M。;麦克拉克伦,A.D。;Eisenberg,D.,图谱分析:远缘相关蛋白的检测,Proc。国家。阿卡德。科学。美国,84,13,4355-4358(1987)
[23] Hattori,T.,C/EBP家族转录因子被蛋白酶体降解,但通过形成二聚体而稳定,癌基因,22,9,1273-1280(2003)
[24] Jeong,J.C。;林,X。;Chen,X.W.,《蛋白质功能预测的位置特异性评分矩阵》,IEEE/ACM Trans。计算。生物信息学。,8, 2, 308-315 (2011)
[25] Jia,J.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。生物学,377,47(2015)
[26] Jia,J.,iCar-PseCp:通过蒙特卡罗采样确定蛋白质中的羰基化位点,并将序列耦合效应纳入一般PseAAC,Oncotarget,7,23,34558-34570(2016)
[27] Katsamba,P.,《在钙粘蛋白介导的粘附中链接分子亲和力和细胞特异性》,Proc。国家。阿卡德。科学。美国,106,28,11594-11599(2009)
[28] Khan,M.,Unb-DPC:通过将无偏倚二肽成分纳入Chou的一般PseAAC,J.Theor中,确定分枝杆菌膜蛋白类型。生物学,415,13-19(2017)
[29] Koike,R。;基德拉,A。;Ota,M.,低聚物状态和结构域结构的改变对于具有相同支架的转移酶和水解酶之间的功能转换至关重要,《蛋白质科学》。,18, 10, 2060-2066 (2009)
[30] Launay,G.,MatrixDB,《细胞外基质相互作用数据库:更新内容、新导航器和扩展功能》,《核酸研究》,43,321-327(2015),(D1)
[31] Lin,H.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪k元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,21,12961-12972(2014)
[32] Liu,B.,《Pse-in-One:生成DNA、RNA和蛋白质序列各种模式伪成分的网络服务器》,《核酸研究》,第43期,网络服务器期刊,W65-W71(2015)
[33] Liu,B.,iRSpot-EL:利用集成学习方法识别重组点,生物信息学。,33, 1, 35 (2017)
[34] Liu,B.,iRSpot-EL:利用集成学习方法识别重组点,生物信息学。,33,1,35-41(2017)
[35] Liu,B.,Pse-Analysis:基于伪成分和核方法的DNA/RNA和蛋白质/肽序列分析的python包,Oncotarget,8,8,13338-13343(2017)
[36] 刘,B。;范,Y。;Chou,K.C.,2L-piRNA:用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,C,267(2017)
[37] 刘,B。;Wu,H。;Chou,K.C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,09, 4, 67-91 (2017)
[38] Liu,L.M。;Xu,Y。;Chou,K.C.,iPGK-PseAAC:通过将四个不同层次的氨基酸成对偶联信息合并到一般PseAAC-,Med.Chem中来识别蛋白质中的赖氨酸磷酸甘油化位点(2017)
[39] Liu,X.,SPAR:具有细粒度结构域信息的自交互蛋白质的随机森林预测因子,氨基。酸。,2016年1月11日
[40] Liu,Z.,基于多重属性的自交互蛋白质全蛋白质组预测,分子细胞。蛋白质组学Mcp,12,6,1689-1700(2013)
[41] Meher,P.K.,通过将成分、物理化学和结构特征纳入Chou的一般PseAAC,Sci,预测抗菌肽,从而提高准确性。7号代表(2017年)
[42] Miller,S.,低聚物蛋白质的可及表面积稳定性,《自然》,3286133834-836(1987)
[43] Orchard,S.,The MIntAct project-IntAct作为11个分子相互作用数据库的通用管理平台,《核酸研究》,42,358-363(2014)
[44] Pitre,S.,PIPE:一种基于已知相互作用蛋白质对之间重新出现的短多肽序列的蛋白质-蛋白质相互作用预测引擎,BMC Bioinf。,7, 10, 763-769 (2006)
[45] 邱,W.R.,iPhos-PseEn:通过将不同的伪成分融合到集成分类器中来识别蛋白质中的磷酸化位点,Oncotarget,7,32,51270-51283(2016)
[46] 邱,W.R.,iPTM-mLys:鉴定多个赖氨酸PTM位点及其不同类型,生物信息学。,32, 20, 3116 (2016)
[47] 邱,W.R.,iHyd-PseCp:通过将序列偶联效应纳入一般PseAAC来识别蛋白质中的羟脯氨酸和羟赖氨酸,Oncotarget,7,28,44310-44321(2016)
[48] 邱,W.R.,iPhos-PseEvo:通过灰色系统理论将进化信息纳入一般PseAAC,识别人类磷酸化蛋白质,Mol.Inf(2017)
[49] 邱,W.R.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,25,41178(2017)
[50] 拉希米,M。;巴赫蒂亚利扎德,M.R。;Mohammadisangcheshmeh,A.,OOgenesis_Pred:一种基于序列的方法,通过六种不同模式的Chou伪氨基酸组成预测卵子发生蛋白,J.Theor。生物学,41412128-136(2017)
[51] Salwinski,L.,《相互作用蛋白质数据库:2004年更新》,《核酸研究》,32,22,D449-D451(2004)
[52] Su,Q.,通过支持向量回归预测芳香化合物对梨形四膜虫的水生毒性,Oncotarget(2017)
[53] Tipping,M.E.,稀疏贝叶斯学习和相关向量机,J.Mach。学习。第1、3、211-244号决议(2001年)·Zbl 0997.68109号
[54] Wei,C.,iRNA-PseU:识别RNA假尿苷位点,分子疗法。核酸,5,7,e332(2016)
[55] Wei,C.,iRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,8,3,4208(2017)
[56] Woodcock,J.M.,14-3-3ζ的二聚体与单体状态由二聚体界面处Ser58的磷酸化控制,J.Biol。化学。,278, 38, 36323-36327 (2003)
[57] Xia,J.F。;Han,K。;Huang,D.S.,利用旋转森林和自相关描述符对蛋白质相互作用进行基于序列的预测,protein Pept。莱特。,17, 1, 137-145 (2010)
[58] Xiang,C.,iATC-mISF:用于预测解剖治疗化学物质类别的多标签分类器,生物信息学。(2016)
[59] Xu,Y.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,2,e55844(2013)
[60] Xu,Y.,iPreny-PseAAC:通过将两层序列偶联结合到PseAAC中来鉴定蛋白质中的C-末端半胱氨酸预酰化位点,Med.Chem。,13, 999 (2017), 1-1
[61] Yan,X.,iSNO-AAPair:将氨基酸成对偶联到PseAAC中以预测蛋白质中半胱氨酸S-亚硝基化位点,Peerj,1,e171(2013),(文章e171)
[62] Zahiri,J.,PPIevo:基于PSSM进化信息的蛋白质相互作用预测,基因组学,102,4,237-242(2013)
[63] Zahiri,J.,LocFuse:《利用蛋白质定位信息通过分类器融合预测人类蛋白质相互作用》,《化学评论》。Soc.,104,6,496-503(2014)
[64] 钟文忠。;周世芳,药物开发与生物医学分子科学,国际分子科学杂志。,15, 11, 20072 (2014)
[65] 周国平。;钟伟忠,《药物化学展望》,现任。顶部。医药化学。,2016年4月16日
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。