×

Bi-PSM:用于鉴定分枝杆菌膜蛋白的基于位置特异性评分矩阵的智能计算模型。 (英语) Zbl 1394.92002号

摘要:分枝杆菌是一种致病细菌,是结核病和麻风病的病原体。这些疾病非常重要,每年都会导致世界上数百万人死亡。因此,原生动物膜蛋白的特征结构在药物发现领域发挥着至关重要的作用,因为在不了解这种分枝杆菌膜蛋白及其类型的情况下,科学家们无法治疗这种致病原生动物。因此,需要一个准确且有竞争力的计算模型来描述分枝杆菌这种无特征的结构。在这方面进行了一系列尝试。拆分氨基酸组成、未偏倚二肽组成(Unb-DPC)、过度表达的三肽组成、组成和翻译是不同研究人员在其出版物中采用的少数最新编码技术。虽然这些模型已经取得了相当大的成果,但本研究仍有一个空白需要填补。在本研究中,应用进化特征提取技术位置特异性评分矩阵(PSSM)从蛋白质序列中提取进化信息。因此,学习算法的准确率达到99.6%。实验结果表明,所提出的计算模型将为抗分枝杆菌药物开发一个强大的工具,并在蛋白质组学和生物信息学中发挥重要作用。

MSC公司:

92-08 生物问题的计算方法
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Afridi,T.H。;A.Khan。;Lee,Y.S.,Mito-GSAAC:使用遗传集成分类器和分裂氨基酸组成预测线粒体,《氨基酸》,42,1443-1454(2012)
[2] 艾哈迈德,S。;卡比尔,M。;Hayat,M.,《通过将二肽成分纳入Chou的一般PseAAC,Compute,鉴定热休克蛋白家族和J蛋白类型》。方法。程序。生物识别。,122, 165-174 (2015)
[3] 阿里,S。;马吉德,A。;Khan,A.,IDM-PhyChm-Ens:利用氨基酸的物理化学性质对人类乳腺癌进行分类的智能决策集成方法,46,977-993(2014)
[4] Altschul,S.F。;Koonin,E.V.,《利用PSI-BLAST-在蛋白质数据库中发现的工具进行重复的个人资料搜索》,《趋势生物化学》。科学。,23, 444-447 (1998)
[5] 安,Y。;Wang,J。;李,C。;Leier,A。;Marquez-Lago,T。;Wilksch,J。;Zhang,Y。;韦伯,G.I。;宋,J。;Lithgow,T.,细菌分泌系统III、IV和VI效应蛋白预测因子的综合评估和性能改进,生物信息素简报。(2016),bbw100
[6] Bartenhagen,C。;Klein,H.-U。;拉克特,C。;蒋,X。;Dugas,M.,微阵列基因表达数据可视化的无监督降维技术比较研究,BMC Bioinf。,11, 567 (2010)
[7] M.J.Berardi。;Shih,W.M。;哈里森,S.C。;Chou,J.J.,通过核磁共振分子片段搜索确定线粒体解偶联蛋白2结构,《自然》,476,109-113(2011)
[8] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32 (2001) ·Zbl 1007.68152号
[9] 蔡,Y.-D。;Lin,S.L.,从氨基酸序列预测rRNA-、RNA-和DNA-结合蛋白的支持向量机,Biochim。生物物理学。《学报》,1648127-133(2003)
[10] 蔡,Z。;徐,D。;张,Q。;张杰。;Ngai,S.-M。;Shao,J.,使用基于集成的特征选择和机器学习方法对肺癌进行分类,分子生物学系统。,11, 791-800 (2015)
[11] 陈,C。;Chen,L。;邹,X。;Cai,P.,利用周氏伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein Pept。莱特。,16, 27-31 (2009)
[12] Chen,W。;丁·H。;冯·P。;林,H。;Chou,K.-C.,iACP:一种基于序列的抗癌肽识别工具,Oncotarget,716895(2016)
[13] Chen,W。;冯·P。;Yang,H。;丁·H。;林,H。;Chou,K.-C.,iRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,84208(2017)
[14] Cheng,X。;赵,S.-G。;Xiao,X。;Chou,K.-C.,iATC-mISF:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346(2016)
[15] 周锦川,利用配对氨基酸组成预测蛋白质二级结构含量,蛋白质化学杂志。,18, 473-480 (1999)
[16] Chou,K.-C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[17] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theoret。生物学,273236-247(2011)·Zbl 1405.92212号
[18] Chou,K.-C.,《关于预测分子生物系统中多标签属性的一些评论》,《分子生物学》。,9, 1092-1100 (2013)
[19] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[20] 周,K.-C。;Shen,H.-B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,生物化学。生物物理学。Res.Commun.公司。,347, 150-157 (2006)
[21] 周,K.-C。;Shen,H.-B.,革兰氏阴性细菌蛋白质亚细胞位置的大尺度预测,《蛋白质组研究杂志》,53420-3428(2006)
[22] 周,K.-C。;Shen,H.-B.,通过融合优化的证据理论K最近邻分类器预测真核蛋白亚细胞位置,《蛋白质组研究杂志》,51888-1897(2006)
[23] 周,K.-C。;Shen,H.-B.,MemType-2L:通过Pse-PSSM和Biochem结合进化信息预测膜蛋白及其类型的网络服务器。生物物理学。Res.Commun.公司。,360, 339-345 (2007)
[24] 周,K.-C。;Shen,H.-B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63 (2009)
[25] 周,《生物科学进步推动的药物化学的空前革命》,Curr。主题医学化学(2017)
[26] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[27] 德夫·J。;帕克·D。;傅琦。;陈,J。;哈·H·J。;Ghantous,F。;Herrmann,T。;Chang,W。;刘,Z。;Frey,G.,HIV-1包膜钉膜锚固的结构基础,《科学》,353172-175(2016)
[28] 丁·C·H。;Dubchak,I.,使用支持向量机和神经网络的多类蛋白质折叠识别,生物信息学,17,349-358(2001)
[29] 丁·H。;邓永中。;袁,L.-F。;刘,L。;林,H。;Chen,W。;Chou,K.-C.,iCTX-Type:一种基于序列的预测因子,用于识别靶向离子通道中芋螺毒素的类型,BioMed。Res.Int.,2014(2014)
[30] 杜,P。;顾S。;Jiao,Y.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014)
[31] 风扇,G.-L。;Li,Q.-Z.,通过将伪平均化学位移纳入周氏伪氨基酸组成的一般形式,预测分枝杆菌蛋白质的亚细胞位置,J.Theor。生物,304,88-95(2012)·Zbl 1397.92186号
[32] 冯,P。;丁·H。;Yang,H。;Chen,W。;林,H。;Chou,K.-C.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC来识别不同rna修饰的发生位置,分子治疗,7,155-163(2017)
[33] 傅琦。;Fu,T.-M。;克鲁兹,A.C。;Sengupta,P。;托马斯·S·K。;王,S。;西格尔,R.M。;Wu,H。;Chou,J.J.,Fas/CD95死亡受体膜内三聚化的结构基础和功能作用,分子细胞,61,602-613(2016)
[34] 高Q.-B。;Ye,X.-F。;金,Z.C。;He,J.,《通过融合不同形式的伪氨基酸成分来提高外膜蛋白的区分能力》,Anal。生物化学。,398, 52-59 (2010)
[35] 海亚特,M。;Iqbal,N.,通过将伪平均化学位移合并到Chou的通用PseAAC和支持向量机来识别蛋白质结构类,Compute。方法。生物识别程序。,116, 184-192 (2014)
[36] 海亚特,M。;Khan,A.,MemHyb:通过SAAC和PSSM杂交预测膜蛋白类型,J.Theor。生物,29293-102(2012)·Zbl 1307.92308号
[37] 黄,T。;史晓华。;王,P。;何,Z。;Feng,K.-Y。;胡,L。;孔,X。;李玉霞。;蔡永德。;Chou,K.-C.,《基于序列特征、亚细胞位置和相互作用网络的蛋白质代谢稳定性分析和预测》,PloS one,5,e10972(2010)
[38] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iCar-PseCp:通过蒙特卡罗采样确定蛋白质中的羰基化位点,并将序列耦合效应纳入一般PseAAC,Oncotarget,734558(2016)
[39] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iPPBS-Opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集来识别蛋白质结合位点,Molecules,21,95(2016)
[40] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[41] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.C.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[42] 卡比尔,M。;Hayat,M.,iRSpot-GAEnsC:通过集成分类器识别重组点,并将Chou的PseAAC概念扩展到DNA样本Mol.Genet。基因组学,291285-296(2016)
[43] 卡比尔,M。;伊克巴尔,M。;艾哈迈德,S。;Hayat,M.,iTIS-SeKNC:使用伪k元组核苷酸组成识别人类基因中的翻译起始位点,计算。生物医学,66,252-257(2015)
[44] A.Khan。;M.Khan。;Choi,T.-S.,变换域中基于邻近性的GPCR预测,生物化学。生物物理学。Res.Commun.公司。,371, 411-415 (2008)
[45] M.Khan。;海亚特,M。;Khan,S.A。;Iqbal,N.,Unb-DPC:通过将非偏倚二肽成分纳入Chou的一般PseAAC,J.Theor,来识别分枝杆菌膜蛋白类型。生物学,415,13-19(2017)
[46] 库马尔,M。;格罗米哈,M.M。;Raghava,G.P.,利用结合残基和进化信息基于SVM预测RNA结合蛋白,《分子识别杂志》。,24, 303-313 (2011)
[47] 李毅。;魏德清。;高,W.N。;高,H。;刘,B.-N。;黄,C.-J。;Xu,W.-R。;刘德康。;陈海峰。;Chou,K.-C.,恶唑烷酮作为抗菌剂的药物设计计算方法,医学化学,3576-582(2007)
[48] Lin,H.,利用周氏伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.Theor。《生物学》,252350-356(2008)·兹比尔1398.92076
[49] 林,H。;邓永中。;丁·H。;Chen,W。;Chou,K.-C.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪K元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[50] 林,H。;丁·H。;郭,F.-B。;张亚勇。;黄,J.,利用周氏伪氨基酸组成预测分枝杆菌蛋白质的亚细胞定位,蛋白质Pept。莱特。,15, 739-744 (2008)
[51] 林,S.-X。;Lapointe,J.,《理论与实验生物学》,为纪念周国庆教授50周年和理查德·吉格教授科学生涯40周年,J.Biomed举办的研讨会。科学。工程,6435(2013)
[52] 刘,B。;王,S。;朗·R。;Chou,K.-C.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2016)
[53] 刘,B。;Wu,H。;Chou,K.-C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,9, 67 (2017)
[54] 刘,B。;杨,F。;Chou,K.-C.,2L-piRNA:识别piwi相互作用RNA及其功能的双层集成分类器,分子治疗,7,267-277(2017)
[55] 刘,L。;Xu,Y。;Chou,K.,iPGK-PseAAC:通过将四个不同层次的氨基酸成对偶联信息合并到一般PseAAC-Med.Chem(2017)中,确定蛋白质中的赖氨酸磷酸甘油化位点
[56] 刘,T。;郑,X。;Wang,J.,使用支持向量机和PSI-BLAST剖面预测低相似度序列的蛋白质结构类别,Biochimie,921330-1334(2010)
[57] 刘,Z。;Xiao,X。;邱伟荣。;Chou,K.-C.,iDNA-Methyl:通过伪三核苷酸组成识别DNA甲基化位点,Ana。生物化学。,474, 69-77 (2015)
[58] Madden,T.,BLAST序列分析工具(2013)
[59] 马格兰,M。;联合会,美国,《UniProt知识库:集成蛋白质数据中心》,2011年(2011年),bar009
[60] Meher,P.K。;Sahu,T.K。;塞尼,V。;Rao,A.R.,通过将成分、物理化学和结构特征纳入Chou的一般PseAAC,Sci,预测抗菌肽,提高准确性。7号代表(2017年)
[61] Niederweis,M。;Danilchanka,O。;赫夫,J。;霍夫曼,C。;Engelhardt,H.,《分枝杆菌外膜:寻找蛋白质》,《微生物趋势》。,18, 109-116 (2010)
[62] 欧阳,B。;谢S。;M.J.Berardi。;X.赵。;德夫·J。;于伟(Yu,W.)。;Sun,B。;Chou,J.J.,丙型肝炎病毒p7通道的异常结构,《自然》,498,521-525(2013)
[63] 类氧化剂,K。;Dong,Y。;曹,C。;崔,T。;桑卡,Y。;Markhard,A.L。;格拉巴雷克,Z。;Kong,L。;刘,Z。;欧阳,B.,线粒体钙单转运蛋白的结构,《自然》(2016)
[64] Pajón,R。;耶罗,D。;Lage,A。;Llanes,A。;Borroto,C.J.,结核分枝杆菌中β-桶外膜蛋白的计算鉴定预测蛋白质组作为候选疫苗,结核病(爱丁堡),86,3-4,290-302(2006)
[65] 彭,H。;长,F。;Ding,C.,基于最大依赖性、最大相关性和最小冗余度的互信息标准的特征选择,IEEE Trans。帕特。分析。机器。智力。,27, 1226-1238 (2005)
[66] 邱伟荣。;Xiao,X。;徐,Z.C。;Chou,K.-C.,iPhos-PseEn:通过将不同的伪成分融合到集成分类器中来识别蛋白质中的磷酸化位点,Oncotarget,751270-51283(2016)
[67] 邱伟。;江,S。;Sun,B。;Xiao,X。;Cheng,X。;Chou,K.,iRNA-2methyl:通过将序列偶联效应纳入通用PseKNC和集成分类器来鉴定RNA 2′-O-甲基化位点,Med.Chem(2017)
[68] Rezaei,医学硕士。;Abdolmaleki,P。;Z.卡拉米。;Asadabadi,E.B。;医学硕士Sherafat。;Abrishami-Moghaddam,H。;法代,M。;Forouzanfar,M.,《利用小波分析和级联神经网络预测膜蛋白类型》,J.Theor。生物学,254817-820(2008)
[69] Schäffer,A.A。;Aravind,L。;Madden,T.L。;沙维林,S。;斯普格,J.L。;Wolf,Y.I。;Koonin,E.V。;Altschul,S.F.,《利用基于成分的统计数据和其他改进提高PSI-BLAST蛋白质数据库搜索的准确性》,《核酸研究》,29,2994-3005(2001)
[70] Schnell,J.R。;Chou,J.J.,甲型流感病毒M2质子通道的结构和机制,《自然》,451,591-595(2008)
[71] 邵,J。;徐,D。;胡,L。;关永伟。;Wang,Y。;孔,X。;Ngai,S.-M.,《人类赖氨酸乙酰化蛋白的系统分析和通过双相关自适应二项式评分Bayes特征表示准确预测人类赖氨酰化》,Mol.BioSyst。,8, 2964-2973 (2012)
[72] 沈海波。;Chou,K.C.,Gneg-mPLoc:一种自顶向下的策略,用于提高预测革兰氏阴性细菌蛋白质亚细胞定位的质量,J.Theor。生物学,264326-333(2010)·兹比尔1406.92211
[73] 沈,H。;Chou,K.-C.,使用优化的证据理论K最近邻分类器和伪氨基酸组成预测膜蛋白类型,《生物化学》。生物物理学。Res.Commun.公司。,334, 288-292 (2005)
[74] Walzer,G。;罗森博格,E。;Ron,E.Z.,《通过预测β-桶区域识别具有乳化活性的外膜蛋白》,微生物学杂志。方法。,76, 52-57 (2009)
[75] Wang,J。;杨,B。;Revote,J。;Leier,A。;Marquez-Lago,T.T。;韦伯,G。;宋,J。;周,K.-C。;Lithgow,T.,POSSUM:基于PSSM剖面生成数字序列特征描述符的生物信息学工具包,生物信息学(2017)
[76] 王,M。;杨,J。;刘国平。;徐,Z.-J。;Chou,K.-C.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计。选择。,17, 509-516 (2004)
[77] Xiao,X。;Min,J.-L。;林,W.-Z。;刘,Z。;Cheng,X。;Chou,K.C.,iDrug-Target:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。动态。,33, 2221-2233 (2015)
[78] Xiao,X。;王,P。;林,W.-Z。;贾俊华。;Chou,K.-C.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177 (2013)
[79] Xiao,X。;吴振中。;Chou,K.-C.,预测革兰氏阴性细菌蛋白质亚细胞定位的单位点和多位点多标签分类器,PloS one,6,e20592(2011)
[80] Xiao,X。;叶海霞。;刘,Z。;贾俊华。;Chou,K.-C.,iROS-gPseKNC:通过将二核苷酸位置特异性倾向纳入一般伪核苷酸组成来预测DNA中的复制起始位点,Oncotarget,734180(2016)
[81] 谢,Y。;李,X。;恩盖,E。;Ying,W.,使用改进的平衡随机森林进行客户流失预测,专家系统。申请。,36445-5449(2009年)
[82] Xu,Y。;Wang,Z。;李,C。;Chou,K.,iPreny-PseAAC:通过将两层序列偶联纳入PseAAA,Med.Chem,鉴定蛋白质中的C-末端半胱氨酸丙酰化位点。(2017)
[83] Youn,E。;彼得斯,B。;Radivojac,P。;Mooney,S.D.,新型折叠中催化残基预测的特征评估,蛋白质科学。,16, 216-226 (2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。