×

支持向量机基于集成的迁移学习用于大规模膜蛋白识别。 (英语) Zbl 1411.92082号

摘要:膜蛋白在分子跨膜转运、配体受体识别、细胞间相互作用、酶催化、宿主免疫防御反应和传染病途径中发挥着重要作用。到目前为止,从生物学实验测定和计算建模的角度来看,识别膜蛋白仍然是一个具有挑战性的问题。本作品呈现支持向量机基于集成的膜蛋白识别转移学习模型(SVM-TLM公司). 为了减少计算建模中的数据约束,该方法研究了在概率加权集成学习框架下将同源知识转移到目标膜蛋白的有效性。与基于多核学习的迁移学习模型相比,该方法具有以下优点稀疏基于支持向量机对大数据进行优化,从而提高大型蛋白质数据分析的计算效率。在大型膜蛋白基准数据集上的实验表明SVM-TLM公司实现了比基线模型更好的交叉验证性能。

MSC公司:

92立方37 细胞生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul,S。;Madden,T。;Schaffer,A。;张杰。;张,Z。;Miller,W。;Lipman,D.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[2] 巴雷尔,D。;调光器,E。;亨特利·R·P。;宾斯,D。;奥多诺万,C。;Apweiler,R.,《2009年GOA数据库——综合基因本体论注释资源》,核酸研究,37,D396-D403(2009)
[3] Blum,T。;Briesemeister,S。;Kohlbacher,O.,MultiLoc2:集成系统发育和基因本体术语改进亚细胞蛋白定位预测,BMC生物信息学,10274(2009)
[4] Boeckmann,B.,SWISS-PROT蛋白质知识库及其补充TrEMBL,核酸研究,31365-370(2003)
[5] 周,K。;Cai,Y.,利用GO-FunD-PseAA预测因子预测蛋白质亚细胞位置,生物化学和生物物理研究通讯,3201236-1239(2004)
[6] Chou,K.C。;Cai,Y.,通过结合基因本体论预测蛋白质亚细胞定位的新混合方法,生物化学和生物物理研究通讯,311743-747(2003)
[7] Chou,K.C。;Cai,Y.D.,使用功能域组成和支持向量机预测蛋白质亚细胞位置,生物化学杂志,27745765-45769(2002)
[8] Chou,K.C。;沈浩,大尺度植物蛋白质亚细胞定位预测,细胞生物化学杂志,100665-678(2007)
[9] Chou,K.C。;Shen,H.B.,Euk-mPLoc:通过合并多个位点进行大规模真核蛋白质亚细胞定位预测的融合分类器,蛋白质组研究杂志,61728-1734(2007)
[10] Chou,K.C。;Shen,H.B.,Cell-PLoc:预测各种生物体中蛋白质亚细胞定位的网络服务器包,《自然协议》,3153-162(2008)
[11] Chou,K.C。;Shen,H.B.,《植物mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力》,PLoS One,5,e11335(2010)
[12] Chou,K.C。;吴振聪。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,《公共科学图书馆·综合》,6,e18258(2011)
[13] Dijk,A。;博世,D。;布拉克,C。;克罗尔,A。;Ham,R.,预测II型膜蛋白的高尔基体下定位,生物信息学,24,16,1779-1786(2008)
[14] Dong,J。;亚当·K。;Ching,Y。;Fast,S.V.M.,在超大数据集上分解的训练算法,IEEE模式分析和机器智能汇刊,27,4(2005)
[15] Hoglund,A。;多恩斯,P。;Blum,T。;阿道夫,H。;Kohlbacher,O.,MultiLoc:使用N-末端靶向序列、序列基序和氨基酸组成预测蛋白质亚细胞定位,生物信息学,22,10,1158-1165(2006)
[16] 黄,W。;Tunq,C。;Ho,S。;黄,S。;Ho,S.,ProLoc-GO:利用信息型基因本体术语进行基于序列的蛋白质亚细胞定位预测,BMC生物信息学,9,80(2008)
[17] 黄,W。;Tung,C。;黄,S。;Ho,S.,利用GO-氨基酸组成特征预测蛋白质亚核定位,生物系统(2009)
[18] Lee,K。;Chuang,H。;Beyer,A。;Sung,M。;嗯,W。;Lee,B。;Ideker,T.,蛋白质网络显著改善了对多种真核生物亚细胞定位的预测,核酸研究,36,20,e136(2008)
[19] 雷,J。;江,B。;Shen,H.B.,GFO:优化计算生物学中基于高斯函数的相似性度量的数据驱动方法,神经计算,99,307-315(2013)
[20] Mak,M。;郭杰。;Kung,S.,PairProSVM:基于局部成对剖面对齐和SVM的蛋白质亚细胞定位,IEEE/ACM计算生物学和生物信息学汇刊,5,3,416-422(2008)
[21] Mei,S.,《人类蛋白质亚细胞定位的多标签多核转移学习》,《公共科学图书馆·综合》,7,6,e37716(2012)
[22] Mei,S.,基于Chou的PseAAC公式的蛋白质亚线粒体定位多核转移学习,理论生物学杂志,293121-130(2012)·Zbl 1307.92085号
[23] 梅,S。;Fei,Wang,基于氨基酸分类的蛋白质亚核定位光谱核融合,BMC生物信息学,11,补遗1,S17(2010)
[24] 梅,S。;Wang,F。;Zhou,S.,基于基因本体的蛋白质亚细胞定位转移学习,BMC生物信息学,12,44(2011)
[25] 潘,S。;Yang,Q.A.,迁移学习调查,IEEE知识与数据工程汇刊,22,10,1345-1359(2010)
[26] Pierreoni,A。;Luigi,P。;Fariselli,P。;Casadio,R.,BaCelLo:平衡定位预测因子,生物信息学,22,14,e408-e416(2006)
[27] Pierreoni,A。;Martelli,P。;Casadio,R.,MemLoci:预测真核生物膜蛋白的亚细胞定位,生物信息学,27,9,1224-1230(2011)
[28] Platt,J.,《支持向量机的概率输出以及与正则化似然方法的比较》,《大边缘分类器的进展》(1999),麻省理工学院出版社:麻省理学院出版社剑桥
[29] 萨多夫斯基,P。;格伦,A。;杜普利,P。;Lilley,K.,膜蛋白的亚细胞定位,蛋白质组学,8,3991-4011(2008)
[30] Shen,H.B。;Chou,K.C.,Gneg-mPLoc:一种自顶向下的策略,用于提高预测革兰氏阴性细菌蛋白质亚细胞定位的质量,《理论生物学杂志》,264,326-333(2010)·Zbl 1406.92211号
[31] Shen,H.B。;Chou,K.C.,《病毒-mPLoc:通过结合多个位点预测病毒蛋白亚细胞位置的融合分类器》,《生物分子结构与动力学杂志》,28,2,175-186(2010)
[32] Shen,H.B。;Yanq,J。;Chou,K.C.,Euk-PLoc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67(2007)
[33] Tung,T。;Lee,D.,《通过整合各种生物数据源改进蛋白质亚细胞定位预测的方法》,BMC生物信息学,10,Suppl.1,S43(2009)
[34] Wu,T。;林,C。;Weng,R.,通过两两耦合进行多类分类的概率估计,机器学习研究杂志,5,975-1005(2004)·Zbl 1222.68336号
[35] Xiao,X。;吴振聪。;Chou,K.C.,iLoc-Virus:一种多标签学习分类器,用于识别单位点和多位点病毒蛋白的亚细胞定位,《理论生物学杂志》,284,42-51(2011)·Zbl 1397.92238号
[36] Xiao,X。;吴振聪。;Chou,K.C.,《预测革兰氏阴性细菌蛋白质亚细胞定位的单位点和多位点多标签分类器》,《公共科学图书馆·综合》,6,e20592(2011)
[37] 尹,J。;李·T。;Shen,H.B.,《高斯核优化:复杂问题和简单解决方案》,神经计算,743816-3822(2011)
[38] Yu,D。;吴,X。;Shen,H.B。;杨,J。;唐,Z。;齐,Y。;Yang,J.,通过多视角特征的并行融合增强膜蛋白亚细胞定位预测,IEEE纳米生物科学汇刊,11,4,375-385(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。