×

基于多标记同源知识转移学习的Chou的PseAAC公式预测植物蛋白质亚细胞多定位。 (英语) Zbl 1337.92065号

J.西奥。生物。 310, 80-87 (2012); 更正同上,338111(2013)。
摘要:近年来,蛋白质亚细胞定位的计算建模取得了很大进展。然而,目前用于预测植物蛋白质亚细胞多定位的计算模型还很少。本文提出了一种多标记多核转移学习模型,用于预测植物蛋白质的多亚细胞位置(MLMK-TLM公司). 该方法提出了一个多标签混淆矩阵,并将一对多类概率输出适应于多标签学习场景,在此基础上我们进一步扩展了我们已经发表的工作MK-TLM公司(基于Chou的PseAAC公式的多核转移学习用于蛋白质亚线粒体定位),用于植物蛋白质亚细胞多定位。通过适当的同源知识转移,百万立方米-百万立方米适用于多标签学习场景中的新型植物蛋白亚细胞定位。在植物蛋白基准数据集上的实验表明MLMK-TLM公司优于基准模型。与现有模型不同,百万立方米-百万立方米并报告了其误导性倾向,这对于全面调查模型的多标记性能非常重要。

MSC公司:

92C40型 生物化学、分子生物学
92C80型 植物生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔特舒尔,S。;Madden,T。;Schaffer,A。;张杰。;张,Z。;Miller,W。;Lipman,D.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[2] Ashburner,M.,《基因本体论:生物学统一的工具》。基因本体联盟。,25, 25-29 (2000)
[3] Blum,T。;布里斯梅斯特,S。;Kohlbacher,O.,MultiLoc2:整合系统发育和基因本体术语改进亚细胞蛋白定位预测,BMC生物信息。,10, 274 (2009)
[4] Boeckmann,B.,SWISS-PROT蛋白质知识库及其补充TrEMBL,核酸研究,31,365-370(2003)
[5] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性。,蛋白质:结构。功能。遗传学。(勘误表:同上,2001年,第44、60卷),43、246-255(2001年)
[6] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[7] Chou,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.Biol。化学。,277, 4575-45769 (2002)
[8] Chou,K.C。;Elrod,D.W.,蛋白质亚细胞定位预测,蛋白质工程,12107-118(1999)
[9] Chou,K.C。;Shen,H.B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,《生物化学》。生物物理学。Res.Commun.公司。,347, 150-157 (2006)
[10] Chou,K.C。;沈海斌,《综述:蛋白质亚细胞定位预测的最新进展》,《分析》。生物化学。,370, 1-16 (2007)
[11] Chou,K.C。;沈海波,大规模植物蛋白质亚细胞定位预测,细胞杂志。生物化学。,100, 665-678 (2007)
[12] Chou,K.C。;Shen,H.B.,Cell-PLoc:预测各种生物体中蛋白质亚细胞定位的Web服务器包,《国家协议》,3153-162(2008)
[13] Chou,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2,63-92(2009年),(可从以下网址开放访问)
[14] Chou,K.C。;Shen,H.B.,Cell-PLoc 2.0:一个改进的网络服务器包,用于预测各种生物体中蛋白质的亚细胞定位,《自然科学》。,21090-1103(2010年),(可从以下网址开放访问)
[15] Chou,K.C。;Shen,H.B.,Plant-mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,《公共科学图书馆·综合》,5,e11335(2010)
[16] Chou,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。分子生物学。,30, 275-349 (1995)
[17] Chou,K.C。;吴振聪。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,《公共科学图书馆·综合》,6,e18258(2011)
[18] Chou,K.C。;吴振聪。;Xiao,X.,iLoc Hum:使用累积标记量表预测具有单个和多个位点的人类蛋白质的亚细胞位置,Mol.Bioyst。,8, 629-641 (2012)
[19] 戴伟,杨琦,薛刚,于瑜。促进迁移学习。摘自:2007年第24届机器学习国际会议论文集。;戴伟,杨奇,薛刚,于勇。促进迁移学习。摘自:2007年第24届机器学习国际会议论文集。
[20] Dai,W.,Chen,Y.,Xue,G.,Yang Q.,Yu,Y.翻译学习:跨不同特征空间的迁移学习。In:NIPS 2008年会议记录。;Dai,W.,Chen,Y.,Xue,G.,Yang Q.,Yu,Y.翻译学习:跨不同特征空间的迁移学习。摘自:NIPS 2008年会议记录。
[21] 杜,P。;Li,Y.,通过将假氨基酸组成与分段序列的各种物理化学特征杂交预测蛋白质亚线粒体位置,BMC Bioninform。,7518(2006年)
[22] 杜,P。;曹,S。;Li,Y.,SubChlo:用伪氨基酸组成和证据理论K近邻(ET-KNN)预测蛋白质亚叶绿体位置,J.Theor。生物学,261330-335(2009)·Zbl 1403.92063号
[23] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,使用周的伪氨基酸组成概念预测人类乳头瘤病毒的风险类型,J.Theor。生物学,263203-209(2010)·Zbl 1406.92455号
[24] Georgiou,D.N。;卡拉卡西迪斯,T.E。;涅托,J.J。;Torres,A.,《使用模糊聚类技术和矩阵对氨基酸进行分类及其对周氏伪氨基酸组成的影响》,J.Theor。生物学,257,17-26(2009)·Zbl 1400.92393号
[25] Hoglund,A。;多恩斯,P。;Blum,T。;阿道夫,H。;Kohlbacher,O.,MultiLoc:使用N-末端靶向序列、序列基序和氨基酸组成预测蛋白质亚细胞定位,生物信息学,22,10,1158-1165(2006)
[26] 胡丽莲。;黄,T。;Cai,Y.D。;Chou,K.C.,基于蛋白质相互作用网络的蛋白质分泌入体液预测,《公共科学图书馆·综合》,6,e22989(2011)
[27] 黄,T。;Chen,L。;Cai,Y.D。;Chou,K.C.,《利用图形特性、生物化学和物理化学特性以及功能特性对调控途径进行分类和分析》,《公共科学图书馆·综合》,6,e25297(2011)
[28] 黄,W。;Tunq,C。;Ho,S。;黄,S。;Ho,S.,ProLoc-GO:利用信息型基因本体术语进行基于序列的蛋白质亚细胞定位预测,BMC Bioninform。,9, 80 (2008)
[29] 黄,W。;Tung,C。;黄,S。;Ho,S.,利用GO-氨基酸组成特征预测蛋白质亚核定位,生物系统(2009)
[30] Lee,K。;Chuang,H。;Beyer,A。;Sung,M。;嗯,W。;Lee,B。;Ideker,T.,蛋白质网络显著改善了对多种真核生物亚细胞定位的预测,《核酸研究》,36,20,e136(2008)
[31] Lin,W.Z。;Fang,J.A。;Xiao,X。;Chou,K.C.,iDNA-Prot:使用灰色模型随机森林识别DNA结合蛋白,《公共科学图书馆·综合》,6,e24756(2011)
[32] Mei,S.,基于Chou的PseAAC公式的蛋白质亚线粒体定位多核转移学习,J.Theor。生物学,293121-130(2012)·Zbl 1307.92085号
[33] 梅,S。;王飞,基于氨基酸分类的蛋白质亚核定位光谱核融合,BMC生物信息。,11,补遗1,S17(2010)
[34] 梅,S。;Wang,F。;周,S.,基于基因本体的蛋白质亚细胞定位转移学习,BMC生物信息。,12, 44 (2011)
[35] Mohabatkar,H.,使用Chou的伪氨基酸组成预测细胞周期蛋白,蛋白质肽。莱特。,17, 1207-1214 (2010)
[36] Nakai,K.,蛋白质分类信号和亚细胞定位预测,高级蛋白质化学。,54, 277-344 (2000)
[37] Nakashima,H。;Nishikawa,K.,使用氨基酸组成和残基对频率的细胞内和细胞外蛋白质的区分,J.Mol.Biol。,238, 54-61 (1994)
[38] 潘,S。;杨庆安,迁移学习调查,IEEE Trans。知识。数据工程,22,10,1345-1359(2010)
[39] Pierleoni,A。;Luigi,P。;Fariselli,P。;Casadio,R.,BaCelLo:平衡亚细胞定位预测因子,生物信息学,22,14,e408-e416(2006)
[40] Platt,J.支持向量机的概率输出以及与正则化似然方法的比较。In:大利润分类器的进展。麻省理工学院出版社,1999年。;Platt,J.支持向量机的概率输出以及与正则化似然方法的比较。在:大利润分类器的进展。麻省理工学院出版社,1999年。
[41] 邱建德。;黄,J.H。;Liang,R.P。;Lu,X.Q.,基于Chou伪氨基酸组成概念的G蛋白偶联受体类别预测:基于离散小波变换的方法,Ana。生物化学。,390, 68-73 (2009)
[42] Sahu,S.S。;Panda,G.,一种基于周氏伪氨基酸组成的新特征表示方法,用于蛋白质结构类预测,Compute。生物化学。,34, 320-327 (2010) ·Zbl 1403.92221号
[43] Shen,H.B。;Chou,K.C.,Hum-mPLoc:一种集成分类器,用于通过合并多个位点的样本进行大规模人类蛋白质亚细胞位置预测,Biochem。生物物理学。Res.Commun.公司。,355, 1006-1011 (2007)
[44] Shen,H.B。;Chou,K.C.,《病毒-mPLoc:通过合并多个位点预测病毒蛋白亚细胞位置的融合分类器》,J.Biomol。结构。动态。,28, 175-186 (2010)
[45] Tung,T。;Lee,D.,一种通过整合各种生物数据源改进蛋白质亚细胞定位预测的方法,BMC Bioninform。,10,补遗1,S43(2009)
[46] 王,P。;Xiao,X。;Chou,K.C.,NR-2L:基于序列衍生特征识别核受体亚家族的两级预测因子,《公共科学图书馆·综合》,6,e23505(2011)
[47] Wu,T。;林,C。;Weng,R.,通过两两耦合进行多类分类的概率估计,J.Mach。学习。研究,5975-1005(2004)·Zbl 1222.68336号
[48] 吴振聪。;Xiao,X。;Chou,K.C.,iLoc-Plant:一种多标记分类器,用于预测具有单位点和多位点的植物蛋白质的亚细胞定位,Mol.BioSyst。,7, 3287-3297 (2011)
[49] 吴振聪。;Xiao,X。;Chou,K.C.,iLoc-Gpos:预测单复合体和多重革兰氏阳性细菌蛋白的亚细胞定位的多层分类器,Protein Pept。莱特。,19, 4-14 (2012)
[50] Xiao,X。;吴振聪。;Chou,K.C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。《生物学》,284,42-51(2011)·Zbl 1397.92238号
[51] Xiao,X。;吴振聪。;Chou,K.C.,《预测革兰氏阴性细菌蛋白质亚细胞定位的单位点和多位点多标签分类器》,《公共科学图书馆·综合》,6,e20592(2011)
[52] Yang,Q.,Chen,Y.,Xue,G.,Dai,W.,Yu,Y.通过社交网络进行图像聚类的异构迁移学习。摘自:2009年ACL第47届年会和AFNLP第4届IJCNLP会议记录,第1-9页。;Yang,Q.,Chen,Y.,Xue,G.,Dai,W.,Yu,Y.通过社交网络进行图像聚类的异构迁移学习。载于:2009年ACL第47届年会和AFNLP第4届IJCNLP会议记录,第1-9页。
[53] 周国平。;K博士,凋亡蛋白的亚细胞定位预测,蛋白质:结构。功能。遗传学。,50, 44-48 (2003)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。