×

基于Chou的PseAAC公式的多核转移学习用于蛋白质亚线粒体定位。 (英语) Zbl 1307.92085号

J.西奥。生物。 293, 121-130 (2012); 更正同上,第338、112页(2013年)。
摘要:蛋白质亚细胞器定位,如亚线粒体,似乎比一般蛋白质亚细胞定位更具挑战性,因为用荧光成像技术确定蛋白质在细胞器内的微观定位将面临更多困难。到目前为止,用于蛋白质亚线粒体定位的计算方法很少,现有的基于序列的预测模型表现出中等或不令人满意的性能。最近的研究表明,基因本体(GO)是一种有效的蛋白质亚细胞定位特征。然而,对于新的蛋白质或注释稀疏的蛋白质亚家族,GO信息可能不可用。针对这个问题,我们将同源性的GO信息传递给目标蛋白,并提出了一种用于蛋白质亚线粒体定位的多核转移学习模型(MK-TLM),该模型大大扩展了我们之前发表的工作(基于基因本体的蛋白质亚细胞定位转移学习模型,GO-TLM)。为了降低过高估计性能的风险,我们在乐观的案例,适度的案例和悲观的根据靶蛋白GO信息的丰度。亚线粒体基准数据集的实验表明,MK-TLM显著优于基准模型,并且在新的线粒体蛋白和那些属于我们所知甚少的亚家族的线粒体蛋白方面表现出优异的性能。

MSC公司:

92C40型 生物化学、分子生物学
92D20型 蛋白质序列,DNA序列
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul,S。;Madden,T。;Schaffer,A。;张杰。;张,Z。;Miller,W。;李普曼·D·布拉斯特(Lipman D.Gapped);PSI-BLAST,A.,新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[2] Blum,T。;Briesemeister,S。;Kohlbacher,O.,MultiLoc2:集成系统发育和基因本体术语改进亚细胞蛋白定位预测,BMC生物信息学,10274(2009)
[3] Boeckmann,B.,SWISS-PROT蛋白质知识库及其补充TrEMBL,核酸研究,第31卷,365-370(2003)
[4] 陈,C。;Chen,L。;邹,X。;Cai,P.,利用周氏伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein Pept。莱特。,16, 27-31 (2009)
[5] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。遗传学。,43,246-255(2001),(勘误表:同上,2001年,第44卷,第60页)
[6] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[7] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[8] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[9] Chou,K.C。;Cai,Y.,一种通过结合基因本体论预测蛋白质亚细胞定位的新混合方法,Biochem。生物物理学。Res.Commun.公司。,311, 743-747 (2003)
[10] Chou,K.C。;Cai,Y.,利用GO-FunD-PseAA预测因子预测蛋白质亚细胞位置,生物化学。生物物理学。Res.Commun.公司。,320, 1236-1239 (2004)
[11] Chou,K.C。;Shen,H.B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,《生物化学》。生物物理学。Res.Commun.公司。,347, 150-157 (2006)
[12] Chou,K.C。;Shen,H.B.,Euk-mPLoc:通过合并多个位点进行大规模真核蛋白亚细胞定位预测的融合分类器,《蛋白质组研究》,第6期,1728-1734页(2007年)
[13] Chou,K.C。;沈海斌,《大尺度植物蛋白亚细胞定位预测》,细胞杂志。生物化学。,100665-678(2007年)
[14] Chou,K.C。;Shen,H.B.,Cell-PLoc:一个用于预测各种生物体内蛋白质亚细胞定位的Web服务器包(更新版本:Cell-PLoc 2.0:一个用于预计各种生物体内蛋白亚细胞定位改进的Web服务器软件包,自然科学,2010,2,1090-1103),《国家协议》,3,153-162(2008)
[15] Chou,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2,63-92(2009年),(可访问:http://www.scirp.org/journal/NS/〉)
[16] Chou,K.C。;Shen,H.B.,预测单位点和多位点真核蛋白亚细胞定位的新方法EukmPLoc 2.0,PLoS ONE,5,e9931(2010)
[17] Chou,K.C。;Shen,H.B.,Cell-PLoc 2.0:一个改进的网络服务器包,用于预测各种生物体中蛋白质的亚细胞定位,《自然科学》。,21090-1103(2010),(访问网址:〈http://www.scirp.org/journal/NS/〉)
[18] Chou,K.C。;Shen,H.B.,Plant-mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,《公共科学图书馆·综合》,5,e11335(2010)
[19] Chou,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。分子生物学。,30, 275-349 (1995)
[20] Chou,K.C。;吴振聪。;Xiao,X。;iLoc-Euk,A.,预测单复合体和多复合体真核蛋白亚细胞定位的多标签分类器,《公共科学图书馆·综合》,6,e18258(2011)
[21] Dai,W.,Yang,Q.,Xue,G.,Yu,Y.,2007年。促进迁移学习。摘自:第24届机器学习国际会议论文集。;戴伟,杨琼,薛刚,于瑜,2007。促进迁移学习。摘自:第24届机器学习国际会议论文集。
[22] Dai,W.、Chen,Y.、Xue,G.、Yang,Q.、Yu,Y.,2008翻译学习:跨不同特征空间的迁移学习。In:NIPS会议记录。;Dai,W.、Chen,Y.、Xue,G.、Yang,Q.、Yu,Y.,2008翻译学习:跨不同特征空间的迁移学习。收录:NIPS会议记录。
[23] 丁·H。;罗,L。;Lin,H.,利用Chou的两亲性伪氨基酸组成预测细胞壁裂解酶,蛋白质Pept。莱特。,16, 351-355 (2009), 6
[24] 丁·H。;刘,L。;郭富斌。;黄,J。;Lin,H.,用改进的马氏判别算法和伪氨基酸组成识别高尔基体蛋白类型,protein Pept。莱特。,18, 58-63 (2011)
[25] 丁Y.S。;Zhang,T.L.,使用周的伪氨基酸组成预测凋亡蛋白的亚细胞定位:基于免疫遗传算法的集成分类器方法,模式识别Lett。,29, 1887-1892 (2008)
[26] 杜,P。;Li,Y.,通过将假氨基酸成分与分段序列的各种物理化学特征杂交来预测蛋白质亚线粒体位置,BMC生物信息学,7518(2006)
[27] Elstner,M。;安德烈奥利,C。;阿廷,美国。;特科尔,I。;Klopstock,T。;梅廷格,T。;Prokisch,H.,MitoP2:线粒体蛋白质组分析的综合工具,分子生物技术。,40, 306-315 (2008)
[28] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,利用Chou伪氨基酸组成的概念预测人乳头瘤病毒的风险类型,J.Theor。生物学,263203-209(2010)·Zbl 1406.92455号
[29] 方,Y。;郭毅。;Feng,Y。;Li,M.,《预测DNA结合蛋白:从周的伪氨基酸组成和其他特定序列特征探讨》,《氨基酸》,34,103-109(2008)
[30] Georgiou,D.N。;卡拉卡西迪斯,T.E。;尼托·J·J。;Torres,A.,《使用模糊聚类技术和矩阵对氨基酸进行分类及其对周氏伪氨基酸组成的影响》,J.Theor。生物学,257,17-26(2009)·Zbl 1400.92393号
[31] Gottlieb,R.A.,程序性细胞死亡,药物新闻透视。,13, 471-476 (2000)
[32] 顾奇。;丁Y.S。;Zhang,T.L.,使用具有近似熵和疏水性模式的Chou伪氨基酸组成预测低同源性的g蛋白偶联受体类别,protein Pept。莱特。,17, 559-567 (2010)
[33] Guo,J。;拉奥,N。;刘,G。;杨,Y。;Wang,G.,使用周的伪氨基酸组成概念预测蛋白质折叠速率,J.Compute。化学。,32, 1612-1617 (2011)
[34] 何,Z。;张杰。;史晓华(Shi,X.H.)。;胡丽莲。;孔,X。;Cai,Y.D。;Chou,K.C.,基于功能群和生物特征预测药物靶点相互作用网络,《公共科学图书馆·综合》,5,e9603(2010)
[35] 胡,L。;郑,L。;王,Z。;Li,B。;Liu,L.,通过结合一系列蛋白质生物学特性,使用伪氨基酸组成预测蛋白酶家族,protein Pept。莱特。,18552-558(2011年)
[36] 胡,L。;黄,T。;施,X。;卢,W.C。;Cai,Y.D。;Chou,K.C.,基于加权蛋白质相互作用网络和蛋白质杂交特性预测小鼠蛋白质功能,PLoS ONE,6,e14556(2011)
[37] 胡丽莲。;黄,T。;Cai,Y.D。;Chou,K.C.,基于蛋白质相互作用网络的蛋白质分泌入体液预测,《公共科学图书馆·综合》,6,e22989(2011)
[38] 黄,T。;史晓华(Shi,X.H.)。;王,P。;何,Z。;Feng,K.Y。;胡,L。;孔,X。;李玉霞。;Cai,Y.D。;Chou,K.C.,基于序列特征、亚细胞位置和相互作用网络的蛋白质代谢稳定性分析和预测,《公共科学图书馆·综合》,5,e10972(2010)
[39] 黄,T。;牛,S。;徐,Z。;黄,Y。;孔,X。;Cai,Y.D。;Chou,K.C.,基于杂交特性预测多位点p53突变体的转录活性,《公共科学图书馆·综合》,6,e22940(2011)
[40] 黄,W。;Tunq,C。;Ho,S。;黄,S。;Ho,S.,ProLoc-GO:利用信息型基因本体术语进行基于序列的蛋白质亚细胞定位预测,BMC生物信息学,9,80(2008)
[41] 黄,W。;Tung,C。;黄,S。;Ho,S.,利用GO-氨基酸组成特征预测蛋白质亚核定位,生物系统(2009)
[42] Jassem,W。;Fuggle,S.V。;雷拉,M。;Koo,D.D.,ND H.线粒体在缺血/再灌注损伤中的作用,移植,73493-499(2000)
[43] 蒋,X。;魏,R。;Zhang,T.L。;Gu,Q.,使用Chou的伪氨基酸组成概念预测凋亡蛋白的亚细胞位置:一种近似熵方法,Protein Pept。莱特。,15, 392-396 (2008)
[44] 蒋,X。;魏,R。;Zhao,Y。;Zhang,T.,使用基于近似熵的Chou伪氨基酸组成和AdaBoost分类器集合预测蛋白质亚核位置,《氨基酸》,34669-675(2008)
[45] Kandaswamy,K.K。;Pugalenthi,G。;莫勒,S。;哈特曼,E。;Kalies,K.U。;Suganthan,P.N。;Martinetz,T.,通过一种新的伪氨基酸组成模式protein Pept,用遗传算法和支持向量机预测凋亡蛋白位置。莱特。,17, 1473-1479 (2010)
[46] Lee,K。;Chuang,H。;Beyer,A。;Sung,M。;嗯,W。;Lee,B。;Ideker,T.,蛋白质网络显著改善了对多种真核生物亚细胞定位的预测,核酸研究,36,20,e136(2008)
[47] 雷,Z。;Dai,Y.,用基因本体评估蛋白质相似性及其在亚核定位预测中的应用,BMC生物信息学,7491(2006)
[48] 阿什伯恩,《基因本体论:生物学统一的工具》。基因本体联盟。,25, 25-29 (2000)
[49] 李,F.M。;Li,Q.Z.,使用周的伪氨基酸组成和改进的杂交方法预测蛋白质亚细胞位置,protein Pept。莱特。,15, 612-616 (2008)
[50] 李,Z.C。;周,X.B。;戴,Z。;Zou,X.Y.,《通过Chou的伪氨基酸组成预测蛋白质结构类别:使用连续小波变换和主成分分析的方法》,《氨基酸》,37,415-425(2009)
[51] Lin,H.,利用周氏伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.Theor。《生物学》,252350-356(2008)·Zbl 1398.92076号
[52] Lin,H。;王,H。;丁·H。;陈,Y.L。;李庆中,利用周氏伪氨基酸成分预测凋亡蛋白的亚细胞定位,生物学报。,57, 321-330 (2009)
[53] 林,M。;Beal,M.,神经退行性疾病中的线粒体功能障碍和氧化应激,《自然》,44378795(2006)
[54] Lowell,B。;Shulman,G.,线粒体功能障碍与2型糖尿病,《科学》,307384-387(2005)
[55] 梅,S。;Wang,F。;Zhou,S.,基于基因本体的蛋白质亚细胞定位转移学习,BMC生物信息学,12,44(2011)
[56] Mohabatkar,H.,利用周氏伪氨基酸组成预测细胞周期蛋白,蛋白质Pept。莱特。,17, 1207-1214 (2010)
[57] Mohabatkar,H。;穆罕默德·贝吉,M。;Esmaeili,A.,使用Chou的伪氨基酸组成和支持向量机概念预测GABA(A)受体蛋白,J.Theor。生物学,281,18-23(2011)·Zbl 1397.92215号
[58] Nanni,L。;Lumini,A.,《为亚线粒体定位创建周氏伪氨基酸特征的遗传编程》,《氨基酸》,34653-660(2008)
[59] Nanni,L。;鲁米尼,A。;古普塔,D。;Garg,A.,通过融合一组基于Chou伪氨基酸组成变体和进化信息的分类器来识别细菌毒性蛋白,IEEE/ACM Trans。计算。生物信息。(2011)
[60] 潘,S。;杨庆安,迁移学习调查,IEEE Trans。知识。数据工程,22,10,1345-1359(2010)
[61] 邱建德。;黄,J.H。;Liang,R.P。;Lu,X.Q.,基于Chou伪氨基酸组成概念的G蛋白偶联受体类别预测:基于离散小波变换的方法,Ana。生物化学。,390, 68-73 (2009)
[62] 邱建德。;黄,J.H。;史,S.P。;Liang,R.P.,使用Chou的伪氨基酸组成概念预测酶家族类别:基于离散小波变换的支持向量机方法,Protein Pept。莱特。,17, 715-722 (2010)
[63] 邱建德。;索,S.B。;孙晓勇。;史,S.P。;Liang,R.P.,OligoPred:通过将离散小波变换纳入Chou的伪氨基酸组成中来预测同源寡聚体蛋白质的网络服务器,J.Mol.Graph。型号。,30, 129-134 (2011)
[64] Sahu,S.S。;Panda,G.,一种基于周氏伪氨基酸组成的新特征表示方法,用于蛋白质结构类预测,Compute。生物化学。,34, 320-327 (2010) ·兹比尔1403.92221
[65] Shen,H.B。;Chou,K.C.,Hum-mPLoc:一种集成分类器,用于通过合并多个位点的样本进行大规模人类蛋白质亚细胞位置预测,Biochem。生物物理学。Res.Commun.公司。,355, 1006-1011 (2007)
[66] Shen,H.B。;Yanq,J。;Chou,K.C.,Euk-PLoc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67(2007)
[67] Shen,H.B。;Chou,K.C。;病毒mPLoc,A.,通过对多个位点进行体内语料库化来预测病毒蛋白亚细胞位置的融合分类器,J.Biomol。结构。动态。,28,2(2010),国际标准期刊编号:0739-1102
[68] Shi,S.,用伪氨基酸成分识别亚线粒体和亚叶绿体位置:基于离散小波变换特征提取策略的方法,Biochim。生物物理学。《学报》,2011年,424-430(1813)
[69] Tung,T。;Lee,D.,《通过整合各种生物数据源改进蛋白质亚细胞定位预测的方法》,BMC生物信息学,10,Suppl 1,S43(2009)
[70] 王,P。;胡,L。;刘,G。;蒋,N。;陈,X。;徐,J。;郑伟。;李,L。;Tan,M。;陈,Z。;宋,H。;Cai,Y.D。;Chou,K.C.,基于序列比对和特征选择方法的抗菌肽预测,PLoS One,6,e18476(2011)
[71] 王,P。;Xiao,X。;周,K.C。;NR-2L,A.,基于序列衍生特征识别核受体亚家族的两级预测因子,《公共科学图书馆·综合》,6,e23505(2011)
[72] Wang,Y.C。;Wang,X.B。;杨振新。;邓,纽约,通过结合结合三联体特征的伪氨基酸组成预测酶亚科类别,蛋白质Pept。莱特。,17, 1441-1449 (2010)
[73] Xiao,X。;吴振聪。;Chou,K.C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。《生物学》,284,42-51(2011)·兹比尔1397.92238
[74] Xiao,X。;吴振聪。;Chou,K.C.,一种用于预测单位点和多位点革兰氏阴性细菌蛋白亚细胞定位的多标记分类器,PLoS One,6,e20592(2011)
[75] Xiao,X。;王,P。;Chou,K.C.,GPCR-2L:通过杂交两种不同模式的伪氨基酸组成预测G蛋白偶联受体及其类型,分子生物系统,7911-919(2011)
[76] Yang,Q.、Chen,Y.、Xue,G.、Dai,W.、Yu,Y.,2009年。通过社交网络进行图像聚类的异构迁移学习。摘自:ACL第47届年会和AFNLP第4届IJCNLP会议记录,第1-9页。;Yang,Q.、Chen,Y.、Xue,G.、Dai,W.、Yu,Y.,2009年。通过社交网络进行图像聚类的异构迁移学习。摘自:ACL第47届年会和AFNLP第4届IJCNLP会议记录,第1-9页。
[77] Yu,L。;郭毅。;李毅。;李·G。;李,M。;罗,J。;熊,W。;Qin,W.,SecretP:通过将新特征融合到Chou的伪氨基酸组成中来识别细菌分泌的蛋白质,J.Theor。生物学,267,1-6(2010)·Zbl 1410.92040号
[78] 曾Y.H。;郭义忠。;肖瑞秋。;Yang,L。;Yu,L.Z。;Li,M.L.,基于自协方差方法,使用增广的周伪氨基酸组成预测蛋白质亚线粒体位置,J.Theor。生物学,259366-372(2009)·Zbl 1402.92193号
[79] 张国勇。;Fang,B.S.,基于氨基酸组成分布和Chou的两亲性伪氨基酸组成预测氧化还原酶的辅因子,J.Theor。《生物学》,253,310-315(2008)
[80] 张国勇。;Li,H.C。;高强强。;Fang,B.S.,通过改进的周氏假氨基酸组成预测脂肪酶类型,蛋白质Pept。莱特。,15, 1132-1137 (2008)
[81] 张,S.W。;Zhang,Y.L。;Yang,H.F。;Zhao,C.H。;Pan,Q.,使用周的伪氨基酸组成概念预测蛋白质亚细胞定位:结合进化信息和冯·诺依曼熵的方法,氨基酸,34565-572(2008)
[82] 周,X.B。;陈,C。;李,Z.C。;Zou,X.Y.,使用Chou的两亲性伪氨基酸组成和支持向量机预测酶亚家族类别,J.Theor。《生物学》,248546-551(2007)·Zbl 1451.92245号
[83] 邹博士。;何,Z。;He,J。;Xia,Y.,利用周的伪氨基酸组成预测超二级结构,J.Compute。化学。,32, 271-278 (2011)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。