×

TMBETADISC-RBF:利用RBF网络和PSSM图谱鉴别β-桶膜蛋白。 (英语) Zbl 1403.92218号

摘要:区分外膜蛋白(OMP)与其他折叠类型的球状和膜蛋白是从基因组序列中识别OMP以及成功预测其二级和三级结构的重要任务。我们开发了一种基于径向基函数网络和PSI-BLAST和非冗余蛋白质数据库生成的位置特异性评分矩阵(PSSM)图谱的方法。我们的PSSM图谱方法在1251个蛋白质组中正确预测了OMP,交叉验证的准确率为96.4%,其中包含206个OMP、667个球状蛋白和378个({α})螺旋内膜蛋白。此外,我们将我们的方法应用于包含114个OMP、187个TMH蛋白和195个球状蛋白的数据集,获得的序列一致性小于20%,并且获得了95%的交叉验证准确度。这种识别OMP的准确性高于文献中的其他方法,我们的方法可以作为一种有效的工具用于从基因组序列中分离OMP。我们开发了一个预测服务器TMBETADISC-RBF,可在http://rbf.bioinfo.tw/sachen/OMP.html.

MSC公司:

92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul,S。;麦登,T。;Schaffer,A。;张杰。;张,Z。;Miller,W。;Lipman,D.,Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸res.,25,17,3389-3402,(1997)
[2] 巴戈斯,P。;Liakopoulos,T。;Spyropoulos,I。;Hamodrakas,S.,一种能够预测和区分β-桶外膜蛋白的隐马尔可夫模型方法,BMC生物信息学,5,1,29,(2004)
[3] Berven,F。;Flikka,K。;Jensen,H。;Eidhammer,I.,《BOMP:预测革兰氏阴性菌基因组内编码的整体b桶外膜蛋白的程序》,核酸研究,32,W394-W399,(2004)
[4] 毕格罗,H。;Rost,B.,Proftmb:预测细菌跨膜β-桶蛋白的网络服务器,核酸研究,34,网络服务器问题,W186,(2006)
[5] 钱多尼亚,J。;荣誉G。;Walker,N。;康提,L。;Koehl,P。;莱维特,M。;布伦纳,S。;Journals,O.,2004年ASTRAL简编,核酸研究,32,D189-D192,(2004)
[6] 加罗,A。;Agnew,A。;Westhead,D.,TMB-hunt:一个用于筛选跨膜β-桶蛋白序列集的网络服务器,核酸研究,33,W188-W192,(2005)
[7] 加罗,A.G。;Westhead,D.R.,《筛选跨膜β-桶蛋白新家族基因组的共识算法》,《蛋白质》,69,1,8-18,(2007)
[8] Gnanasekaran,T。;佩里,S。;Arockiasamy,A。;Krishnaswamy,S.,基于结构的孔蛋白序列比对剖面可以识别(β)链整体膜蛋白,生物信息学,16839-842,(2000)
[9] Gromiha,M.M.,外膜蛋白序列中的基序,生物物理学。化学。,117, 65-71, (2005)
[10] 格罗米哈医学博士。;艾哈迈德,S。;Suwa,M.,残留物沿序列分布在鉴别外膜蛋白中的应用,计算。生物化学。,29, 135-142, (2005) ·邮编1096.92015
[11] 格罗米哈,M.M。;Suwa,M.,《一种识别外膜蛋白的简单统计方法,具有更好的准确性》,生物信息学,21961-968,(2005)
[12] 格罗米哈,M.M。;Suwa,M.,使用机器学习算法识别外膜蛋白质,蛋白质:结构、功能和生物信息学,63,1031-1037,(2006)
[13] 格罗米哈,M.M。;Suwa,M.,《桶膜蛋白的最新发展:序列和结构分析、鉴别和预测》,Curr。蛋白肽。科学。,8, 6, 580-599, (2007)
[14] Jones,D.T.,基于位置特异性评分矩阵的蛋白质二级结构预测,J.mol.biol。,292, 195-202, (1999)
[15] 李伟(Li,W.)。;雅罗斯基,L。;Godzik,A.,《高度同源序列的聚类以减小大型蛋白质数据库的大小》,生物信息学,17,282-283,(2001)
[16] 刘,Q。;Zhu,Y。;王,B。;Li,Y.,基于氨基酸组成特性和预测二级结构的b-桶膜蛋白鉴定,计算机。生物化学。,27, 355-361, (2003)
[17] Martelli,P.L。;Fariselli,P。;Krogh,A。;Casadio,R.,用于预测和区分β-桶膜蛋白的基于序列保护的HMM,生物信息学,18,46-53,(2002)
[18] 穆尔津,A.G。;S.E.布伦纳。;哈伯德,T。;Chothia,C.,SCOP:用于序列和结构研究的蛋白质结构分类数据库,J.mol.biol。,247, 536-540, (1995)
[19] 新泽西州奈特。;Kaur,H。;Raghava,G.P.S.,使用基于ann和svm的方法预测β-桶蛋白的跨膜区域,蛋白质,56,11-18,(2004)
[20] 欧,Y.-Y。;Oyang,Y.-J。;陈春云,一种新的基于层次聚类中心集的径向基函数网络分类器,(),1383-1388
[21] 帕克,K.-J。;格罗米哈,M.M。;霍顿,P。;Suwa,M.,使用支持向量机识别外膜蛋白,生物信息学,214223-4229,(2005)
[22] W.H.出版社,《C中的数字食谱》,(1992),剑桥大学出版社·Zbl 0845.65001号
[23] 塞耶,M。;Tran,C。;Barabote,R.,TCDB:膜转运蛋白分析和信息的转运蛋白分类数据库,核酸研究,34,D181-D186,(2006)
[24] 苏,C.-T。;Chen,C.-Y。;Ou,Y.-Y.,考虑有序或无序倾向的浓缩PSSM蛋白质无序预测,BMC生物信息学,7,1,319,(2006)
[25] 高崎,S。;川村,Y。;Konagaya,A.,利用径向基函数网络和决策树学习选择有效的sirna序列,BMC生物信息学,7,5,S22,(2006)
[26] Tusnády,G。;佐治亚州多斯坦伊。;Simon,I.,PDB_TM:蛋白质数据库中跨膜蛋白质的选择和膜定位,核酸研究,33,D275-D278,(2005)
[27] Witten,I。;Frank,E.,《数据挖掘:实用机器学习工具和技术》,(2005),Morgan Kaufmann·Zbl 1076.68555号
[28] 谢,D。;李,A。;王,M。;风扇,Z。;Feng,H.,LOCSVMPSI:使用SVM和PSI-BLAST剖面进行真核蛋白质亚细胞定位的网络服务器,核酸res.,33,1,W105-W110,(2005)
[29] 杨,Z。;Thomson,R.,预测蛋白质中蛋白酶裂解位点的生物基函数神经网络,神经网络。IEEE传输。,16, 1, 263-274, (2005)
[30] 张,G。;黄,D.,基于遗传算法优化的径向基函数神经网络和二进制输入编码方案的残余接触图预测,J.comput。辅助模具。,18, 12, 797-810, (2004)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。