跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

HTTP服务器

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2014年7月;42(Web服务器问题):W350-5。
doi:10.1093/nar/gku396。 Epub 2014年5月21日。

LocTree3定位预测

附属公司

LocTree3定位预测

塔蒂亚娜·戈德堡等。 核酸研究. 2014年7月.

摘要

预测蛋白质亚细胞定位是阐明蛋白质功能的重要步骤。对于每个查询蛋白序列,LocTree2应用机器学习(profile kernel SVM)预测18类真核生物、6类细菌和3类古生菌的天然亚细胞定位。该方法输出反映每个预测可靠性的分数。LocTree2的性能与任何其他最先进的方法相当或更好。在这里,我们报告了LocTree3作为公共web服务器的可用性。服务器包含基于机器学习的LocTree2,并通过添加基于同源性的推理对其进行改进。根据测序数据评估,LocTree3真核生物的18态精确度Q18=80±3%,细菌的6态精确度Q6=89±4%。服务器接受从单个蛋白质序列到整个蛋白质组的提交。卸载服务器的响应时间对于300个残余真核蛋白质约为90秒,对于整个真核蛋白质组约为几个小时,而不考虑比对的生成。对于1000多个完全测序的生物体,预测可以直接下载。web服务器位于http://www.rostlab.org/services/loctree3。

PubMed免责声明

数字

图1。
图1。
可靠的预测更准确。LocTree3的可靠性指数(RI)将预测的强度与性能联系起来。曲线显示了给定RI之上LocTree3预测的准确度/覆盖率百分比(“材料和方法”部分)。增加RI意味着我们查看所有预测的某些子集;子集由带正方形的曲线给出。例如,一半的真核生物蛋白质预测RI>70(黑色交叉线)。对于这个排名前50%的人来说,表现比平均水平有所提高18=80%至18=95%(带圆圈的黑线,黑色箭头)。细菌的RI>80达到了类似的值(灰色交叉线;注意在这种情况下6=95%是六态准确度,而真核生物是18态准确度)。
图2。
图2。
蛋白质RP9_HUMAN的输出示例。对于每个输入的蛋白质序列,LocTree3预测结果包含:(i)蛋白质标识符,(ii)可靠性指数,(iii)预测的预期准确性,(iv)定位类别,(v)GO项和标识符,以及(vi)预测的来源。预测的定位在细胞(此处:细胞核)的示意图中突出显示。对于LocTree2预测(如图所示),我们提供了决策树和最终预测的决策路径的可视化。可靠性指标是通过决策路径上的值的乘积形成的。对于PSI-BLAST预测,我们提供查询蛋白的序列比对,使其达到最佳命中,而不是树。

类似文章

引用人

工具书类

    1. Bairoch A.、Apweiler R.《SWISS-PROT蛋白质序列数据库及其增补TrEMBL》,《核酸研究》,1997年;25:31–36.-项目管理咨询公司-公共医学
    1. Simpson J.C.,Pepperkok R.蛋白质组定位。基因组生物学。2003年;4:240.-项目管理咨询公司-公共医学
    1. Huh W.K.、Falvo J.V.、Gerke L.C.、Carroll A.S.、Howson R.W.、Weissman J.S.、O'Shea E.K.芽殖酵母中蛋白质定位的全球分析。自然。2003年;425:686–691.-公共医学
    1. Koonin E.V.桥接序列和功能之间的差距。趋势Genet。2000;16:16.-公共医学
    1. Radivojac P.、Clark W.T.、Oron T.R.、Schnoes A.M.、Wittkop T.、Sokolov A.、Graim K.、Funk C.、Verspoor K.、Ben-Hur A.计算蛋白质功能预测的大规模评估。自然方法。2013年;10-项目管理咨询公司-公共医学

出版物类型