跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2004年11月18:5:178。
doi:10.186/1471-2105-5-178。

GOtcha:一种新的预测蛋白质功能的方法,通过七个基因组的注释进行评估

附属公司

GOtcha:一种新的预测蛋白质功能的方法,通过七个基因组的注释进行评估

大卫·M·A·马丁等人。 BMC生物信息学. .

摘要

背景:新基因产物的功能通常通过相似序列注释的传递赋值来预测。我们描述了一种通过基因本体(GO)术语注释预测基因产物功能的新方法GOtcha。GOtcha预测GO术语与术语特定概率(P-score)置信度的相关性。术语特定概率是GOtcha的一个新特性,可以识别注释中的冲突或不确定性。

结果:GOtcha方法被应用于恶性疟原虫和其他六个基因组的最近测序基因组。定量比较GOtcha对指定GO术语的检索与来自最高得分注释BLAST搜索命中(TOPBLAST)的直接传递赋值。GOtcha将信息深入到相似性搜索匹配的“黄昏区”,利用了许多被更简单的方法丢弃的信息。在P分界值为50%时,GOtcha在E值为10(-4)时比TOPBLAST注释的注释回收率高60%,选择性高20%。

结论:GOtcha方法是基因组注释器的有用工具。它已经确定了原始恶性疟原虫注释中的错误和遗漏,并被许多其他基因组测序项目所采用。

PubMed免责声明

数字

图1
图1
恢复的原始GO注释与GO术语分配截止值的比例。(a) GOtcha(b)信息量最高的BLAST命中率(TOPBLAST)。对于GOtcha,P分数在文本中定义。对于TOPBLASTE类-value是顶级注释序列匹配的期望分数。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图2
图2
注释和注释的序列。(a)GOtcha在截止点上的P-得分和(b)TOPBLAST与E类-值低于截止值。具有相关注释的序列数由(c)GOtcha预测,其P分数超过截止值,以及(d)TOPBLAST预测,其E类-值低于截止值。P-分数计算为1个百分点的分辨率,从而产生图形的阶梯性质。(e)GOtcha和(f)TOPBLAST预测的每个注释序列的平均注释数。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图3
图3
使用所有证据代码分配GO术语的选择性与截止性。(a) GOtcha与P得分截止(a)TOPBLAST与E类-价值截止。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图4
图4
GO条款(不包括IEA证据代码)分配的覆盖范围与截止时间。(a) GOtcha(b)信息量最高的BLAST一击。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图5
图5
GO条款(不包括IEA证据代码)分配的选择性与截止性。(a) GOtcha与P得分截止(a)TOPBLAST与E类-价值截止。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图6
图6
相对误差商(要求)与GO条款分配截止时间相比。要求在文本中定义。(a) ●●●●。GOtcha分析。(b) ●●●●。信息量最大的BLAST命中分析。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图7
图7
相对误差商(要求)与GO条款分配截止时间相比。要求在文本中定义。IEA条款不包括在本分析中。(a) ●●●●。GOtcha分析。(b) ●●●●。信息量最大的BLAST命中分析。键:○拟南芥; 黑腹果蝇; 智人; 恶性疟原虫; 霍乱弧菌; 秀丽隐杆线虫; 酿酒酵母.
图8
图8
不同权重对REQ的影响。利用0.5(开环)、1、2、3、4、5、7、10和15(交叉)的权重因子计算GOtcha预测人类蛋白质组GO术语关联的REQ。
图9
图9
GOtcha方法。1.对查询序列进行数据库搜索。对搜索结果进行处理以给出具有相关联的R分数的成对匹配的列表。2.两队比赛的R分数将添加到与该比赛序列相关的每个GO项的总分中。3.C分数计算为根节点总分的自然对数。每个节点的I分数计算为总节点分数与根节点的比率。

类似文章

引用人

工具书类

    1. Gerlt J,Babbit P.序列能决定功能吗?基因组生物学。2000;1:评论0005.1–0005.10。doi:10.1186/gb-2000-1-5-reviews0005。-内政部-项目管理咨询公司-公共医学
    1. Frishman D、Albermann K、Hani J、Heumann K、Metanomski A、Zollner A、Mewes HW。使用PEDANT的功能和结构基因组学。生物信息学。2001;17:44–57. doi:10.1093/bioinformatics/17.1.44。-内政部-公共医学
    1. Andrade M、Brown N、Leroy C、Hoersch S、de Daruvar A、Reich C、Franchini A、Tamanes J、Valencia A、Ouzounis C、Sander C。自动化基因组序列分析和注释。生物信息学。1999;15:391–412. doi:10.1093/bioinformatics/15.5391。-内政部-公共医学
    1. Ouzounis C,Karp P.全基因组重新注释的过去、现在和未来。基因组生物学。2002;3:评论2000.1–2001.6。doi:10.1186/gb-2002-3-2-comment2001。-内政部-项目管理咨询公司-公共医学
    1. Ashburner M、Ball C、Blake J、Botstein D、Butler H、Cherry J、Davis A、Dolinski K、Dwight S、Eppig J、Harris M、Hill D、Issel-Tarver L、Kasarkis A、Lewis S、Matese J、Richardson J、Ringwald M、Rubin G、Sherlock G。基因本体:生物学统一的工具。自然遗传学。2000;25:25–29. doi:10.1038/75556。-内政部-项目管理咨询公司-公共医学

出版物类型