跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2011年11月;12(6):723-35.
doi:10.1093/bib/bbr002。 Epub 2011年2月17日。

基因本体论的内容、位置、方式和原因——生物信息学家的入门

附属公司

基因本体论的内容、位置、方式和原因——生物信息学家的入门

路易斯·杜普莱西斯等。 生物信息简介. 2011年11月.

摘要

随着高通量技术提供大量数据,提供系统、高质量的注释变得更加重要。基因本体(GO)项目是编目基因功能的最大资源。尽管如此,它的使用还不是无处不在,而且仍然充满了陷阱。在这篇综述中,我们为生物信息学家提供了GO的简短引物。我们总结了本体结构的重要方面,描述了功能注释的来源和类型,调查了GO注释相似性的度量,回顾了GO的典型用法,并讨论了与GO在生物信息学应用中的使用相关的其他重要考虑因素。

PubMed免责声明

数字

图1:
图1:
2002年9月至2010年9月期间,各生物体可用的实验验证GO术语分配数量增加。GO联盟最初关注的是真核生物,GO数据库中可用注释的分布和增加反映了这一事实。例如,对比实验验证的注释的稳定增长拟南芥,酿酒酵母小M实验验证的注释数量急剧增加大肠杆菌:从2002年的33人增至2010年的1852人。
图2:
图2:
GO:0060491项到其根项的一些路径说明了GO的结构。请注意,一个术语可能有多个父项。
图3:
图3:
GO证据代码及其缩写。证据代码NR(未记录)用于在使用证据代码之前分配的注释,不分配给新注释。
图4:
图4:
用于决定使用哪个证据代码的决策树。图改编自http://www.geneontology.org/GO.evidence.tree.shtml.
图5:
图5:
2010年4月1日,GO注释中的证据代码分布。
图6:
图6:
自2008年9月起,估算计算推断GO项(IEA)的正确性和覆盖范围。该估计基于四种注释良好的真核生物的数据:拟南芥,秀丽线虫,黑腹果蝇酿酒酵母确认的预测是那些2008年IEA注释,这些注释在2010年9月的注释文件中“升级”为实验证据代码之一(EXP、IMP、IGI、IPI、IDA、IEP)。被拒绝的预测是国际能源署2008年的注释,后来被删除。这个X(X)-轴是完整性的度量(“重述”)。它代表了在2008年至2010年期间添加的经过实验验证注释的基因的一部分,这些注释在2008年IEA注释文件中得到了正确预测。这个Y(Y)-轴是正确性(“精度”)的度量。它代表了2008年具有IEA注释的基因的比例,后来通过实验验证的注释进行了确认(在2008-2010年期间)。每个气泡的大小反映了使用实验证据代码分配的注释中各个GO项的频率,是该项普遍性的替代:气泡越大,GO实验注释中使用的术语越丰富。为了最大限度地减少估算误差,图中包含的术语至少有五个经确认的2008年IEA注释和五个被拒绝的IEA注释,因此产生了72个BP术语、85个MF术语和37个CC术语。包含注释的文件从GOA数据库中下载[14]。

类似文章

引用人

工具书类

    1. Bodenreider O,Stevens R.生物进化论:当前趋势和未来方向。简要生物信息。2006;7(3):256–74.-项目管理咨询公司-公共医学
    1. IUBMB。酶命名法。1992年,圣地亚哥学术出版社。
    1. Ashburner M、Ball CA、Blake JA等。基因本体:生物学统一的工具。基因本体联盟。自然遗传学。2000;25(1):25–9.-项目管理咨询公司-公共医学
    1. Smith B、Ashburner M、Rosse C等人,《海外建筑运营管理局铸造:本体论的协调进化以支持生物医学数据集成》。国家生物技术。2007;25(11):1251.-项目管理咨询公司-公共医学
    1. 胡JC,卡普·PD,凯斯勒·IM,等。通过基因本体论的应用,我们可以了解到大肠杆菌。微生物趋势。2009;17(7):269–78.-项目管理咨询公司-公共医学