跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2009年1月;5(1):e1000262。
doi:10.1371/journal.pcbi.1000262。 Epub 2009年1月16日。

正交推理项目和方法的系统发育和功能评估

附属公司

正交推理项目和方法的系统发育和功能评估

阿德里安·阿尔登霍夫等。 公共科学图书馆计算生物学. 2009年1月.

摘要

准确的全基因组直系同源基因鉴定是比较基因组学的一个核心问题,近年来发展的众多直系同源鉴定项目反映了这一事实。然而,只有少数报告对其准确性进行了比较,实际上,最近的一些努力尚未得到系统评价。此外,尽管Fitch的最初定义是基于系统发育的,但通常只根据功能守恒来评估矫形学。我们收集并绘制了九个领先的正畸学项目和方法(COG、KOG、Inparanoid、OrthoMCL、Ensemb Compara、Homologene、RoundUp、EggNOG和OMA)以及两个标准方法(双向最佳命中和相互最小距离)的结果。我们使用六种不同的测试系统地比较了它们在系统发育和功能方面的预测。这需要映射数以百万计的序列,处理数以亿计的预测正交对数对,以及计算数万棵树。在系统发育分析或需要高特异性的功能分析中,我们发现OMA和同源基因表现最佳。在功能特异性较低但覆盖率较高的情况下,OrthoMCL优于Ensemble Compara,在较小程度上表现为Inparanoid。最后,最近的EggNOG的大范围覆盖可能有助于建立广泛的功能分组,但该方法不够具体,无法进行系统发育或详细的功能分析。就一般方法而言,我们观察到,即使在系统发育测试中,Ensemble Compara更复杂的树重建/协调方法有时也优于成对比较方法。此外,我们还表明,标准双向最佳命中往往优于使用更复杂算法的项目。首先,本研究为广泛的正畸数据用户群体提供指导,以确定哪种数据库最适合他们的需求。其次,介绍了验证正畸学的新方法。第三,它为当前和未来的方法制定了性能标准。

PubMed免责声明

利益冲突声明

提交人声明,不存在相互竞争的利益。

数字

图1
图1。不同项目分析的完整基因组数量。
图2
图2。系统发育树测试结果。
基因树ML树正确分裂的平均分数图中显示了三个不同的王国。值越高基因树与物种树的一致性更好。在左边显示了每个项目和OMA之间的成对结果,而在右,公共集合比较的结果显示了大量项目的蛋白质。请注意基于不同的蛋白质组进行两两项目比较,因此无法相互比较。错误栏指示估计平均值的95%置信区间。项目由于适当的数据太少,无法进行评估解释了缺席的酒吧。
图3
图3。来自文献的基准结果。
来自4项已发表研究的人工管理基因树的表现。,,,. (A)显示了针对OMA的每个项目的成对结果,以真阳性率的相对差异表示OMA及其反项目之间及其相对差异假阳性率。(B) 蛋白质的性能交叉点数据集。显示真实阳性率(灵敏度)与假阳性率的比较(1-特异性)。在这两个图中误差条表示95%置信区间“更好的箭头”指向特异性和敏感性较高。处于灰色区域的项目在(A)中以“OMA成对”为主,在(B) 至少有一个其他项目。
图4
图4。基于功能的测试结果。
GO相似性、EC数的功能守恒试验结果表达相关性和基因邻域保护。成对项目比较(左)OMA及其反项目与给出了预测正交数的相对差异。在交叉集(右)的比较中,平均值函数相似性与预测正交数显示了常见的序列集。垂直误差条所有结果都表明了意味着。“更好的箭头”表示朝着更高的特异性和敏感性方向发展。正在进行的项目灰色区域以“OMA成对”为主在两两比较中(左),至少由一个其他项目在交叉口比较中(右)。

类似文章

引用人

工具书类

    1. Tatusov RL、Koonin EV、Lipman DJ。蛋白质家族的基因组观点。科学。1997;278:631–637.-公共医学
    1. Remm M,Storm C,Sonnhammer E.来自两两物种比较的直系和直系物种的自动聚类。分子生物学杂志。2001;314:1041–1052.-公共医学
    1. Li L,Stoeckert CJJ,Roos DS。Orthomcl:真核生物基因组的同源群鉴定。基因组研究2003;13:2178–2189.-项目管理咨询公司-公共医学
    1. Dessimoz C、Cannarozzi G、Gil M、Margadant D、Roth A等。McLysath A、Huson DH,编辑。OMA,一个从完整基因组数据中识别同源基因的综合自动化项目:简介和第一个成就。RECOMB 2005比较基因组学研讨会。2005年,第61-72页。Springer-Verlag,生物信息学讲义LNBI 3678卷。
    1. DeLuca TF,Wu IH,Pu J,Monaghan T,Peshkin L,et al.Roundup:同源基因和进化距离的多基因组库。生物信息学。2006;22:2044–2046.-公共医学