跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2007年5月;14(4):517-35.
doi:10.1089/cmb.2007.A010。

HGT检测中的混淆因素:统计误差、合并效应和多重解决方案

附属公司
免费文章
比较研究

HGT检测中的混淆因素:统计误差、联合效应和多种解决方案

匡丹等。 计算机生物学杂志. 2007年5月.
免费文章

摘要

原核生物通过一种称为水平基因转移(HGT)的过程跨越物种边界共享遗传物质。这一过程对于理解原核基因组的多样性和揭示其复杂性具有重要意义。基于系统发育的HGT检测是这项任务中最常用的方法之一,基于HGT可能导致基因树彼此不一致以及与物种系统发育不一致这一基本事实。使用这些方法,我们可以比较基因树和物种树,并推断出一组HGT事件来调和这些树之间的差异。在这篇论文中,我们讨论了三个干扰检测真的HGT事件的因素,包括水平转移基因的供体和受体。首先,我们通过实验研究了估计基因树中的误差(统计误差)对推断HGT事件准确性的影响。我们的结果表明,统计误差会导致高估HGT事件的数量,HGT检测方法的设计应考虑未解决的基因树。其次,我们从理论和经验上证明,仅基于拓扑比较,调和一对物种/基因树的HGT场景的数量可能是指数级的。当正确估计了两棵树中的分支长度时,可以减少这个数量。这组结果表明,在缺乏额外生物信息和/或HGT如何发生的生物模型的情况下,必须寻求多种HGT场景,并且必须制定有效的策略来枚举此类解决方案。第三,我们讨论了血统分类问题,它如何混淆HGT检测,以及如何将其与HGT结合到一个单一的随机框架中,通过扩展群体遗传学理论来区分这两个事件。这一结果非常重要,尤其是在分析密切相关的生物体时,在协调基因树时,合并效应可能不会被忽视。除了这三个混淆因素外,我们还考虑了枚举构成似然物种/基因树协调的所有有效合并场景的问题,并开发了一种多项式时间动态规划算法来求解该问题。这一结果对于减少寻求协调场景的启发式算法的搜索空间具有重要意义。最后,我们实证地表明,一对树之间不一致的局部性对HGT和合并协调场景的数量有影响。

PubMed免责声明

类似文章

引用人

出版物类型

LinkOut-更多资源