跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2000年4月;16(4):367-71.
doi:10.1093/bioinformatics/16.4.367。

微生物基因组中蛋白质编码区聚类算法的收敛性

附属公司

微生物基因组中蛋白质编码区聚类算法的收敛性

P巴尔迪. 生物信息学. 2000年4月.

摘要

动机:随着完全测序的原核基因组数量持续快速增长,可靠检测蛋白质编码区的计算方法变得更加重要。Audic和Claverie(1998)Proc。美国国家科学院。科学。美国,95,10026-10031,提出了微生物基因组中蛋白质编码区的聚类算法。该算法基于与从给定基因组中提取的子序列相关联的三个k阶马尔可夫模型。三个马尔可夫模型的参数由算法递归更新,在模拟中,该算法似乎总是收敛到基因组的唯一稳定分区。分区对应于三种区域:(1)直接链上的编码,(2)互补链上的代码,(3)非编码。

结果:在这里,我们通过观察它本质上是应用于相应混合模型的期望最大化(EM)算法的一种形式来解释算法的收敛性。我们还基于可识别性为分区的唯一性提供了部分理由。简要讨论了其他可能的变化和改进。

PubMed免责声明

类似文章

引用人

出版物类型

LinkOut-更多资源