跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.1983年10月21日;104(4):633-45。
doi:10.1016/0022-5193(83)90251-5。

DNA序列的马尔可夫分析

DNA序列的马尔可夫分析

H阿尔马戈. 《Theor生物学杂志》. .

摘要

我们提出了一个模型,将DNA序列视为马尔可夫过程。一些工作人员提出,核酸的一些基本生物或化学特征是这些链中二核苷酸(双链)频率的背后。比较不同生物体DNA中的双倍频率模式被证明是解决某些系统发育问题的一种富有成效的方法(Russel&Subak-Sharpe,1977)。Grantham(1978)制定了mRNA序列指数,其中一些涉及某些双倍频率。他建议使用这些指数可以提供基因进化过程中存在的分子约束的指示。Nussinov(1981)证明了一组二核苷酸偏好规则对真核生物具有一致性,并表明这些规则与简并密码子的使用之间有很强的相关性。Gruenbaum、Cedar和Razin(1982)发现真核生物DNA中的甲基化只发生在C-G位点。因此,重要的生物信息似乎包含在双频中。要问的一个基本问题(“相关性问题”)是,由同一序列中的16个双碱基频率决定的序列中测量的64个三核苷酸(三碱基)频率在多大程度上。DNA在这里被描述为马尔可夫过程,核苷酸是序列生成器的结果。回答上述相关问题意味着找到马尔可夫过程的阶数。困难在于自然序列的长度是有限的,而统计噪声相当强。我们表明,即使是16000个核苷酸长序列(如人类线粒体基因组),有限长度的影响也不能忽略。然而,使用马尔可夫链模型,即使对于有限序列,只要适当考虑有限长度,也可以确定双频和三频之间的相关性。作为该方法的示例,分析了两个天然DNA序列,即人类线粒体基因组和SV40 DNA。

PubMed免责声明

类似文章

引用人

LinkOut-更多资源