跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.1999年7月至8月;15(7-8):563-77.
doi:10.1093/bioinformatics/15.7.563。

通过多序列的统计显著比对识别DNA和蛋白质模式

附属公司

通过多序列的统计显著比对识别DNA和蛋白质模式

G Z赫兹等。 生物信息学. 1999年7月至8月.

摘要

动机:分子生物学家通常可以通过调整一组相关的DNA、RNA或蛋白质序列来获得有趣的见解。这种比对可用于确定进化或功能关系。我们的兴趣是确定功能关系。除非序列非常相似,否则有必要使用特定的策略来测量或评分对齐序列的相关性。如果校准未知,可以通过找到优化评分方案的校准来确定。

结果:我们描述了用于确定多个序列比对的方法的四个组成部分。首先,我们回顾了一个我们称之为信息内容的log-likelihood评分方案。其次,我们描述了两种估计个人信息内容得分P值的方法:(i)将大偏差统计技术与数值计算相结合的方法;(ii)一种完全数值化的方法。第三,我们描述了在给定序列数据总量的情况下,如何计算可能的比对数量。该计数乘以P值,以确定信息内容分数的预期频率,从而确定相应对齐的统计显著性。统计显著性可用于比较具有不同宽度和包含不同序列数的比对。第四,我们描述了一种贪婪算法,用于确定功能相关序列的对齐。最后,我们测试了P值计算的准确性,并给出了一个使用我们的算法识别大肠杆菌CRP蛋白结合位点的示例。

可利用性:程序是在UNIX操作系统下开发的,可以通过匿名ftp从ftp://beagle.colorado.edu/pub/consusson。

PubMed免责声明

类似文章

引用人

出版物类型

LinkOut-更多资源