跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2009年6月15日;25(12):i54-62。
doi:10.1093/bioinformatics/btp190。

利用有偏替换模式识别新的约束元素

附属公司

利用有偏替换模式识别新的约束元素

曼纽尔·加伯等。 生物信息学. .

摘要

动机:比较密切相关物种的基因组为识别参考基因组中的功能元件提供了一个强有力的工具。已经开发了许多方法来识别跨物种的保守序列;然而,现有的方法只将保守性建模为突变率的降低,而忽略了对突变模式的选择。

结果:我们提出了一种新的方法,利用深度测序的分支来识别进化选择,方法不仅揭示了基于速率的保守性特征,还揭示了自然选择序列的替代模式特征。我们描述了一种新的统计方法,用于建模有偏核苷酸替换,一种学习算法,用于直接从序列比对推断特定位点的替换偏差,以及一种隐马尔可夫模型,用于检测以有偏替换为特征的约束元素。我们表明,与基于速率的方法相比,新方法可以识别更多的退化约束序列。将其应用于ENCODE区域,我们发现多达10.2%的这些区域处于选择中。

可利用性:这些算法是在一个名为SiPhy的Java软件包中实现的,该软件包在http://www.broadinstitute.org/science/software/。

补充信息:补充数据可在生物信息学网站上获得。

PubMed免责声明

数字

图1。
图1。
估计SiPhy用于进化约束检测的能力。SiPhy对三个因素的依赖性——可用物种的数量(M(M))每个位点的IC,以及k-mers(1或12)的大小,通过使用恒星系统发育的模拟研究进行评估。如果SiPhy可以使用P(P)<0.001,25%和75%可识别。(A)单个站点的最低IC为25%(蓝色)、50%(绿色)或75%(红色),可识别为以下函数M(M).(B)25%、50%和75%的百分位数P(P)-值显示为单个站点IC的函数,物种数量固定为M(M)=9(顶部)和M(M)=50(底部)。(C)(D)显示12个月的类似图。绘制恢复的碱基数P(P)对于给定IC,<0.001。蓝线对应25%的回收碱,绿色对应50%的回收碱和红色对应75%的覆盖碱。
图2。
图2。
SiPhy显示出更强的检测退化位点的能力。该图显示了在两个数据集(第三密码子位置的2D和4D简并位点)中分离受限12mers和中性12mers的LO分数分布。使用基于π的方法计算LO得分(A)或基于费率的方法(B)。如果4D数据集用作控件,阴影区域表示2D数据集中显示过度约束的站点部分。
图3。
图3。
估计ENCODE区域中的约束。(A类)中性序列与基因组(ENCODE)区域约束的比较。SiPhy计算AR、引导祖先重复序列(AR boot)和基因组区域(黑色)的12个LO得分。与AR相比,基因组区域中的过度约束由浅蓝色阴影区域突出显示,而与AR引导相比,阴影区域则以浅蓝色和深蓝色突出显示。(B类)SiPhy元件和其他三种类型的元件之间的重叠:编码外显子(绿色)、GERP(蓝色)和PhastCons(红色)。每条曲线显示了SiPhy 12mers在给定LO得分截止点处重叠元素的百分比。(C类)ENCODE区域中SiPhy、PhastCons和GERP元素的维恩图。
图4。
图4。
SiPhy HMM状态图。HMM的示意图,用于识别SiPhy约束元素。N(π0)表示中性状态。约束状态由10个约束向量的混合表示,其中4个是非退化的(π1–π4)6个是2D(π6–π10).

类似文章

引用人

  • 肥胖和男性不育在哪里发生冲突?
    Jahangir M、Nazari M、Babakhanzadeh E、Manshadi SD。 Jahangir M等人。 BMC医学基因组学。2024年5月10日;17(1):128. doi:10.1186/s12920-024-01897-5。 BMC医学基因组学。2024 PMID:38730451 免费PMC文章。
  • 外显子组测序提示儿童期原发性高血压SYNE1基因的孟德尔变异。
    Copeland I、Wonkam-Tingang E、Gupta-Malhotra M、Hashmi SS、Han Y、Jajoo A、Hall NJ、Hernandez PP、Lie N、Liu D、Xu J、Rosenfeld J、Haldipur A、Desire Z、Coban-Akdemir ZH、Scott DA、Li Q、Chao HT、Zaske AM、Lupski JR、Milewicz DM、Shete S、Posey JE、Hanchard NA。 Copeland I等人。 JCI洞察力。2024年5月8日;9(9):e172152。doi:10.1172/jci.insight.172152。 JCI洞察力。2024 PMID:38716726 免费PMC文章。
  • 安哥拉儿童镰状细胞贫血表型的遗传修饰物。
    Ginete C、Delgadinho M、Santos B、Miranda A、Silva C、Guerreiro P、Chimusa ER、Brito M。 Ginete C等人。 基因(巴塞尔)。2024年4月8日;15(4):469. doi:10.3390/genes15040469。 基因(巴塞尔)。2024 PMID:38674403 免费PMC文章。
  • 22q11.2缺失综合征患者表型异质性候选基因的变异。
    Nunes N、Carvalho Nunes B、Zamariolli M、Cordeiro de Queiroz Soares D、Caires Dos Santos L、Gollo Dantas A、Ayres Meloni V、Iole Belangero S、Gil Da Silva Lopes VL、Ae Kim C、Melaragno MI。 Nunes N等人。 基因研究(弧度)。2024年3月30日;2024:5549592. doi:10.1155/2024/5549592。eCollection 2024年。 基因研究(弧度)。2024 PMID:38586596 免费PMC文章。
  • X连锁视网膜病变患者队列中的基因型-表型关联:分子动力学见解和有前景的SD-OCT指标。
    魏X,李浩,朱T,孙Z,隋R。 Wei X等人。 投资眼科视觉科学。2024年2月1日;65(2):17. doi:10.1167/iovs.65.2.17。 投资眼科视觉科学。2024 PMID:38324300 免费PMC文章。

工具书类

    1. Asthana S等,核苷酸解析时序列保守性分析。PLOS计算。生物学2007;3:e254。-项目管理咨询公司-公共医学
    1. Bejerano G等人。一个远端增强子和一个超保守外显子来自一个新的逆转录子。自然。2006;441:87–90.-公共医学
    1. Birney E等人。通过编码试点项目鉴定和分析人类基因组中1%的功能元件。自然。2007;447:799–816.-项目管理咨询公司-公共医学
    1. Blanchette M等人。使用螺纹区块对齐器对齐多个基因组序列。基因组研究2004;14:708–715.-项目管理咨询公司-公共医学
    1. Cooper GM等。哺乳动物基因组序列中约束的分布和强度。基因组研究2005;15:901–913.-项目管理咨询公司-公共医学

出版物类型