×

motif分叉:评估两个DNA序列之间基因调控基序差异的统计意义的模型。 (英语) Zbl 1405.62184号

摘要:下一代测序技术能够识别许多细胞类型和生物体中数千个基因调控序列。我们考虑测试两个这样的序列对于给定的转录因子(TF)蛋白的结合位点基序的数量是否不同的问题。结合位点基序通过为TF提供与基因组元件结合的机会而赋予调节功能,从而影响邻近基因的表达。这种功能DNA的进化变化被假设为物种内和物种间表型多样性的主要贡献者;但尽管TF基序对基因表达很重要,但还没有方法检测基序的丢失或获得。假设基序计数是二元分布的,并考虑到进化相关序列中基序实例之间的依赖性,我们导出了两个核苷酸序列之间基序计数差异的概率质量函数。我们提供了一种从基因组数据中对这种分布进行数值估计的方法,并通过模拟表明我们的估计是准确的。最后,我们介绍R(右)包裹motif分叉这实现了我们的方法,并说明了它在通过小鼠发育时间过程实验鉴定的基因调控增强子中的应用。虽然这项研究的动机是对调控基序的分析,但我们的结果可以应用于涉及两个相关Bernoulli试验的任何问题。

MSC公司:

62页第10页 统计学在生物学和医学科学中的应用;元分析
2015年1月62日 贝叶斯推断
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用