母题分化

模体分化:评价两个DNA序列间基因调控基序差异统计意义的模型。下一代测序技术能够识别许多细胞类型和生物体中的数千个基因调控序列。我们考虑的问题是,对于一个给定的转录因子(TF)蛋白质,两个这样的序列的结合位点基序数目是否不同。结合位点模体通过提供TFs与基因组元素结合的机会,从而影响邻近基因的表达,从而赋予调控功能。这种功能性DNA的进化变化被认为是物种内部和物种间表型多样性的主要因素;但是尽管TF基序对于基因表达的重要性,但是没有方法来测试模体的损失或获得。假设基序计数是二元分布的,并考虑进化相关序列中模体实例之间的依赖关系,我们推导出两个核苷酸序列之间模体计数差异的概率质量函数。我们提供了一种从基因组数据中对这种分布进行数值估计的方法,并通过仿真证明了我们的估计器是准确的。最后,我们介绍了实现我们的方法的R包motivedivige,并举例说明其在通过小鼠发育时间过程实验确定的基因调控增强子中的应用。虽然这项研究的动机是对调控基序的分析,但我们的结果可以应用于涉及两个相关伯努利试验的任何问题。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换