外加剂

混合:混合模型在R中的一个简单的加速EM实现,加上扩展。混合软件被广泛应用于从基因型数据估计群体结构,这部分是因为计算可以很好地扩展到全基因组基因型数据。例如,接受过祖先DNA测试的百万以上的人都从混合样本中得到了他们的种族估计。我开发了一个简单的,可替代的混合实现,使用期望最大化(EM)算法计算混合比例和群体等位基因频率的最大似然估计。(请参阅extractive.barebones.R和indication.barebones.demo.R,了解一个非常简单的,或者说是“基本框架”的实现,尽管它很慢!)我使用turboEM库来改善EM的非常慢的收敛性。混合软件是用拟牛顿法实现的,通常比EM算法收敛到一个解要快得多。我修改了模型,允许基因型错误,这似乎在一定程度上有助于收敛。无论如何,我们希望这个非常简单的实现将有助于开发外加剂的扩展。我在这里开发的一个扩展是对优化(M-step)的修改,它鼓励稀疏混合估计。这段代码是用R版本3.2.2测试的。你可以根据许可证条款重新分发软件的源代码。本项目中的所有文件都是外加剂的一部分。发布这个项目是希望它能有用,但没有任何保证;甚至没有对适销性或特定用途适用性的暗示保证。有关许可证的全文,请参见文件许可证。