外加剂

混合:混合模型在R中的一个简单的加速EM实现,加上扩展。混合软件被广泛应用于从基因型数据估计群体结构,这部分是因为计算可以很好地扩展到全基因组基因型数据。例如,接受过祖先DNA测试的百万以上的人都从混合样本中得到了他们的种族估计。我开发了一个简单的,可替代的混合实现,使用期望最大化(EM)算法计算混合比例和群体等位基因频率的最大似然估计(请参阅extractive.barebones.R和indication.barebones.demo.R,以获得一个非常简单的或“基本的”实现,尽管速度很慢!)我使用turboEM库来改善EM的非常慢的收敛性。混合软件是用拟牛顿法实现的,通常比EM算法收敛到一个解要快得多。我修改了模型,允许基因型错误,这似乎在一定程度上有助于收敛。无论如何,我们希望这个非常简单的实现将有助于开发外加剂的扩展。我在这里开发的一个扩展是对优化(M-step)的修改,它鼓励稀疏混合估计。这段代码是用R版本3.2.2测试的。混合源代码库是自由软件:您可以根据MIT许可证的条款重新发布它。本项目中的所有文件都是外加剂的一部分。这个项目的分发是希望它将是有用的,但没有任何保证;甚至没有对适销性或对特定用途的适用性的默示保证。有关许可证的全文,请参见文件许可证。