pyMEF公司

通过简化核密度估计器学习混合高斯混合模型是建模各种复杂概率密度函数的广泛工具。它们可以通过各种方法进行估计,通常使用期望最大化或核密度估计。除了这些著名的算法,新的和有前途的随机建模方法包括Dirichlet过程混合和$k$-极大似然估计。大多数方法,包括期望最大化,导致紧凑的模型,但可能是昂贵的计算。另一方面,核密度估计会产生计算量较低的大型模型。在本章中,我们提出了新的方法来获得高质量的模型,这些模型既紧凑又快速。这是通过简化核密度估计来实现的。简化是一种基于$k$-均值算法的聚类方法。与所有的$k$-means算法一样,我们的方法依赖于发散和质心计算,我们使用两种不同的发散(以及它们相关的质心)。在对算法进行描述的同时,我们还描述了pyMEF库,这是一个Python库,用于处理指数族的混合。与大多数其他现有工具不同,这个库允许使用任何指数族,而不是局限于特定的分布。通用库允许用户快速探索不同的可用指数族,以便选择更适合特定应用的指数族。我们通过在一个生物信息学应用的例子上建立混合模型来评估所提出的算法。结果模型的质量是用对数似然和Kullback-Leibler散度来衡量的。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换