×

GLFM公司

swMATH ID: 35679
软件作者: 瓦莱拉,伊莎贝尔;梅兰妮·普雷迪尔(Melanie F.Pradier)。;玛丽亚,洛梅利;佐宾·加赫拉马尼
描述: 异构数据集的通用潜在特征模型。潜在变量模型允许捕获数据背后的隐藏结构。特别是,特征分配模型通过潜在变量的线性组合来表示每个观测值。这些模型通常用于预测新观测值或原始数据中缺失的信息,以及进行探索性数据分析。虽然有大量关于同质数据集的潜在特征分配模型的文献,其中描述每个对象的所有属性都是相同的(连续或离散)类型,但对于异构数据集的实际潜在特征建模,还没有通用的框架。本文介绍了一种适用于异构数据集的通用贝叶斯非参数潜在特征分配模型,其中描述每个对象的属性可以是实值、正实值、分类、序数和计数变量的任意组合。该模型具有几个重要特性。首先,它适用于异构数据,同时保持共轭模型的特性,这使我们能够开发一种推理算法,该算法相对于每次MCMC迭代的对象和属性数量呈现线性复杂性。其次,贝叶斯非参数组件允许我们对捕获数据中潜在结构所需的特征数量进行先验分布。第三,模型中的潜在特征是二值的,这有助于在探索性数据分析中对获得的潜在特征进行解释。最后,一个名为GLFM工具箱的软件包公开供其他研究人员使用和扩展。网址为{https://ivaleram.github.io/GLFM/}. 通过在几个真实数据集上解决预测和数据分析任务,我们展示了该模型的灵活性。
主页: https://ivaleram.github.io/GLFM/
相关软件:
引用于: 1文件

在1个字段中引用

1 统计学(62-XX)

按年份列出的引文