×

MDL4BMF公司

swMATH ID: 28420
软件作者: Miettinen P、Vreeken J
描述: MDL4BMF:布尔矩阵分解的最小描述长度。矩阵分解是一种功能强大的数据挖掘工具,它将给定的数据矩阵近似为两个或多个因子矩阵的乘积。在其他任务中,矩阵分解通常用于分离全局结构和噪声。然而,这需要解决“模型顺序选择问题”,即确定因子分解的适当秩,即回答细粒度结构在何处停止,噪声在何处开始。布尔矩阵分解(BMF)——近年来,数据、因子和矩阵乘积是布尔型的,受到了数据挖掘界越来越多的关注。该技术具有所需的特性,例如高可解释性和自然稀疏性。然而,到目前为止,还没有为BMF选择正确型号顺序的方法。在本文中,我们建议对此任务使用最小描述长度(MDL)原则。除了解决问题外,这种有根据的方法还有很多好处;例如,它是自动的,不需要似然函数,速度快,而且,如实验所示,非常准确。我们通常为BMF制定描述长度函数,使其适用于任何BMF算法。我们讨论了如何构造合适的编码:从简单直观的方法出发,我们得出了一种高效的基于数据到模型的BMF编码。我们扩展了现有的BMF算法,使用MDL来识别最佳布尔矩阵分解,分析了问题的复杂性,并进行广泛的实验评估以研究其行为。
主页: https://dl.acm.org/citation.cfm?id=2601437
相关软件: 克里姆;流克里姆;PAL倾斜;UCI-毫升;奇数球;gSpan(量程);WebGraph(网络图表);佩加斯;MapReduce;雅高;图形范围;帕恩达+;BMDP公司;MODL公司;块簇;奥斯卡;图形库;古罗比
引用于: 10文件

按年份列出的引文