MDL4BMF公司 swMATH ID: 28420 软件作者: Miettinen P、Vreeken J 描述: MDL4BMF:布尔矩阵分解的最小描述长度。矩阵分解是一种功能强大的数据挖掘工具,它将给定的数据矩阵近似为两个或多个因子矩阵的乘积。在其他任务中,矩阵分解通常用于分离全局结构和噪声。然而,这需要解决“模型顺序选择问题”,即确定因子分解的适当秩,即回答细粒度结构在何处停止,噪声在何处开始。布尔矩阵分解(BMF)——近年来,数据、因子和矩阵乘积是布尔型的,受到了数据挖掘界越来越多的关注。该技术具有所需的特性,例如高可解释性和自然稀疏性。然而,到目前为止,还没有为BMF选择正确型号顺序的方法。在本文中,我们建议对此任务使用最小描述长度(MDL)原则。除了解决问题外,这种有根据的方法还有很多好处;例如,它是自动的,不需要似然函数,速度快,而且,如实验所示,非常准确。我们通常为BMF制定描述长度函数,使其适用于任何BMF算法。我们讨论了如何构造合适的编码:从简单直观的方法出发,我们得出了一种高效的基于数据到模型的BMF编码。我们扩展了现有的BMF算法,使用MDL来识别最佳布尔矩阵分解,分析了问题的复杂性,并进行广泛的实验评估以研究其行为。 主页: https://dl.acm.org/citation.cfm?id=2601437 相关软件: 克里姆;流克里姆;PAL倾斜;UCI-毫升;奇数球;gSpan(量程);WebGraph(网络图表);佩加斯;MapReduce;雅高;图形范围;帕恩达+;BMDP公司;MODL公司;块簇;奥斯卡;图形库;古罗比 引用于: 10文件 全部的 前5名26位作者引用 2 塔蒂亚娜·马哈洛娃 2 马丁·特内卡 1 拉迪姆·Bělohlávek 1 伊恩·戴维森 1 克里斯托斯·法洛索斯 1 埃斯特·加布伦 1 西比尔·赫斯 1 Kang,U。 1 达奈·库特拉 1 谢尔盖·库兹涅佐夫。 1 Kwong,Sam山姆 1 李新奇 1 亚历克斯·马特内特 1 萨斯基亚·梅茨勒 1 保利·米提宁 1 卡萨琳娜·莫里克 1 那不勒斯、阿梅迪奥 1 齐格弗里德·尼杰森 1 冈田真本 1 尼科·皮亚特科夫斯基 1 皮埃尔·绍斯 1 新亚苏加瓦拉 1 基列斯·弗里肯 1 王军 1 吴天一 1 Kenji Yamanishi 全部的 前5名6篇连载文章中引用 5 数据挖掘与知识发现 1 国际近似推理杂志 1 神经网络 1 人工智能研究杂志 1 数据分析和分类进展。ADAC公司 1 统计分析与数据挖掘 全部的 前5名在7个字段中引用 7 计算机科学(68至XX) 三 统计学(62-XX) 2 线性代数和多线性代数;矩阵理论(15-XX) 2 运筹学、数学规划(90-XX) 1 阶、格、有序代数结构(06-XX) 1 数值分析(65-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 按年份列出的引文