开放式访问
2023 偏差矩阵分解
王亮(Liang Wang),路易斯·卡瓦略
作者关联+
电子。J.统计。 17(2): 3762-3810 (2023). 内政部:10.1214/23-EJS2174

摘要

我们研究基于偏差的数据损失的一般矩阵分解,将普遍存在的奇异值分解扩展到平方误差损失之外。虽然之前已经探索过类似的方法,但我们的方法利用了来自广义线性模型(GLM)的经典统计方法,并提供了一种有效的算法,该算法具有足够的灵活性,可以通过入口权重实现结构零。此外,通过调整GLM理论的结果,我们通过以下方式为这些分解提供了支持:(i)在GLM设置下显示出强一致性,(ii)通过广义Hosmer-Lemeshow检验所选指数族的充分性,以及(iii)通过最大特征值间隙法确定分解的秩。为了进一步支持我们的发现,我们进行了仿真研究,以评估对分解假设的鲁棒性,并使用来自图像人脸识别、自然语言处理、网络分析和生物医学研究的基准数据集进行了广泛的案例研究。我们的理论和实证结果表明,与类似方法相比,所提出的分解方法更加灵活、通用和稳健,因此可以提供更好的性能。为了方便应用,R包dmf公司通过有效的模型拟合,还提供了族和秩的确定。

致谢

我们感谢两位匿名审稿人和副主编,他们提供了许多宝贵的意见,大大改进了论文。我们还感谢夏维轩(Weixuan Xia)对我们的一致性证明提供了建议和验证。

引用

下载引文

王亮。 路易斯·卡瓦略。 “偏差矩阵分解。” 电子。J.统计。 17 (2) 3762 - 3810, 2023 https://doi.org/10.1214/23-EJS2174

问询处

收到日期:2022年1月1日;发布日期:2023年
欧几里德项目首次提供:2023年12月11日

数字对象标识符:10.1214/23-EJS2174

关键词:因子模型,非负矩阵分解,主成分分析

第17卷•第2期•2023
返回页首