Deviance matrix factorization

Liang Wang; Luis Carvalho

doi:10.1214/23-EJS2174

2023 偏差矩阵分解

王亮（Liang Wang）,路易斯·卡瓦略

作者关联+

电子。J.统计。 17(2): 3762-3810 (2023). 内政部：10.1214/23-EJS2174

摘要

我们研究基于偏差的数据损失的一般矩阵分解，将普遍存在的奇异值分解扩展到平方误差损失之外。虽然之前已经探索过类似的方法，但我们的方法利用了来自广义线性模型（GLM）的经典统计方法，并提供了一种有效的算法，该算法具有足够的灵活性，可以通过入口权重实现结构零。此外，通过调整GLM理论的结果，我们通过以下方式为这些分解提供了支持：（i）在GLM设置下显示出强一致性，（ii）通过广义Hosmer-Lemeshow检验所选指数族的充分性，以及（iii）通过最大特征值间隙法确定分解的秩。为了进一步支持我们的发现，我们进行了仿真研究，以评估对分解假设的鲁棒性，并使用来自图像人脸识别、自然语言处理、网络分析和生物医学研究的基准数据集进行了广泛的案例研究。我们的理论和实证结果表明，与类似方法相比，所提出的分解方法更加灵活、通用和稳健，因此可以提供更好的性能。为了方便应用，R包dmf公司通过有效的模型拟合，还提供了族和秩的确定。