摘要
摘要本文研究了n维协方差矩阵的稀疏主成分分析(SPCA)问题,目的是利用混合整数优化找到具有稀疏性k的解。我们提出了一种量身定制的分枝定界算法Optimal-SPCA,它使我们能够在数秒内将SPCA求解为可证明的最优性$$n=100$$n个=100第页,$$k=10$$k个=10第条。同样的算法也可以应用于$$n=10{,}000\,\mathrm{s}$$n个=10,000秒或更高级别,以在几秒钟内找到高质量的可行解决方案,同时需要几个小时来证明最佳性。我们将我们的方法应用于许多实际数据集,以证明我们的方法适用于其他方法尝试的相同问题规模,同时与这些方法相比提供了更好的解决方案,解释了更高的方差部分,并允许完全控制所需的稀疏性。作为提交文件的一部分进行审查的软件已获得DOI(数字对象标识符)https://doi.org/10.5281/zenodo.2027898.