个性化PCA:脱钩共享和独特功能
Raed Al Kontar,Naichen Shi; 25(41):1−82, 2024.
摘要
在本文中,我们解决了主成分分析中的一个重大挑战:异质性。当从具有异质趋势的不同来源收集数据时,在保持某些一致性的同时,提取共享知识并保留每个来源的独特特征是至关重要的。为此,我们提出了个性化PCA(PerPCA),它使用相互正交的全局和局部主成分来编码唯一和共享特征。我们表明,在温和的条件下,即使协方差矩阵相差很大,也可以通过约束优化问题识别和恢复唯一特征和共享特征。同时,我们设计了一个受分布式Stiefel梯度下降启发的全联邦算法来解决这个问题。该算法引入了一组称为广义收缩的新操作来处理正交约束,并且只需要跨源共享全局PC。我们在适当的假设下证明了算法的线性收敛性。全面的数值实验突出了PerPCA在从异构数据集进行特征提取和预测方面的卓越性能。作为一种从异构数据集解耦共享和独特特征的系统方法,PerPCA在多个任务中找到了应用,包括视频分割、主题提取和特征聚类。
[腹肌]
[pdf格式][围兜] [代码]