综合主成分分析

Tiffany M.Tang,Genevera I.Allen。

年份:2021年,数量:22,版本:198,页码:1−71


摘要

数据集成,或同时对多个数据源进行战略分析,通常会导致发现隐藏在单个数据源的个性化分析中。我们开发了一种新的无监督数据集成方法,称为集成主成分分析(iPCA),它是基于模型的主成分分析的泛化,是一种实用工具,用于发现和可视化多个数据集中出现的常见模式。推动iPCA的关键思想是矩阵变量正态模型,其Kronecker乘积协方差结构捕获每个数据集中的单个模式和多个数据集共享的联合模式。在这个模型的基础上,我们为iPCA开发了几种惩罚(稀疏和非解析)协方差估计,并利用测地凸性证明了我们的非解析iPCA估计收敛于非凸问题的全局解。我们还通过广泛的模拟和阿尔茨海默病综合基因组学的案例研究应用,展示了iPCA的实际优势。特别是,我们表明,通过iPCA提取的关节模式可以高度预测患者的认知和阿尔茨海默病的诊断。

PDF格式 BibTeX公司 代码