跳到内容
得到许可的 未经许可 需要身份验证 发布人:德古意特出版社 2009年1月6日

稀疏规范相关分析及其在基因组数据集成中的应用

  • 埃琳娜·帕霍蒙科 , 大卫·特里切勒 约瑟夫·贝耶恩

具有多种表型或基因型测量的大规模基因组研究可能需要鉴定复杂的多变量关系。在多元分析中,基于相关性检查两组变量之间关系的常见方法是典型相关分析,它确定每种类型的所有变量的线性组合,两个线性组合之间的相关性最大。然而,在高维数据分析中,当考虑的变量数量超过数万时,整个特征集的线性组合可能缺乏生物合理性和可解释性。此外,样本量不足可能会导致计算问题、参数估计不准确和结果不可推广。这些问题可以通过选择变量的稀疏子集来解决,即获得每种类型变量的线性组合中的稀疏加载。在本文中,我们提出了稀疏典型相关分析(SCCA),它检查两类变量之间的关系,并通过在执行变量选择时最大化不同类型变量子集之间的相关性,提供仅包含每种类型变量的小子集的稀疏解。我们还提出了SCCA的一种扩展——自适应SCCA。我们使用模拟数据评估了它们的特性,并通过将这两种方法应用于人类基因表达的自然变异研究来说明实际用途。

在线发布:2009-1-6

©2011 Walter de Gruyter GmbH&Co.KG,柏林/波士顿

于2024年4月24日从下载https://www.degruyter.com/document/doi/10.2202/1544-6115.1406/html
滚动到顶部按钮