全局稀疏概率PCA-Archive ouverte HAL的贝叶斯变量选择
第三条Dans Une Revue 电子统计杂志 年鉴:2018

全局稀疏概率PCA的贝叶斯变量选择

查尔斯·布韦伦

Résumé

稀疏版本的主成分分析(PCA)将自己强加为以无监督的方式选择高维数据的相关特征的简单但强大的方法。然而,当计算多个稀疏主成分时,很难解释所选变量,因为每个轴都有自己的稀疏模式,必须单独解释。为了克服这个缺点,我们提出了一种称为全局稀疏概率PCA(GSPPCA)的贝叶斯过程,该过程允许获得具有相同稀疏模式的多个稀疏分量。这允许从业者识别与描述数据相关的原始变量。为此,利用Roweis对主成分分析的概率解释和加载矩阵上的高斯先验,我们首次精确计算了贝叶斯主成分分析模型的边际似然。为了避免离散模型选择的缺点,对该框架进行了简单的松弛。它允许使用变分期望最大化算法找到模型的路径。然后在此路径上最大化精确的边际似然。该方法在真实和合成数据集上进行了说明。特别是,使用未标记的微阵列数据,GSPPCA比传统的稀疏PCA算法推断出更多相关的基因子集。
菲奇尔校长
无花果树
GSPPCAv2.pdf(782.4 Ko) 特勒充电器
原籍 菲奇尔斯(Fichiers)出品的par l’(les)auteur(s)
加载。。。

日期和版本

hal-01310409, 版本1 (09-05-2016)
hal-01310409, 版本2 (20-09-2016)

执照

身份证明人

Citer公司

Charles Bouveyron,Pierre Latouche,Pierre Alexandre Mattei。全局稀疏概率主成分分析的贝叶斯变量选择。电子统计杂志, 2018,⟨10.1214/18-EJS1450⟩.⟨hal-01310409v2⟩
778 磋商
727 交易费用

海拔高度

合作伙伴

更多