分词

ParticleMDI:用于多个数据集聚类分析的粒子蒙特卡罗方法及其在癌症亚型识别中的应用。我们提出了一种新的非参数贝叶斯方法,用于在观测单元具有来自多个来源的数据的情况下进行聚类分析。我们的方法使用粒子Gibbs采样器进行推理,其中在Gibbs采样器中使用条件粒子滤波器联合更新簇分配,从而改善MCMC链的混合。我们开发了几种提高算法计算性能的方法。这些方法可以在不牺牲精度的前提下,实现一个数量级的性能改进,并且可以更广泛地应用于具有单个数据集的混合模型的贝叶斯推理。我们将我们的算法应用于243例肾肾透明细胞癌患者的风险队列的发现,使用癌症基因组图谱中的样本,这些样本有基因表达、拷贝数变异、DNA甲基化、蛋白质表达和microRNA数据。我们确定了4种不同的一致性亚型,并显示它们是生存率的预后因子(p<0.0001)。