×

高维非平衡logistic回归的有效后验抽样。 (英语) Zbl 1457.62221号

摘要:使用高维数据进行分类具有广泛的兴趣,通常涉及处理不平衡数据。贝叶斯分类方法受到以下事实的阻碍:当前用于后验计算的马尔可夫链蒙特卡罗算法由于每一步的计算时间增加和混合率恶化,随着预测器数量或分类对象数量的增加而变得效率低下。一种策略是使用基于梯度的采样器来改善混合,同时使用数据子样本来降低每一步的计算复杂性。然而,当应用于不平衡数据时,通常的子采样会中断。相反,我们将分段确定马尔可夫链蒙特卡罗算法推广到包括重要性加权子抽样和小样本子抽样。这些方法使用任意小的子样本保持正确的平稳分布,并大大优于当前的竞争对手。我们为所提出的方法提供了理论支持,并在模拟数据示例和癌症数据应用中展示了其性能增益。

MSC公司:

62J12型 广义线性模型(逻辑模型)
62H30型 分类和区分;聚类分析(统计方面)
2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用