统计学及其接口

第7卷(2014年)

数字2

潜在不兼容依赖网络的标准集成与医疗数据应用

页:251 – 261

内政部:https://dx.doi.org/10.4310/SII.2014.v7.n2.a10

作者

Shyh-Huei Chen(美国北卡罗来纳州温斯顿塞勒姆维克森林医学院生物统计科学系)

Edward H.Ip(美国北卡罗来纳州温斯顿塞勒姆维克森林医学院生物统计科学系)

Yuchung J.Wang(美国新泽西州卡姆登罗格斯大学数学科学系)

摘要

有向图要么是非循环的,要么是循环的。本文重点讨论循环模型或依赖网络,它表示一组单变量条件分布。条件方法在建模中具有高度的灵活性,因为依赖网络基于这样的概念,即在给定数据集中剩余变量的情况下,估算变量的局部分布在计算上很方便。然而,在依赖网络内单独估计的条件分布的集合通常与任何联合分布都不一致。伪Gibbs采样器(PGS)通常用于估计不相容条件模型的联合分布。我们提出了一种从一组潜在不相容的单变量条件分布导出联合分布的新方法,使得给定的条件分布与根据估计的联合分布计算的条件分布之间的差异最小化。该方法基于一组分布的集合,每个分布都可以从一组给定条件分布的正则参数中导出。通过仿真实验和实际数据集,我们比较了集成方法、PGS和基于线性规划(LP)的方法的性能。我们的比较表明,集成方法的性能优于PGS和LP。集成方法具有计算效率和可扩展性,因此它有潜力为高维依赖网络寻找近似最优解开辟一条新途径。

关键词

交互特征集,条件指定模型,依赖网络,集成方法

2014年4月17日出版