生成相关和/或过度分散的计数数据:SAS实现

乔治·卡莱马, 吉尔特·莫伦伯格

主要文章内容

摘要

长期以来,对纵向计数数据的分析一直使用泊松正态版本的广义线性混合模型(GLMM),通过指定正态随机效应来解释相关性。考虑到伽玛随机效应的过度分散,单变量计数通常采用负细胞瘤(NEGBIN)模型进行处理。然而,从本质上讲,纵向计数数据通常同时表现出相关性和过度分散的特征,因此需要能够解释这两者的分析方法。Molenberghs、Verbeke和Demétrio(2007)以及Molenbergs、Verbeker、Demètrio和Vieira(2010)引入的组合模型(CM)不仅用于计数数据,也用于一般指数分布族。这里,泊松模型被指定为数据的父分布,在主题或簇级别具有正态分布的随机效应,和/或在观测级别具有伽马分布。GLMM和NEGBIN模型是特殊情况。数据可以从(1)具有随机效应的一般CM或(2)其边际版本直接进行模拟。本文讨论了(1)在SAS软件(SAS Inc.,2011)中的实现。人们需要考虑组合(层次)模型和边际模型的平均值,以便生成相关和/或过度分散的计数。需要预先指定期望的边际均值(就协变量和边际参数而言)、边际方差-协方差结构和层次均值(就协方差和回归参数而言)。然后导出隐含的层次参数、随机效应的方差-方差矩阵和过分散部分的方差-变异矩阵,并由此生成相关的泊松数据。给出了SAS宏的示例调用以及输出。

文章详细信息

文章提要栏