总结

在纵向研究中,了解重复测量或聚集测量的均值函数、方差函数和相关性的动力学至关重要。对于协方差结构建模,基于Cholesky类型分解的方法已被证明是有效的。然而,直接揭示纵向测量之间相关性结构的简约方法仍然没有得到很好的探索,现有的联合建模方法在解释协变结构时可能会遇到困难。我们提出了一种用于纵向研究的新型联合均值-方差相关建模方法。通过应用超球面坐标,我们获得了相关矩阵的无约束参数化,该参数化自动保证其正定性,并开发了一种回归方法,通过利用参数化对纵向测量的相关矩阵进行建模。所提出的建模框架对于纵向数据的分析是简约的、可解释的和灵活的。大量数据示例和仿真支持了所提方法的有效性。

1.简介

纵向研究涉及在一段时间内反复观察相同的变量,这在心理学、社会科学、经济学和医学中很常见。由于收集到的同一受试者的观察结果并非独立的,因此在分析纵向研究数据时有效利用相关测量值至关重要。挖掘. (2002)强调了这一问题,并出色地概述了对这类数据集建模的各种方法。

文献中广泛研究了用于理解纵向数据的均值和方差函数回归模型;比如,看梁和泽格(1986)、林和卡罗尔(2006),风扇. (2007)、范和武(2008)以及其中的参考。在均值-方差模型框架的基础上,通过使用具有一些指数参数的自回归移动平均模型来指定相关结构;例如,参见Diggle. (2002),风扇. (2007)、范和武(2008)和Qu. (2000)。然而,这种统计方法不允许更一般形式的相关性结构,也不能灵活地纳入可能有助于解释协变量的协变量。为了克服这一局限性,平均值和协方差的联合建模成为纵向数据分析的一种流行方法,最近受到了越来越多的关注;例如,看,Pourahmadi(1999,2000,2007)潘和麦肯齐(2003)、叶和潘(2006)Daniels和Pourahmadi(2009),冷. (2010)张和冷(2012)。为了对协变量进行简约建模,Pourahmadi首先应用了修正的Cholesky分解(MCD)(1999)获得协方差矩阵的无约束参数化。这种分解的一个有趣的方面是,此分解中的条目具有自回归和对数更新解释。Pourahmadi公司(2007)指出Chen和Dunson研究的分解(2003)可以理解为建模某些移动平均参数和创新方差。最近,张和冷(2012)考虑一种替代分解,其中条目具有移动平均和对数更新解释;另见姚明和李娜(2013)他们将MCD用于纵向数据的非参数回归。这些方法的回顾将在后面的章节中介绍。尽管证明了这些方法的节约型和有效性,但可以将其视为间接建模纵向测量的方差和协方差。更具体地说,由于分解,上述方法产生的方差函数不能直接解释为重复测量的方差函数。此外,当应用这些方法时,协方差和相关结构也会出现相同的解释问题。因此,对于实际应用,需要额外的努力和额外的注意来解释产生的方差和协方差函数。

毫不奇怪,相关性矩阵的要求阻碍了建立相关性结构模型的通用回归方法的发展。具体来说,相关性矩阵具有对角项1,并且必须是半正定的,元素的值介于-1和1之间。因此,基于相关矩阵的直接Cholesky型分解的回归方法很难满足要求,因此在这种情况下遇到了很大的困难,我们提出了一种新的联合均值-方差相关建模方法,该方法直接针对纵向数据中的方差和相关性。为此,我们通过使用角度和三角函数在超球面坐标中表示相关矩阵,探索了一种新的相关矩阵装置。这样的参数化是非常有吸引力的,因为得到的参数在其支持上是不受约束的,并且相对于相关性是可以直接解释的。然后,我们建议基于这些角度构建一个简约回归模型,并应用最大似然方法进行参数估计和统计推断。我们的方法为描述一般相关纵向数据中的协变量提供了一个简洁、可解释、高效和灵活的框架。最重要的是,这种参数化和回归模型由实际应用程序的数据支持。对于第节中的平衡纵向数据集从图中可以清楚地看到,经验相关矩阵可以从残差中计算出来。作为协变量,角度和时滞之间存在某种功能关联。此外,我们还发现,通过在仿真和数据分析中比较Kullback–Leibler散度和各种方法的信息标准,提出的方法是首选的。沿着探索无约束参数化的路线,Daniels和Pourahmadi(2009)通过部分自相关及其递推关系将相关矩阵参数化,但他们既没有研究有效的最大似然估计,也没有研究实际观测纵向研究中流行的非平衡数据模型。与Daniels和Pourahmadi相比(2009),我们的方法更自然地处理不平衡的纵向数据。

本文的其余部分组织如下。章节2阐述了新的参数化及其解释,提出的联合建模方法,该方法的计算算法和理论性质。通过将我们的方法应用于包括平衡和非平衡数据集在内的实际数据分析,我们提供了大量的数值示例,并在第节中进行了模拟比较数值结果证实了新联合建模方法的吸引力。我们总结了本文的主要发现,并在第节概述了未来的研究4在线上给出了主要结果的技术证明以及从几何角度对新参数化的附加解释补充材料用于本文。

本文中分析的数据和用于分析它们的程序可以从中获得

http://wileyonlinelibrary.com/journal/rss-datasets

2.方法

2.1. 纵向数据建模

首先介绍了一些符号。我们有通用的纵向测量=(1,,)T型(=1,,n个)收集自n个受试者,有时观察t吨=(t吨1,,t吨)T型。这里我们允许重复测量的次数 和时间t吨 特定于主题,以便可以使用我们的框架分析在不规则时间点观察到的数据集和不平衡的纵向数据。我们表示为μ ij公司σj个2分别为 ij公司给定时间的协变量信息t吨 ij公司.数量建模μ ij公司σj个2现有文献对协变量的函数进行了广泛的研究;例如,参见Diggle. (2002)、林和卡罗尔(2006),风扇. (2007)、范和武(2008),王(2003)以及其中的参考。

纵向数据分析中的一个关键考虑因素是 并且已经表明结合相关性是有效地利用统计推断中的数据信息的关键(Liang和Zeger,1986; 挖掘。,2002; 林和卡罗尔,2006)。为了演示的简单明了,我们在下文中假设 N个(μ ,Σ )其中μ=(μ1,,μ)T型,Σ =D类  R(右)  D类 ,D类=诊断(σ1,,σ)、和R(右)=(ρj个k个)j个,k个=1是的相关矩阵 具有ρ ijk公司=校正( ij公司, 伊克)是j个th和k个第次测量主题。这里可以放宽分布假设,我们可以使用估计方程方法(Liang和Zeger,1986)而不是推理的似然方法,这样我们的方法在实践中的通用性就不会受到影响。

2.2. 现有方法

在一类建模方法中,R(右) 由相关矩阵指定为观测时间的函数t吨 -即corr( ij公司, 伊克) =ρ(t吨 ij公司,t吨 伊克;α)其中ρ(t吨 1,t吨 2;α)是的正定函数t吨 1t吨 2,并由某个未知参数索引α。我们指的是Liang和Zeger(1986)作为这类方法的开创性工作;另见林和卡罗尔(2006),风扇. (2007)、范和武(2008)以及其中的参考文献,以了解这一研究领域的最新发展。正定函数的有限选择严重限制了这些方法的适用性。克服为指定模型的困难R(右) ,曲. (2000)建议建模R(右)1通过一系列基矩阵的加权和,即。R(右)1=Σ=1M(M)对于已知矩阵M(M) 1,…,M(M) 和未知常数 1,…, 然后,他们使用二次推理函数方法进行统计推断。虽然这种方法通常为平均参数提供更有效的估计,但尚不清楚协变量如何影响协变量。

在实践中,有必要研究以下自适应建模方法:R(右) 以及探索更广泛的信息t吨 这可能会影响 Pourahmadi公司(1999)建议将协方差矩阵参数化Σ 通过修改的Cholesky分解P(P)ΣP(P)T型=Γ2,其中P(P) = (第页 ijk公司) (j个,k个= 1,…, )是一个对角线上有1s的下三角矩阵Γ=诊断(γ1,,γ)是一个 -维对角矩阵。马上,我们就知道下面的三角形条目第页 ijk公司不受约束。这种分解与自回归模型有关
j个μj个=k个=1j个1第页j个k个(k个μk个)+εj个(=1,,n个;j个=2,,),
(1)
其中ɛ ij公司具有创新方差的自主创新定义为无功功率,无功功率(εj个)=γj个2、和第页 ijk公司s是所谓的自回归系数,因为它们与时间序列分析中的类似成分相似。Pourahmadi公司(1999)建议链接第页 ijk公司通过回归模型协变量。通过注意到Σ=Γ2T型哪里 = (q个 ijk公司) (j个,k个= 1,…, )是一个对角线上有1s的下三角矩阵Γ 定义如上,张和冷(2012)具有特征的q个 ijk公司作为模型中的移动平均参数j个μj个=Σk个=1j个1q个j个k个εk个+εj个(= 1,…,n个;j个= 2,…, )并建议指定q个 ijk公司作为协变量的参数化函数。通过类似于Pourahmadi的分解(1999)、Chen和Dunson(2003)处理Σ=ΓP(P)~P(P)~T型Γ,其中P(P)~=Γ1Γ.波拉赫马迪(2007)通过重新缩放的移动平均模型解释此分解中的条目
j个μj个γj个=εj个+k个=1j个1第页~k个εk个(=1,,n个;j个=2,,),
其中ɛ ij公司与var无关(ɛ ij公司)=1. 然而,在这类联合均值-协方差建模方法中Γ2不是纵向响应的条件方差 给定协变量。要提取方差信息,必须将各自的分解转换回原始协方差矩阵,该协方差矩阵对协变量给出非平凡的解释。同样,还需要额外的步骤来研究R(右) 作为量化纵向测量之间相关性的实用目标。因此,在实践中需要额外的努力和谨慎,才能应用上述方法来解释方差和协变量中的特征。
Daniels和Pourahmadi的相关工作(2009)利用部分自相关矩阵研究了一种替代的无约束参数化方法×相关矩阵R(右)通过Π= (π ij公司) (,j个= 1,…,)其中πj个=πj个=腐蚀,腐蚀(,j个|+1,,j个1)是之间的偏自相关系数  j个如果j个>+1,否则π ij公司=ρ ij公司,的(,j个)的第个元素R(右)此外,偏相关与R(右)递归通过
πj个(j个+k个)=ρj个(j个+k个)第页1T型(j个,k个).9第页t吨R(右)2(j个,k个)1第页(j个,k个){1第页1T型(j个,k个)R(右)2(j个,k个)1.9第页t吨第页1(j个,k个)}1/2{1第页T型(j个,k个)R(右)2(j个,k个)1第页(j个,k个)}1/2
对于j个= 1,…,k个k个= 1,…,−1,其中第页1T型(j个,k个)=(ρj个(j个+1),,ρj个(j个+k个1)),第页T型(j个,k个)=(ρ(j个+k个)(j个+1),,ρ(j个+k个)(j个+k个1))R(右) 2(j个,k个)是与分量对应的相关矩阵j个+1,…,j个+k个−1.与我们的方法类似的一个特点是π ij公司在里面Π可以在区间(−1,1)内自由变化,并在使用Fisher公式后取整条实线上的值z(z)-转型。丹尼尔斯和波拉赫马迪(2009)专注于贝叶斯方法的参数推断,而不是研究有效的最大似然方法。显然,从相关系数到部分自相关系数的映射是复杂的,费希尔信息的计算对于统计推断来说可能是困难的。如何将此参数化应用于不平衡纵向数据,目前还没有很好的探索。

2.3. 相关矩阵的无约束参数化及其解释

在本研究中,我们建议将R(右) 通过分解超球面坐标
R(右)=T型T型T型,
(2)
哪里T型 是下三角矩阵,由
T型=1000c(c)212100c(c)31c(c)323132310c(c)1c(c)21c(c)21π=11
(3)
c(c) ijk公司=cos(ϕ ijk公司)和 ijk公司=正弦(ϕ ijk公司)是角度的三角函数ϕ ijk公司换句话说,下对角线矩阵中的非零项T型 由提供T型 11= 1,T型 ij公司1=余弦(ϕ ij公司1)的j个= 2,…, 、和
T型j个k个=余弦(ϕj个k个)π=1k个1(ϕj个),2k个<j个,π=1k个1(ϕj个),k个=j个,j个=2,,.
(4)
这里是角度的总数ϕ ijk公司(1⩽k个<j个 )在表达式中()和(4)是 ( −1)/2,这与无约束相关矩阵中的自由参数相同R(右) 在方程式中(2)有几个优点。首先,列T型T型是单位向量R(右),以及三角表达式()确保T型T型T型为1,所有其他元素介于−1和1之间。第二,T型T型T型总是非负定的,满足相关矩阵的要求。然而,由于R(右) 是对称半正定矩阵,总是有下三角矩阵T型 这样的话R(右)=T型T型T型根据初等代数,我们可以在表达式中取角度()和(4)作为
ϕj个k个=余弦1T型j个k个/π=1k个1{余弦1(T型j个)},1k个<j个,
(5)
哪里Π10取1。因此,表达式(5)可以看作是一般相关矩阵的映射R(右) 角度。此外,映射(5)通过限制角度范围而独特{ϕ ijk公司}为[0,π)(拉皮萨尔达。,2007)。对于独特的模型识别,我们将采用所有角度ϕ ijk公司在[0中,π)以下。因此,角度模型{ϕ ijk公司}矩阵中()相当于相关矩阵的模型。矩阵最突出的优点是()那是角度吗{ϕ ijk公司}由于参数在[0范围内不受约束,π)。如果需要,进一步的变换(如涉及逆切线变换的变换)可以在整个实线(−∞,∞)上给出无约束的参数化。我们在数据分析和模拟研究中观察到,无需进一步转换即可对角度建模。这有助于为相关矩阵提供方便灵活的建模设备。此参数化之前由Creal研究. (2011)在不同的背景下对多元金融时间序列之间的相关性进行建模。
通过采取Σ10=0并注意到T型 ijk公司在表达式中(4)可以通过相关性递归表示ρ ijk公司作为
T型j个k个=ρj个k个=1k个1T型j个T型k个1=1k个1T型k个2,
我们从表情上观察(5)角度可以表示为相关函数。相反,根据方程式(2),ρ ijk公司可以用角度的函数表示ϕ ijk公司作为
ρj个k个=余弦(ϕj个k个)π=1k个1(ϕj个)(ϕk个)+=1k个1余弦(ϕj个)余弦(ϕk个)πt吨=11(ϕj个t吨)(ϕk个t吨)
(6)
对于1⩽k个<j个 。我们注意到该等式(6)在相关性和角度之间建立层次关系。明确地,ρ ij公司1=cos(ϕ ij公司1) (j个= 2,…, )、和ρ ijk公司取决于ϕ ijk公司仅通过cos(ϕ ijk公司)给定先例角度ϕ ist(存在)(2⩽<j个;1⩽t吨<k个)或者,等价地,基于给定的相关性ρ ist(存在)(2⩽<j个;1⩽t吨<k个)。这种层次连接确保了上述关联矩阵的内在结构要求(6),我们看到了
ρj个k个ϕj个k个=(ϕj个k个)π=1k个1(ϕj个)(ϕk个)0
因为所有角度都在[0,π),暗示着ρ ijk公司单调性在ϕ ijk公司此外,因为在实践中,纵向研究中测量值之间的依赖性通常随时间滞后而衰减ρ ijk公司预计两次测量之间存在较大的时滞。由于cos(ϕ)是[0上的单调递减函数,π),从等式中期望是很自然的(6)那个ϕ ijk公司随着j个th和k个次测量。我们的实证数据分析也证实了这一预期;见图6在第节的数值示例中.

我们现在通过一个图来说明相关性和角度之间的几何关系,当= 3. 在图中。1,t吨 1,t吨 2t吨 是中的三个单位向量T型在三维单位球上,两角的余弦等于三个纵向测量值之间的各自相关性;ϕ 21,ϕ 31ϕ 32是参数化中的角度(2)和(4)。显然,ϕ 21,之间的角度t吨 2t吨 1、和ϕ 31,之间的角度t吨 t吨 1,直接反映第一个测量值与其他两个测量值之间的相关性。一次ϕ 21ϕ 31或者,等效地,指定了第一和第二测量值之间以及第一和第三测量值之间的相关性ϕ 32以及第二次和第三次测量之间的相关性。等效地,三个角度之间存在一对一的对应关系ϕ 21,ϕ 31ϕ 32以及三个测量值之间的对应关系。有关新参数化的一般几何解释的更多详细信息,请访问在线补充材料为论文撰写。

相关性和角度的三维图形表示:e1、e2和e3是标准基,t1、t2和t3是单位球中的三个单位向量,其中两两角度的余弦等于三个纵向测量值之间的各自相关性,21,31和32是参数化(2)和(4)中的角度,P2=diag(0,1,1)是矩阵,使得P2 t3是向量t3到{e2,e3}所跨越的子空间的投影
图1。

相关性和角度的三维图形表示:e(电子) 1,e(电子) 2e(电子) 是规范基础,t吨 1,t吨 2t吨 是单位球中的三个单位向量,其中两两角度的余弦等于三个纵向测量值之间的各自相关性,ϕ 21,ϕ 31ϕ 32是参数化中的角度(2)和(4),P(P) 2=diag(0,1,1)是这样的矩阵P(P) 2 t吨 是向量的投影t吨 进入跨越的子空间{e(电子) 2,e(电子) }

2.4。提议的方法

根据上述讨论,R(右) 通过角度参数化ϕ ijk公司(= 1,…,n个;1⩽k个<j个 )可以看作是超球面坐标系中相关矩阵的等价表达式。R(右)=T型T型T型保证了半正定和参数化中的角度()不受[0,π),我们可以通过回归作为一些协变量的函数来自由地描述这些角度。实际上,可以通过检查观察到的纵向数据的经验方差和相关性来初步评估这种理论基础。对于平衡的纵向研究,如第,角度的初始版本ϕ ijk公司可以通过均值-方差模型拟合后的标准化残差的经验相关矩阵获得。通过检查这些角度的绘图ϕ ijk公司相对于图中的时间滞后。第节后面,我们清楚地观察到支持某些功能关联的曲率。从那里,可以使用适当的模型来描述这种曲率。

为了更清楚地说明所建议的参数化的优点,我们现在检查所建议的对两个常用的相关结构的参数化行为。

示例1:对于×复合对称相关矩阵R(右)= (1 −ρ) +ρ J型 ,其中 -维单位矩阵和J型 是一个×1s矩阵,矩阵的元素T型可以被视为
T型11=1,T型j个1=ρ,T型j个j个=1(j个1)ρ21+(j个2)ρ1/2,j个2,T型j个k个=ρ{1+(j个1)ρ}1T型k个k个,2k个<j个.
因此,角度由表达式指定(5).

示例2:对于AR(1)相关矩阵R(右)=(ρ|j个k个|)j个,k个=1,的元素T型被发现为T型j个1=ρ|j个1|,j个=1,,,T型j个k个=ρ|j个k个|/(1ρ2),2k个<j个.然后通过表达式指定角度(5),这些是的功能ρ和时间j个k个.

这两个示例显示了两个参数化的等价性:一个在传统参数化下,另一个在建议的参数化下。为了更仔细地检查我们的模型,我们在图。2ϕ jk公司 时滞|j个k个|对于复合对称和AR(1)相关结构ρ= 0.5. 显然,这些散点图大致表明了一些函数关系。更具体地说,复合对称结构可以用时滞多项式和对应于测量顺序的因子来解释,而AR(1)模型可以用时滞的多项式来很好地解释。虽然不精确,但基于这些角度构建的回归模型相当接近这些常用的相关性。因此,所建议的参数化对于捕捉这些相关结构中的动力学具有灵活性和自适应性。

5×5(a)复合对称性和(b)AR(1)相关矩阵ρ=0.5的角ψ与滞后的曲线图:点通过其在T j(,第二行;,第三行;,四行;×,第五行)中的行号进行标记
图2。

角度图与5×5(a)复合对称和(b)AR(1)相关矩阵的滞后ρ=0.5:点按中的行号进行标记T型 j个(图解的,第二排;图解的,第三排;图解的,第四排;×,第五排)

基于上述考虑,我们提出了一个平均值、方差和相关性的联合回归模型
(μj个)=x个j个T型β,日志(σj个2)=z(z)j个T型λ,ϕj个k个=w个j个k个T型γ,
(7)
哪里μ ij公司σj个2(= 1,…,n个;j个= 1,…, )分别是j个第次测量主题。如前所述,对于第个主题,ϕ ijk公司(= 1,…,n个;1⩽k个<j个 )反映了j个th测量和k个第次测量与第一次测量的相关性k个规定了-1个测量值。我们将回归模型施加在对数方差上,使方差函数自动非负,并且支持λ不受约束。在该配方中,x个 ij公司,z(z) ij公司w个 ijk公司第页×1,q个×1和d日×1个通用协变量载体可用,(·)是一个已知的链接函数,通常被视为线性模型中的恒等函数,以及β,γλ是表征均值、方差和相关性的未知参数。协变量x个 ij公司z(z) ij公司以类似于异方差回归模型中的方式指定。协变量w个 ijk公司应包括可能取决于时间的时变协变量t吨 ij公司t吨 伊克因为它用于捕获这两次响应之间的相关性。实际上w个 ijk公司包括(t吨 ij公司,t吨 伊克)T型和它的高阶项,或时滞的多项式(t吨 伊克t吨 ij公司)从而得出的相关性是平稳的(Ye和Pan,2006)。实际上,这些协变量可以通过图形工具指定,例如我们用于分析第或通过模型选择技术,其中许多潜在的相关协变量最初进行拟合,然后进行选择。至于范围ϕ ijk公司,我们从数据分析和模拟中获得的经验是ϕ ijk公司s始终在[0,π)。如果其范围值得关注,可以应用诸如逆切线变换之类的变换来确保ϕ ijk公司落在[0,π)。值得注意的是,我们的框架很容易推广到非参数和半参数模型,尽管本文的重点是表达式中的参数模型(7).
拟合表达式指定的关节模型(4)和(7)在正态性假设下,我们注意到
T型j个k个γ=T型j个k个{w个j个k个棕褐色的(ϕj个k个)+=1k个1w个j个棕褐色的(ϕj个)}k个<j个,T型j个k个=1k个1w个j个棕褐色的(ϕj个),k个=j个,
(8)
为了简单起见,其中的符号Σ10在本文中被理解为0。通过出租μ=(μ1,,μ)T型,D类=诊断(σ1,,σ),θ= (β T型,γ T型,λ T型)T型并注意到Σ =D类  R(右)  D类 ,对数似然的负两倍,直到一个常数,由下式给出
2(θ)==1n个日志|D类R(右)D类|+=1n个第页T型D类1R(右)1D类1第页,
(9)
哪里第页 = μ 。我们定义Δ=Δ(Xβ)=诊断{˙1(x个j个T型β),,˙1(x个T型β)}哪里˙1(·)是反向链接函数的导数 −1(·)我们注意到μ(·) = −1(·). 我们还定义
b条j个k个==k个j个T型k个γj个
具有 国际jl成为(j个,)的元素T型1、和小时=诊断(R(右)1D类1第页第页D类1).让ϵ=(ϵ1,,ϵ)T型=T型1D类1第页,因此ϵ1,,ϵ是独立的标准正态随机变量,表示为1这个 ×1个元素为1的向量。以下基于可能性的得分方程可通过直接计算得出:
U型1(β;γ,λ)==1n个XT型ΔΣ1(μ)=0,U型2(γ;β,λ)==1n个j个=1{日志(T型j个j个)γ(ϵj个21)+ϵj个k个=1j个1b条j个k个ϵk个}=0,U型(λ;β,γ)=12=1n个Z轴T型(小时1)=0.
(10)
然后我们估计θ通过最小化表达式(9)通过迭代Newton–Raphson算法。因为解满足方程(10),参数β,γλ在优化过程中其他参数保持不变的情况下,可以逐个顺序求解。更具体地说,我们应用了以下准Fisher评分算法。
  • 第1步:将参数初始化为β (0),γ (0)λ (0).设置k个= 0.

  • 第2步:计算Σ 通过使用γ (k个)λ (k个).更新β作为
    β(k个+1)=β(k个)+111(θ)U型1(β;γ,λ)|β=β(k个).
    (11)
  • 步骤3:给定β=β (k个+1),更新γλ通过使用
    γ(k个+1)λ(k个+1)=γ(k个)λ(k个)+(22(θ)23(θ)32(θ)33(θ)1U型2(λ;β,γ)U型(λ;β,γ)]|γ=γ(k个),λ=λ(k个).
    (12)
  • 第4步:设置k个k个+1并重复步骤2和3,直到满足预先指定的收敛标准。

的表达式 jk公司(θ),j个,k个=1、2、3,见下一小节。我们注意到该算法更新了γλ由这两个参数的渐近依赖性共同驱动,如第节中的定理1所示2.5由于似然函数不是参数在其支持下的全局凸函数,因此只能保证算法收敛到局部最优。为了选择合适的初始值,我们设置Σ s在求解时初始为单位矩阵β在方程式中(11)采用最小二乘估计作为初始值。然后我们开始γ在方程式中(12)通过假设R(右)=,的 -的维数单位矩阵第th个受试者,并使用基于残差的最小二乘估计器来获得λ不难看出βλ为√n个一致。根据下一小节定理1中的理论分析和附录A中的证明,负对数似然函数在真参数的小邻域附近是渐近凸的。为了确保最佳值是全局的,我们可以尝试对以下项使用多个初始值γ对于我们的数据分析和仿真研究,该算法非常稳定,没有发现多个最优解,并且通常在几次迭代中即可收敛。

2.5. 理论性质

(θ)= −E类(∂2 /∂θθ T型)为负期望Hessian矩阵。我们的理论分析假设以下正则性条件。

条件1

尺寸第页,q个d日协变量的x个 ij公司,w个 ijk公司z(z) ij公司固定;n个→ ∞ 最大值1n个是有界的。

条件2

参数空间Θ第页,共页(β T型,γ T型,λ T型)T型是一个紧凑的集合R(右)第页+q个+d日,以及真实值θ0=(β0T型,γ0T型,λ0T型)T型位于的内部Θ.

条件3

作为n个→ ∞,n个 −1 (θ 0)收敛到正定矩阵(θ0).

从实际角度来看,条件1通常用于纵向数据。条件2是最大似然法理论分析的传统假设。条件3是非平衡纵向数据建模中回归分析的自然要求。我们建立了最大似然估计量的下列渐近结果。

定理1

在规则条件1-3下,如n个→ ∞, 我们有这个

  • 最大似然估计(β^T型,γ^T型,λ^T型)T型与真实值强一致(β0T型,γ0T型,λ0T型)T型

  • (β^T型,γ^T型,λ^T型)T型渐近正态分布为n个(θ^θ0)N个{0,(θ0)1},其中(θ0)是条件3中定义的Fisher信息矩阵。

以下表达式(10),如附录A所示(θ)满足
11(θ)==1n个XT型ΔΣ1ΔX,12(θ)=21T型(θ)=0,13(θ)=31T型(θ)=0,23(θ)=32T型(θ)==1n个j个=1{日志(T型j个j个)γz(z)j个T型+12k个=1j个1b条j个k个=k个j个T型k个j个k个z(z)T型},
 
22(θ)==1n个j个=12日志(T型j个j个)γ日志(T型j个j个)γT型+k个=1j个1b条j个k个b条j个k个T型,33(θ)=14=1n个Z轴T型(+R(右)1R(右))Z轴,
其中“∘”表示Hadamard产品。β^,γ^λ^对于θ 0,渐近协方差矩阵可以通过一个矩阵一致地进行估计,该矩阵的块分量由以下公式给出
^j个=n个1j个(θ^)(,j个=1,2,).
(13)
根据定理1,β^渐近独立于γ^λ^对于正态分布数据的统计推断来说,这并不奇怪,因为β^关于平均函数,以及γ^λ^是协变量的参数。从广义估计方程的观点和表达式(10),我们还可以看到估算的最佳效率β无论何时Σ s或的模型σj个2ϕ ijk公司是正确指定的,这让人想起梁和泽格在广义估计方程中的结果(1986)。如果模型用于Σ 指定错误,β^在Liang和Zeger中的结果仍然一致且渐近正常(1986),尽管β^将采取三明治形式。然而,这两个协变参数γ^λ^与Pourahmadi研究的修改的Cholesky分解中的参数不同,它们通常不是渐近独立的(1999)张和冷(2012).
我们现在讨论一个更一般的结果,它只需要平均模型β正确指定。回想一下Kullback–Leibler散度KL((f) 0 (f) c(c))在具有密度的真实模型之间(f) 0平均值μ 0=μ(X T型 β 0)和具有密度的工作模型(f) c(c)N个 {μ(β),Σ}定义为
吉隆坡((f)0|(f)c(c))=E类(f)0日志(f)0(f)c(c)=E类(f)0{日志((f)0)}E类(f)0{日志((f)c(c))}=E类(f)0{日志((f)0)}E类(f)012(Y(Y)μ)T型Σ1(Y(Y)μ)12日志|Σ|+2日志(2π)=12{信托收据(Σ0Σ1)+(μ0μ)T型Σ1(μ0μ)+日志|Σ|}+E类(f)0{日志((f)0)}2日志(2π).
我们定义了一个新的总体参数向量θ*=(β*T型,γ*T型,λ*T型)T型成为吉隆坡((f)0|(f)c(c)).

推论1

在规则条件1–3下θ 0替换为θ *,作为n个→∞,我们得到了最大似然估计θ^θ *; 具体来说,如果平均值模型(7)正确指定,β *=β 0β^是对真理的一致估计β 0.

推论1的第一部分直接遵循定理2.2白色的(1982)。此外,当平均结构被正确指定时,我们可以从吉隆坡((f)0|(f)c(c))最小值β *必须等于β 0如果平均函数被正确指定。因此β^既不依赖于正态性假设,也不需要在表达式中正确说明方差和相关性模型(7)。这一结果与广义估计方程方法(Liang和Zeger,1986)。只要正确指定平均模型,协方差的估计不会影响平均参数的一致性,而只会影响其效率。

3.数值示例

3.1. 牛的数据

我们首先将我们的方法应用于Kenward的平衡纵向数据集(1987)将牛随机分为两个治疗组A和B,在133天的时间内对其体重进行了11次测量。如在Pourahmadi(2000)潘和麦肯齐(2003),我们使用11个参数的饱和平均模型对A组的30只动物进行了研究。潘和麦肯齐(2003)发现用三个多项式来表征模型中的均值、自回归系数和对数创新方差是合适的(1)基于改进的Cholesky分解。使用贝叶斯信息准则BIC,他们发现多项式阶的最优三元组是(8,4,3)。

在这里,我们用我们的联合建模方法重新检查这个数据集。对于平衡纵向数据,相应的角度ϕ ijk公司经验相关矩阵的(5)。通过检查角度图中测量之间的时间滞后。,我们看到一个清晰的曲率模式,可以用多项式合理地捕捉到。图。还通过检查对数样本方差来指示曲率模式测量时间。

牛数据的样本“回归图”和拟合曲线(,LOWESS曲线;,拟用模型拟合的直线;,渐近95%逐点置信区间):(a)ijk与时间滞后;(b) 对数方差与时间的关系
图3。

牛数据的样本“回归图”和拟合曲线(图解的,LOWESS曲线;图解的,拟用模型拟合的直线;图解的,渐近95%逐点置信区间):(a)ϕ ijk公司 时滞;(b) 对数方差时间

受图激励。,我们通过定义时滞的多项式对所提出的相关参数化中的角度进行建模w个 ijk公司.跟随Pourahmadi(1999)潘和麦肯齐(2003),我们应用两个时间多项式来定义x个 ij公司z(z) ij公司用于建模均值和对数方差。以下BIC标准用于选择最佳模型(Pan和MacKenzie,2003; 张和冷,2012):
银行识别码(第页,q个,d日)=2^最大值/n个+(第页+q个+d日+)日志(n个)/n个,
(14)
哪里第页,q个d日分别是上述三个多项式的阶数,以及^最大值是给定订单的对应对数似然的最大值。众所周知,BIC标准在选择候选模型(Shao,1997)。使用我们的方法得到的最优三元组是(8,2,2),BIC值为52.03^最大值=755通过与最优三重态(8,4,3)和^最大值=1045.40Pan和MacKenzie的(2003)最好的模型,我们清楚地看到,我们的方法产生了更大的可能性和更小的BIC值,这表明所提出的参数化更适合使用更为简约的模型的数据。有趣的是,通过二次多项式对方差和相关性进行建模就足够了,得到了一个比Pan和MacKenzie中的方法更简单的模型(2003)。如前所述,改进的一个可能原因是所提出的建模方法更加灵活和自适应,以便更好地拟合纵向数据。我们注意到,角度的拟合模型暗示了与时滞的单调关系,这与表达式一致(6).

表中给出了一些选定模型的似然函数和BIC值1用于比较。图。4描述了拟合的相关性和方差,实证相关性和方差。显然,样本量和拟合量之间存在着密切的一致性,这意味着所提出的方法能够产生相当好的拟合。为了比较经验估计值和我们的估计值的准确性,我们对数据集中的受试者重新取样,并重新拟合最优回归模型。对于bootstrap中的每个样本,计算经验相关性和估计相关性。图。5结果表明,经验相关性的标准差通常大于我们方法拟合的相关性的标准偏差。这并不奇怪,因为我们应用了一个模型,该模型将这些相关性的总体趋势捕获为时间滞后的函数,因此,通过合并额外的数据信息,可以降低相关性估计中的噪音。我们现在通过所有子集选择来报告模型选择的时间。在Dell R910 2.00 GHz工作站上运行时,我们为μ ij公司和从1到10ϕ ijk公司σ ij公司.对于11×10×10模型的拟合,R代码的用户处理时间约为7分钟。因此,计算时间是可控的。我们还使用了一种计算效率更高的模型选择策略,如Zhang和Leng所述(2012)由于平均参数和方差参数的渐近正交性,通过拟合11+10×10模型。计算时间减少了大约十倍,并且确定了相同的最优模型。总的来说,我们得出的结论是,我们的方法对于建模牛数据非常有效。

(a) 经验相关性和(b)拟合相关性和方差的方差
图4。

(a) 经验相关性和(b)拟合相关性和方差的方差

建议方法估计相关性的标准偏差和经验相关性的标准差:标准偏差是通过使用bootstrap方法计算的,该方法对Kenward的牛数据中的受试者进行100次重新取样
图5。

建议方法估计相关性的标准偏差和经验相关性的标准差:标准偏差是通过使用bootstrap方法计算的,该方法对Kenward的牛数据中的受试者进行100次重新取样

表1。

Kenward的牛数据:使用新的联合建模方法比较各种模型

(p,q,d)参数数量^最大值银行识别码
(8,2,2)15−755.0052.03
(6,1,1)11−788.9053.17
(3,3,3)12−800.2754.71
(4,3,4)14−772.6153.09
(7,2,2)14−761.6752.37
(8,4,7)22−749.9052.49
(9,3,1)16−756.9252.28
(9,3,4)19−752.8252.34
(9,5,8)25−748.2952.72
(p,q,d)参数数量^最大值银行识别码
(8,2,2)15−755.0052.03
(6,1,1)11−788.9053.17
(3,3,3)12−800.2754.71
(4,3,4)14−772.6153.09
(7,2,2)14−761.6752.37
(8,4,7)22−749.9052.49
(9,3,1)16−756.9252.28
(9,3,4)19−752.8252.34
(9,5,8)25−748.2952.72

提出了该方法的最优三元组。

表1。

Kenward的牛数据:使用新的联合建模方法比较各种模型

(p,q,d)参数数量^最大值银行识别码
(8,2,2)15−755.0052.03
(6,1,1)11−788.9053.17
(3,3,3)12−800.2754.71
(4,3,4)14−772.6153.09
(7,2,2)14−761.6752.37
(8,4,7)22−749.9052.49
(9,3,1)16−756.9252.28
(9,3,4)19−752.8252.34
(9,5,8)25−748.2952.72
(p,q,d)参数数量^最大值银行识别码
(8,2,2)15−755.0052.03
(6,1,1)11−788.9053.17
(3,3,3)12−800.2754.71
(4,3,4)14−772.6153.09
(7,2,2)14−761.6752.37
(8,4,7)22−749.90磅52.49
(9,3,1)16−756.9252.28
(9,3,4)19−752.8252.34
(9,5,8)25−748.2952.72

提出了该方法的最优三元组。

3.2. CD4细胞数据

我们将提出的联合建模方法应用于一个非平衡数据集,即之前由Zeger和Diggle分析的CD4细胞研究(1994)还有叶和潘(2006)。本研究收集了369名感染人类免疫缺陷病毒的男性的CD4细胞计数,共2376个值,涵盖了大约8个周期12年。该数据集是观察数据集,每个人在不同的时间测量这些计数。每个个体的测量次数从1到12不等,时间点的间隔也不相等。如Zeger和Diggle(1994),为了使响应变量更接近高斯分布,使用CD4细胞计数的平方根。显然,这是一个高度不平衡的数据集,也是丹尼尔斯和普瓦赫马迪的方法(2009)主要针对平衡数据集开发的方法不适用。

我们分析的目的是联合建模均值、方差和相关结构。使用BIC进行模型选择,我们在我们的模型中找到了最佳多项式,一个8次多项式x个 ij公司在平均函数中,时间滞后的线性函数w个 ijk公司从相关模型和时间上的另一个线性函数的角度z(z) ij公司在log-variances中。最佳BIC值为26.73^最大值=4892.72.图。6显示了相关参数化和对数方差中的平均值、角度的拟合曲线。从图。6,我们还观察到拟合角度与时滞的单调递增关系。为了进行比较,我们还在Pourahmadi中应用了改进的Cholesky分解方法(1999)。表中进行了比较2我们发现,我们方法的最佳模型更为简约,似然值更大,并且就BIC值而言,比替代模型更为理想。从表2,我们还可以发现,与优化模型和具有相同复杂性的模型相比,我们的方法具有更大的似然值和更小的BIC。因此,我们证明了我们的方法对于一般非平衡纵向数据的优点和广泛适用性。当使用最高多项式阶数10为联合建模方法中的三个组件选择最佳模型时,用于拟合10的中央处理器总单位时间模型大约为60小时,如果Zhang和Leng的计算节俭策略,则减少到大约6小时(2012)应用相同的优化模型进行识别。

CD4细胞数据:拟合以下曲线:(a)平均值对时间,(b)角度对时间滞后,(c)对数变异对时间:,渐近95%置信区间
图6。

CD4细胞数据:拟合曲线(a)平均值与时间、(b)角度与时间滞后和(c)对数方差与时间:图解的,渐近95%置信区间

表2。

CD4细胞数据:Pourahmadi中我们方法和MCD方法的不同模型比较(2000)潘和麦肯齐(2003)

(p,q,d)参数数量建议方法的结果MCD结果
^最大值银行识别码^最大值银行识别码
(8,1)13−4892.7226.72−5008.8027.36
(8,3,1)15−4890.4426.75−4979.2327.23
(6,1,1)11−4902.1726.75−5018.4727.38
(3,3,3)12−4919.5226.85−5006.1827.33
(4,3,4)14−4902.10美元26.80−4995.5127.30
(8,3,3)17−4886.3626.76−4974.7027.24
(8、4、7)22−4881.7626.81−4971.7427.30
(9,3,1)17−4888.3426.75−4983.7327.27
(9,3,4)19−4881.3万26.76−4974.1527.26
(9,5,8)26−4877.1626.84−4968.3027.33
(p,q,d)参数数量建议方法的结果MCD结果
^最大值银行识别码^最大值银行识别码
(8,1,1)13−4892.7226.72−5008.8027.36
(8,3,1)15−4890.4426.75−4979.2327.23
(6,1,1)11−4902.1726.75−5018.4727.38
(3,3,3)12−4919.52美元26.85−5006.1827.33
(4,3,4)14−4902.1026.80−4995.5127.30
(8,3,3)17−4886.3626.76−4974.7027.24
(8、4、7)22−4881.7626.81−4971.7427.30
(9,3,1)17−4888.3426.75−4983.7327.27
(9,3,4)19−4881.3026.76−4974.1527.26
(9,5,8)26−4877.1626.84−4968.3027.33

提出了该方法的最优三元组。

MCD方法的最佳三联体。

表2。

CD4细胞数据:在Pourahmadi,我们的方法和MCD方法之间不同模型的比较(2000)潘和麦肯齐(2003)

(p,q,d)参数数量建议方法的结果MCD结果
^最大值银行识别码^最大值银行识别码
(8,1,1)13−4892.72磅26.72−5008.8027.36
(8,3,1)15−4890.4426.75−4979.2327.23
(6,1,1)11−4902.1726.75−5018.4727.38
(3,3,3)12−4919.5226.85−5006.1827.33
(4,3,4)14−4902.1026.80−4995.5127.30
(8,3,3)17−4886.3626.76−4974.7027.24
(8,4,7)22−4881.7626.81−4971.7427.30
(9,3,1)17−4888.3426.75−4983.7327.27
(9,3,4)19−4881.3026.76−4974.15美元27.26
(9,5,8)26−4877.1626.84−4968.3027.33
(p,q,d)参数数量建议方法的结果MCD结果
^最大值银行识别码^最大值银行识别码
(8,1,1)13−4892.72磅26.72−5008.8027.36
(8,3,1)15−4890.4426.75−4979.2327.23
(6,1,1)11−4902.1726.75−5018.4727.38
(3,3,3)12−4919.5226.85−5006.1827.33
(4,3,4)14−4902.1026.80−4995.5127.30
(8,3,3)17−4886.3626.76−4974.7027.24
(8,4,7)22−4881.7626.81−4971.7427.30
(9,3,1)17−4888.3426.75−4983.7327.27
(9,3,4)19−4881.3026.76−4974.15美元27.26
(9,5,8)26−4877.1626.84−4968.3027.33

提出了该方法的最优三元组。

MCD方法的最佳三联体。

3.3. 模拟研究

在本节中,我们研究了所提出的估计和推理方法的有限样本性能,并将我们的方法与改进的Cholesky分解方法进行了比较。我们在两项研究中进行了模拟。

在第一项研究中,从所提出的模型生成数据,然后应用所提出的方法。这是为了证明第节中的渐近性质2.5。数据集由模型生成
j个=β0+x个j个1β1+x个j个2β2+e(电子)j个(=1,,n个;j个=1,,),ϕj个k个=γ0+w个j个k个1γ1+w个j个k个2γ2,日志(σj个2)=λ0+z(z)j个1λ1+z(z)j个2λ2,
(15)
哪里 −1~二项式(6,0.8),然后测量时间t吨 ij公司由均匀(0,1)分布生成。此设置会导致不同数量的重复测量 针对每个主题。协变量x个 ij公司= (x个 ij公司1,x个 ij公司2)T型由均值为0、边际方差为1、相关系数为0.5的多元正态分布生成。我们采取z(z) ij公司=x个 ij公司、和w个 ijk公司=(1,t吨 ij公司t吨 伊克,(t吨 ij公司t吨 伊克)2)T型,遵循冷的设置. (2010)。我们生成1000个数据集并考虑样本大小n个= 50, 100, 200.

显示了估计参数在平均绝对偏差MAB和标准偏差方面的准确性。所有偏差都很小,尤其是当n个此外,为了评估推理过程,我们使用公式比较了1000个参数估计值的样本标准偏差SD和1000个标准误差SE的样本平均值(13)。还报告了1000个标准误差的标准偏差Std。显示SD和SE非常接近,特别是对于大型n个这表明标准误差公式工作良好,并证明了定理1的有效性。这里我们注意到,在估计中观察到了相对较高的可变性λ 0方差函数的基线水平,反映了一个事实,即方差函数在实际中通常更难估计(Leng和Tang,2011).

表3。

研究1的模拟结果

参数真值n=50的结果n=100的结果n=200的结果
MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差
β 017.137.832.349.224.495.131.125.662.863.500.563.69
β 1−0.51.671.840.582.181.051.200.281.320.670.810.140.86
β 20.51.011.130.351.320.640.730.170.810.410.500.090.53
γ 00.36.987.310.698.104.445.150.345.383.053.640.163.80
γ 1−0.28.498.481.5310.445.295.890.726.593.594.140.344.50
γ 20.39.469.381.3711.145.836.570.647.173.924.630.304.92
λ 0−0.5110.42131.475.15139.5474.0192.552.5892.9251.1965.361.2665.29
λ 10.50.740.650.150.960.430.460.080.560.280.320.030.36
λ 2−0.30.710.660.150.940.430.460.070.550.280.320.030.36
参数真值n=50的结果n=100的结果n=200的结果
MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差
β 017.137.832.349.224.495.131.125.662.863.500.563.69
β 1−0.51.671.840.582.181.051.200.281.320.670.810.140.86
β 20.51.011.130.351.320.640.730.170.810.410.500.090.53
γ 00.36.987.310.698.104.445.150.345.383.053.640.163.80
γ 1−0.28.498.481.5310.445.295.890.726.593.594.140.344.50
γ 20.39.469.381.3711.145.836.570.647.173.924.630.304.92
λ 0−0.5110.42131.475.15139.5474.0192.552.5892.9251.1965.361.2665.29
λ 10.50.740.650.150.960.430.460.080.560.280.320.030.36
λ 2−0.30.710.660.150.940.430.460.070.550.280.320.030.36

所有结果乘以10倍.

表3。

研究1的模拟结果

参数真值n=50的结果n=100的结果n=200的结果
MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差
β 017.137.832.349.224.495.131.125.662.863.500.563.69
β 1−0.51.671.840.582.181.051.200.281.320.670.810.140.86
β 20.51.011.130.351.320.640.730.170.810.410.500.090.53
γ 00.36.987.310.698.104.445.150.345.383.053.640.163.80
γ 1−0.28.498.481.5310.445.295.890.726.593.594.140.344.50
γ 20.39.469.381.3711.145.836.570.647.173.924.630.304.92
λ 0−0.5110.42131.475.15139.5474.0192.552.5892.9251.1965.361.2665.29
λ 10.50.740.650.150.960.430.460.080.560.280.320.030.36
λ 2−0.30.710.660.150.940.430.460.070.550.280.320.030.36
参数真值n=50的结果n=100的结果n=200的结果
MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差MAB公司东南方标准偏差标准偏差
β 017.137.832.349.224.495.131.125.662.863.500.563.69
β 1−0.51.671.840.582.181.051.200.281.320.670.810.140.86
β 20.51.011.130.351.320.640.730.170.810.410.500.090.53
γ 00.36.987.310.698.104.445.150.345.383.053.640.163.80
γ 1−0.28.498.481.5310.445.295.890.726.593.594.140.344.50
γ 20.39.469.381.3711.145.836.570.647.173.924.630.304.92
λ 0−0.5110.42131.475.15139.5474.0192.552.5892.9251.1965.361.2665.29
λ 10.50.740.650.150.960.430.460.080.560.280.320.030.36
λ 2−0.30.710.660.150.940.430.460.070.550.280.320.030.36

所有结果乘以10倍.

在研究2中,我们将所提出的方法与Pourahmadi中的MCD方法进行了比较(1999)在各种设置和样本大小下n个=50和n个= 100. 更具体地说,我们调查了三种情况,分别为我们的方法和MCD方法正确或错误地指定了数据模型。我们使用不同阶次的多项式拟合数据,并且对于这两种方法始终使用正确的平均模型,因为这两种方式之间的关键区别在于如何建模协方差。

在案例一中,我们采用与研究1中相似的模型来生成具有协变量的数据集z(z) ij公司视为z(z)j个=(1,t吨j个,t吨j个2)T型在这种情况下,MCD方法的协方差模型指定错误。

在案例II中,我们从模型中生成数据(1)遵循MCD。与案例I中的模型结构类似,通过更改ϕ ijk公司在表达式中(15)至第页 ijk公司在表达式中(1),以及表达式中的方差函数(15)用于的方差ε ij公司在表达式中(1)。在这种情况下,我们的方法中的方差函数和相关结构被错误指定。

在案例III中,当两种方法的模型都指定错误时,为了比较这两种方法,我们采用与案例I相同的平均模型,并使用边际方差σ 2(t吨)=0.5经验(t吨)和自回归移动平均ARMA(1,1)相关结构校正(ϵt吨,ϵ)=γρ|t吨|,用于t吨.我们认为γ=0.85和ρ=0.6,对应中度相关误差。在这种情况下,这两种方法都使用了指定错误的协方差模型,因为这种相关性结构并不完全对应于任何一种分解。这两种方法所能做的最好的事情是捕获与各自模型规范相关的一些信号。

在每个设置下,度的多项式q个d日分别用于相关模型中的角度和我们方法中的对数方差,以及替代MCD方法中的自回归系数和对数更新。为了进行公平的比较,这两种方法都使用了相同的多项式阶数。

为了比较这两种方法,我们定义了误差测量
μ^d日=1n个=1n个x个T型(β^β0),Σ^d日=1n个=1n个Σ^Σ0,吉隆坡=1n个=1n个吉隆坡((f)1|(f)0),
其中KL是拟合模型之间的Kullback–Leibler散度(f)1=N个(μ^,Σ^)和真正的模型(f) 0=N个(μ 0,Σ 0)对于主题。4显示了各种设置下平均偏差、协方差偏差和KL偏差的规范。如果数据是从我们的模型生成的,那么在所有比较标准中,我们的方法都比替代方法表现得好,即使是对于饱和模型也是如此(q个=3和d日=3)和指定错误的简化模型(q个=1和d日= 2). 由于缺乏捕捉该相关性结构中的动态的能力,替代方法的KL差异很差。在案例II中,数据是从表达式中的替代MCD生成的(1),我们的方法仍然相当有效。与充分利用模型信息的替代方法相比,我们方法的误差测量值只略微膨胀。在第三种情况下,这两种方法的数据模型都被错误地指定了,我们的工作非常有希望。从表中可以清楚地看出4我们的方法在所有指标上都大大优于替代MCD方法。尽管KL偏差现在比情况I中的值稍大,但对于所有情况,它们都比替代方法的值小得多,这表明更符合事实。仿真和我们的数据示例清楚地表明,所提出的方法在捕获纵向数据相关性中的动力学方面更具适应性和灵活性,即使模型指定错误。
表4。

所提方法与Pourahmadi MCD模型的比较

(q,d)建议方法的结果MCD结果
μ^d日Σ^d日吉隆坡μ^d日Σ^d日吉隆坡
案例I,n= 50
(2,2)0.050.040.430.350.160.110.240.172.260.2310.170.58
(1,2)0.230.181.220.392.880.460.240.172.260.2310.140.57
(3,3)0.050.040.440.360.250.170.250.172.260.2310.220.60
案例I,n= 100
(2,2)0.030.020.290.230.060.030.180.122.240.1610.040.39
(1,2)0.160.121.270.262.690.230.180.122.250.1610.040.39
(3,3)0.030.020.300.230.080.050.180.122.250.1610.050.39
案例II,n= 50
(2,2)0.330.151.670.360.180.070.320.151.330.540.120.06
(1,2)0.330.151.650.360.160.060.320.151.240.540.100.06
(3,3)0.330.151.750.370.230.210.320.161.490.530.150.08
案例II,n= 100
(2,2)0.230.111.450.210.110.030.230.110.920.360.060.03
(1,2)0.230.111.440.210.110.030.230.110.870.360.050.02
(3,3)0.230.111.490.210.130.060.230.111.030.350.070.03
案例III,n= 50
(1,1)0.210.120.930.300.260.050.230.131.610.190.690.07
(1,2)0.210.120.940.300.280.060.230.131.620.190.700.08
(3,3)0.220.120.960.290.330.100.230.131.650.180.740.10
案例III,n= 100
(1,1)0.150.090.860.220.210.020.160.091.570.130.640.04
(1,2)0.150.090.870.220.220.030.160.091.580.130.640.04
(3,3)0.150.090.880.220.240.030.170.101.590.130.660.05
(q,d)建议方法的结果MCD结果
μ^d日Σ^d日吉隆坡μ^d日Σ^d日吉隆坡
案例I,n= 50
(2,2)0.050.040.430.350.160.110.240.172.260.2310.170.58
(1,2)0.230.181.220.392.880.460.240.172.260.2310.140.57
(3,3)0.050.040.440.360.250.170.250.172.260.2310.220.60
案例I,n= 100
(2,2)0.030.020.290.230.060.030.180.122.240.1610.040.39
(1,2)0.160.121.270.262.690.230.180.122.250.1610.040.39
(3,3)0.030.020.300.230.080.050.180.122.250.1610.050.39
案例II,n= 50
(2,2)0.330.151.670.360.180.070.320.151.330.540.120.06
(1,2)0.330.151.650.360.160.060.320.151.240.540.100.06
(3,3)0.330.151.750.370.230.210.320.161.490.530.150.08
案例II,n= 100
(2,2)0.230.111.450.210.110.030.230.110.920.360.060.03
(1,2)0.230.111.440.210.110.030.230.110.870.360.050.02
(3,3)0.230.111.490.210.130.060.230.111.030.350.070.03
案例III,n= 50
(1,1)0.210.120.930.300.260.050.230.131.610.190.690.07
(1,2)0.210.120.940.300.280.060.230.131.620.190.700.08
(3,3)0.220.120.960.290.330.100.230.131.650.180.740.10
案例III,n= 100
(1,1)0.150.090.860.220.210.020.160.091.570.130.640.04
(1,2)0.150.090.870.220.220.030.160.091.580.130.640.04
(3,3)0.150.090.880.220.240.030.170.101.590.130.660.05
表4。

所提方法与Pourahmadi MCD模型的比较

(q,d)建议方法的结果MCD结果
μ^d日Σ^d日吉隆坡μ^d日Σ^d日吉隆坡
案例I,n= 50
(2,2)0.050.040.430.350.160.110.240.172.260.2310.170.58
(1,2)0.230.181.220.392.880.460.240.172.260.2310.140.57
(3,3)0.050.040.440.360.250.170.250.172.260.2310.220.60
案例I,n= 100
(2,2)0.030.020.290.230.060.030.180.122.240.1610.040.39
(1,2)0.160.121.270.262.690.230.180.122.250.1610.040.39
(3,3)0.030.020.300.230.080.050.180.122.250.1610.050.39
案例II,n= 50
(2,2)0.330.151.670.360.180.070.320.151.330.540.120.06
(1,2)0.330.151.650.360.160.060.320.151.240.540.100.06
(3,3)0.330.151.750.370.230.210.320.161.490.530.150.08
案例II,n= 100
(2,2)0.230.111.450.210.110.030.230.110.920.360.060.03
(1,2)0.230.111.440.210.110.030.230.110.870.360.050.02
(3,3)0.230.111.490.210.130.060.230.111.030.350.070.03
案例III,n= 50
(1,1)0.210.120.930.300.260.050.230.131.610.190.690.07
(1,2)0.210.120.940.300.280.060.230.131.620.190.700.08
(3,3)0.220.120.960.290.330.100.230.131.650.180.740.10
案例III,n= 100
(1,1)0.150.090.860.220.210.020.160.091.570.130.640.04
(1,2)0.150.090.870.220.220.030.160.091.580.130.640.04
(3,3)0.150.090.880.220.240.030.170.101.590.130.660.05
(q,d)建议方法的结果MCD结果
μ^d日Σ^d日吉隆坡μ^d日Σ^d日吉隆坡
案例I,n= 50
(2,2)0.050.040.430.350.160.110.240.172.260.2310.170.58
(1,2)0.230.181.220.392.880.460.240.172.260.2310.140.57
(3,3)0.050.040.440.360.250.170.250.172.260.2310.220.60
案例I,n= 100
(2,2)0.030.020.290.230.060.030.180.122.240.1610.040.39
(1,2)0.160.121.270.262.690.230.180.122.250.1610.040.39
(3,3)0.030.020.300.230.080.050.180.122.250.1610.050.39
案例II,n= 50
(2,2)0.330.151.670.360.180.070.320.151.330.540.120.06
(1,2)0.330.151.650.360.160.060.320.151.240.540.100.06
(3,3)0.330.151.750.370.230.210.320.161.490.530.150.08
案例II,n= 100
(2,2)0.230.111.450.210.110.030.230.110.920.360.060.03
(1,2)0.230.111.440.210.110.030.230.110.870.360.050.02
(3,3)0.230.111.490.210.130.060.230.111.030.350.070.03
案例III,n= 50
(1,1)0.210.120.930.300.260.050.230.131.610.190.690.07
(1,2)0.210.120.940.300.280.060.230.131.620.190.700.08
(3,3)0.220.120.960.290.330.100.230.131.650.180.740.10
案例III,n= 100
(1,1)0.150.090.860.220.210.020.160.091.570.130.640.04
(1,2)0.150.090.870.220.220.030.160.091.580.130.640.04
(3,3)0.150.090.880.220.240.030.170.101.590.130.660.05

4.讨论

我们提出了一种新的联合方法,用于建模纵向数据分析中的平均值、方差和相关性。我们的方法允许无约束参数化、快速计算和易于解释参数。与以前的方法不同,此方法直接针对相关性和方差,并尽我们所知提供最通用形式的协方差结构。

我们的分解为未来的研究开辟了许多新的途径。对于无约束结构,我们可以对均值、方差和相关性进行非参数和半参数建模。在这方面的研究,例如,王. (2005),风扇. (2007)、范和武(2008)姚明和李(2013)开发了非参数方法。基于相似性的估计程序允许基于正则化的模型选择,对此进行进一步研究很有意思(Fan和Li,2004; 比克尔和李,2006)。通过引出适当的先验信息来开发贝叶斯推理程序也可能很有趣。最后,我们假设纵向数据遵循多元正态分布。值得进一步开发与此假设相关的稳健方法。

致谢

张伟平的研究得到了国家科学基金的资助(11271347和11171321)。唐成勇感谢科罗拉多丹佛大学商学院的研究支持。我们感谢联合主编、副主编、两位裁判和保罗·马里奥特教授的宝贵意见。

参考文献

比克尔
,
第页。
,
B。
(
2006
)
统计规范化(讨论)
.
测试
,
15
,
271
——
344
.

,
Z.公司。
邓森
,
D。
(
2003
)
线性混合模型中的随机效应选择
.
生物计量学
,
59
,
762
——
769
.

,
T.Y.M.公司。
,
伦纳德
,
T。
津井
,
K.W.公司。
(
1996
)
矩阵-对数协方差模型
.
《美国统计杂志》。助理。
,
91
,
198
——
210
.

克里亚尔语
,
D。
,
科普曼
,
S.J.公司。
卢卡斯
,
答:。
(
2011
)
时变波动率和相关性的动态多元重尾模型
.
J.总线。经济。统计师。
,
29
,
552
——
563
.

丹尼尔斯
,
医学博士。
Pourahmadi公司
,
M。
(
2009
)
基于偏自相关的协方差矩阵建模
.
J.Multiv.公司。分析。
,
100
,
2352
——
2363
.

挖掘
,
P.J.公司。
,
亨格蒂
,
第页。
,
,
K.Y.公司。
Zeger公司
,
S.L.公司。
(
2002
)
纵向数据分析
,第2版。
牛津
:
牛津大学出版社
.

风扇
,
J。
,
,
T。
,
R。
(
2007
)
协方差函数半参数估计在纵向数据分析中的应用
.
《美国统计杂志》。助理。
,
102
,
632
——
640
.

风扇
,
J。
,
R。
(
2004
)
纵向数据分析中半参数建模的新估计和模型选择方法
.
《美国统计杂志》。助理。
,
99
,
710
——
723
.

风扇
,
J。
,
年。
(
2008
)
纵向数据协方差矩阵的半参数估计
.
《美国统计杂志》。助理。
,
103
,
1520
——
1533
.

肯沃德
,
M.G.公司。
(
1987
)一种比较重复测量轮廓的方法。
申请。统计师。
,
36
,
296
——
308
; 修正,
40
(
1991
),
379
.

,
C、。
,
C.Y.公司。
(
2011
)
半参数纵向数据分析中方差函数估计的改进
.
可以。J.统计。
,
39
,
656
——
670
.

,
C、。
,
,
西。
平移
,
J。
(
2010
)
纵向数据的半参数均值-方差回归分析
.
《美国统计杂志》。助理。
,
105
,
181
——
193
.

,
K.Y.公司。
Zeger公司
,
S.L.公司。
(
1986
)
使用广义线性模型进行纵向数据分析
.
生物特征
,
73
,
13
——
22
.

,
十、。
卡罗尔
,
R·J。
(
2006
)
一般重复测度问题的半参数估计
.
J.R.统计。Soc.B公司
,
68
,
69
——
88
.

平移
,
J。
麦肯齐
,
G.公司。
(
2003
)
纵向研究中联合均值-方差结构的模型选择
.
生物特征
,
90
,
239
——
244
.

Pourahmadi公司
,
M。
(
1999
)
应用于纵向数据的联合均值-方差模型:无约束参数化
.
生物特征
,
86
,
677
——
690
.

Pourahmadi公司
,
M。
(
2000
)
多元正态协方差矩阵广义线性模型的最大似然估计
.
生物特征
,
87
,
425
——
435
.

Pourahmadi公司
,
M。
(
2007
)
协方差矩阵的Cholesky分解和估计:方差相关参数的正交性
.
生物特征
,
94
,
1006
——
1013
.

,
答:。
,
林赛
,
B.G.公司。
,
B。
(
2000
)
利用二次推理函数改进估计方程
.
生物特征
,
87
,
823
——
836
.

拉皮萨尔达
,
F、。
,
布里戈
,
D。
水银
,
F、。
(
2007
)
参数化相关性:一种几何解释
.
IMA J.芒特数学。
,
18
,
55
——
73
.

,
J。
(
1997
)
线性模型选择的一个渐近理论
.
统计师。罪。
,
7
,
221
——
264
.

,
N。
(
2003
).
考虑主题内相关性的边际非参数核回归
.
生物特征
,
90
,
43
——
52
.

,
N。
,
卡罗尔
,
R·J。
,
十、。
(
2005
)
纵向/聚类数据的有效半参数边缘估计
.
《美国统计杂志》。助理。
,
100
,
147
——
157
.

白色
,
H。
(
1982
)
错误指定模型的最大似然估计
.
计量经济学
,
50
,
1
——
25
.

姚明
,
西。
,
R。
(
2013
)
纵向数据非参数回归函数的新局部估计方法
.
J.R.统计。Soc.B公司
,
75
,
123
——
138
.

,
H。
平移
,
J。
(
2006
)
纵向数据广义估计方程中协方差结构的建模
.
生物特征
,
93
,
927
——
941
.

Zeger公司
,
S.L.公司。
挖掘
,
P.J.公司。
(
1994
)
纵向数据的半参数模型及其在HIV血清转化者CD4细胞数中的应用
.
生物计量学
,
50
,
689
——
699
.

,
西。
,
C、。
(
2012
)
纵向数据协方差建模中的移动平均cholesky因子模型
.
生物特征
,
99
,
141
——
150
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)