2.1 Mantel-Haenszel风险比率和风险差异估计值
首先,我们讨论了队列研究中分层分析的常见风险比和风险差异估计。考虑一系列K(K)由两对独立二项式观测值组成的2×2表格X(X)0k个,X(X)1k个具有样本大小N个0k个,N个1k个和成功概率第页0k个,第页1k个对于k个=1,2,…,K(K).在风险比率的共同效应假设下,我们假设特定阶层的风险比率ψk个=第页1k个/第页0k个所有阶层都是平等的,即。,ψ=ψ1=ψ2=…=ψK(K)同样,对于风险差异,我们假设特定阶层风险差异的共同影响ωk个=第页1k个−第页0k个穿过地层,即。,ω=ω1=ω2=…=ωK(K).
共同风险比率的Mantel-Haenszel估计ψ(Nurminen 1981年;Tarone 1981年)以及共同的风险差异ω(科克伦1954)显示为
ψˆM(M)H(H)=∑k个=1K(K)X(X)1k个N个0k个/N个k个∑k个=1K(K)X(X)0k个N个1k个/N个k个=∑k个=1K(K)w个M(M)H(H),k个第页ˆ1k个∑k个=1K(K)w个M(M)H(H),k个第页ˆ0k个=∑k个=1K(K)w个M(M)H(H),k个第页ˆ0k个ψˆk个∑k个=1K(K)w个M(M)H(H),k个第页ˆ0k个,
ωˆM(M)H(H)=∑k个=1K(K)(X(X)1k个N个0k个−X(X)0k个N个1k个)/N个k个∑k个=1K(K)N个0k个N个1k个/N个k个=∑k个=1K(K)w个M(M)H(H),k个第页ˆ1k个∑k个=1K(K)w个M(M)H(H),k个−∑k个=1K(K)w个M(M)H(H),k个第页ˆ0k个∑k个=1K(K)w个M(M)H(H),k个=∑k个=1K(K)w个M(M)H(H),k个ωˆk个∑k个=1K(K)w个M(M)H(H),k个,
哪里第页ˆ0k个=X(X)0k个/N个0k个,第页ˆ1k个=X(X)1k个/N个1k个,N个k个=N个1k个+N个0k个和w个M(M)H(H),k个=N个0k个N个1k个/N个k个。此外,ψˆk个=第页ˆ1k个/第页ˆ0k个和ωˆk个=第页ˆ1k个−第页ˆ0k个这些估计量是作为下列估计方程的解获得的,
问ψ=∑k个=1K(K)w个M(M)H(H),k个第页ˆ1k个−ψ第页ˆ0k个=0,
R(右)ω=∑k个=1K(K)w个M(M)H(H),k个ω−第页ˆ1k个−第页ˆ0k个=0
请注意,这些估算函数在共同影响假设下是无偏的E类问ψ=0和E类R(右)ω=0估计量的一致性直接遵循。这里,假设违反了常见的效果假设,即。,ψ1,ψ2,…,ψK(K)和ω1,ω2,…,ωK(K)可能是异质的。在这种情况下,目标参数ψ和ω对于上述估计方程不再解释为共同效应。
为了评估Mantel-Haenszel估计量的渐近行为,有必要制定两个分层分析常用的大样本方案。第一个,表示为渐近I,是具有固定数量的地层K(K)虽然N个0k个,N个1k个→∞在第二种中,表示为渐近线II,N个0k个,N个1k个有界,而K(K)渐近II的一个著名例子是匹配设计。
首先,表示问k个ψ=第页ˆ1k个−ψ第页ˆ0k个,R(右)k个ω=ω−第页ˆ1k个−第页ˆ0k个,Mantel-Haenszel估计在渐近I下的渐近行为可以刻画如下。
定理1在渐近I下,我们假设N个0k个/N个→λ0k个>0,N个1k个/N个→λ1k个>0,其中N个=N个01+…+N个0K(K)+N个11+…+N个1K(K)然后,Mantel-Haenszel估计收敛到均值等于的正态分布
ψ我∗=∑k个=1K(K)αk个第页1k个∑k个=1K(K)αk个第页0k个=∑k个=1K(K)αk个第页0k个ψk个∑k个=1K(K)αk个第页0k个,
ω我∗=∑k个=1K(K)αk个第页1k个∑k个=1K(K)αk个−∑k个=1K(K)αk个第页0k个∑k个=1K(K)αk个=∑k个=1K(K)αk个ωk个∑k个=1K(K)αk个,
和差异
V(V)A类ψˆM(M)H(H)=∑k个=1K(K)αk个2V(V)A类问k个ψ我∗∑k个=1K(K)αk个第页0k个2,V(V)A类ωˆM(M)H(H)=∑k个=1K(K)αk个2V(V)A类R(右)k个ω我∗∑k个=1K(K)αk个2,
哪里αk个=λ0k个λ1k个/λ0k个+λ1k个和V(V)A类.表示渐近方差。
附录中提供了证明大纲。请注意N个−1w个M(M)H(H),k个是一个经验量αk个.直观地看,数量ψ我∗和ω我∗可以粗略地解释为标准化风险比率的预期数量和与标准权重的风险差异αk个由于Mantel-Haenszel风险比率和风险差异估计值表示为具有权重的标准化估计值w个M(M)H(H),k个(Rothman等人,2008年),这个结果是直观的。然而,这一标准并没有任何内在的流行病学意义。格陵兰和马尔多纳多(1994)推断出Mantel-Haenszel比率估计收敛到类似数量的ψ我∗(请参见第3.1节)可以预期,在暴露无效的情况下,在整个队列中分层因子的标准分布上,可以近似得出一个标准化比率。Mantel-Haenszel风险比率估计器也会有类似的论据,即Mantel-Haneszel风险率估计器可能被解释为在传统标准权重上近似标准化风险比率w个N个k个=N个k个/∑我=1K(K)N个我无效。此外,标准w个N个k个和w个M(M)H(H),k个当暴露流行率的乘积为小时k个=N个1k个/N个k个及其补充1−小时k个是跨地层的常数,即。,w个M(M)H(H),k个=N个k个1−小时k个N个k个小时k个/N个k个=N个k个小时k个1−小时k个与…成比例N个k个什么时候小时k个1−小时k个是常量。同样,风险差异的论据也成立。在这个不变假设下,ψ我∗和ω我∗几乎符合标准化风险比率和标准风险差异αk个虽然它不一定要求小时k个(暴露流行率的分布)w个N个k个和w个M(M)H(H),k个主要取决于混淆的强度。
此外,Mantel-Haenszel估计值也可以解释为收敛于特定阶层风险比率的加权平均值ψk个的或风险差异ωk个是的,有重量第页0k个αk个和αk个.Mante-Haenszel型砝码w个M(M)H(H),k个将大致反映地层特定效应估计值的精度(尤其是在零效应下;佐藤1990),ψ我∗和ω我∗也可能被解释为针对特定地层的效应测量的直观总结。
其次,我们考虑渐近II。此处考虑的极限模型与布雷斯洛(1981))和格陵兰和罗宾斯(1985年). 我们假设总样本大小的可能配置数量有限N个0k个,N个1k个在…之间K(K)地层,我们将其数量表示为我然后,重量w个M(M)H(H),k个在每个配置中都是常量,我们将其表示为一我我=1,2,…我。此外,我们假设G公司异质风险比率和/或风险差异K(K)地层,即。,ψ1,ψ2,…,ψK(K)和ω1,ω2,…,ωK(K)可能是异构的,但这些被分类为G公司公共效应假设在每个子集中保持的子集。我们表示这些G公司异质效应参数asψ˜1,ψ˜2,…,ψ˜G公司和ω˜1,ω˜2,…,ω˜G公司。我们还假设K(K)我克地层我配置和克th子集和K(K)我,克/K(K)收敛到π我克取决于岩层中的暴露分布(我= 1,2,…,我;克= 1,2,…,G公司). 此外,妨害参数第页0k个假设从某个概率分布中取样F类0我克z(z)对于我th和克第个子集。相应的第页1k个指定为ψ˜克第页0k个或ω˜克+第页0k个然后,我们表示第页1k个作为F类1我克z(z)正式的,在这里。此外,我们表示F类0我克z(z)和F类1我克z(z)作为ρ0我克和ρ1我克此外,我们表示特定地层统计的条件方差问k个ψ,R(右)k个ω对于我th和克th子集为V(V)问,我克ψ|z(z),V(V)R(右),我克ω|z(z)调节开第页0k个=z(z)之后,Mantel-Haenszel估计量的渐近行为可以刻画为如下。
定理2在渐近II下,Mantel-Haenszel估计收敛到正态分布,平均值等于
ψ我我∗=∑我=1我∑克=1G公司π我克一我ρ1我克∑我=1我∑克=1G公司π我克一我ρ0我克=∑我=1我∑克=1G公司π我克一我ρ0我克ψ˜克∑我=1我∑克=1G公司π我克一我ρ0我克,
ω我我∗=∑我=1我∑克=1G公司π我克一我ρ1我克∑我=1我∑克=1G公司π我克一我−∑我=1我∑克=1G公司π我克一我ρ0我克∑我=1我∑克=1G公司π我克一我=∑我=1我∑克=1G公司π我克一我ω˜克∑我=1我∑克=1G公司π我克一我,
和差异
V(V)A类ψˆM(M)H(H)=∑我=1我∑克=1G公司π我克2一我2E类V(V)问,我克ψ我我∗|z(z)∑我=1我∑克=1G公司π我克一我ρ0我克2,
V(V)A类ωˆM(M)H(H)=∑我=1我∑克=1G公司π我克2一我2E类V(V)R(右),我克ω我我∗|z(z)∑我=1我∑克=1G公司π我克一我2.
附录II提供了证明大纲。与渐近I类似,一我刚好符合Mantel-Haentszel标准重量w个M(M)H(H),k个,数量ψ我我∗和ω我我∗也可以解释为标准化风险比率的预期数量和与标准权重的风险差异一我的。只有讨厌的参数第页0k个的可能在不同地层中不同,但它被替换为特定底层中的平均值ρ0我克的。因此,与上面讨论的类似,曼特尔-哈内泽尔风险比率和风险差异估计值可能被解释为标准化风险比率和传统标准权重上的风险差异的近似值w个N个k个=N个k个/∑我=1K(K)N个我此外,Mantel-Haenszel估计量也可以被解释为收敛于异质风险比率的加权平均值ψ˜克的或风险差异ω˜克是的,有重量π我克一我ρ0我克和π我克一我.Mante-Haenszel型砝码w个M(M)H(H),k个将大致反映地层特定效应估计值的精度(尤其是在零效应下;佐藤1990),ψ我我∗和ω我我∗也将被解释为针对特定地层的效应测量的直观总结。
另一个关注点是的渐近方差估计ψˆM(M)H(H)和ωˆM(M)H(H)在异质性假设下。然而,如定理1和2所示,渐近方差具有标准的sandwich型形式。因此,使用现有的sandwich型渐近方差估计量,可以有效地估计这些量。例如,风险比率的标准双重一致估计值(在渐近I和II下)格陵兰和罗宾斯(1985)和风险差异佐藤(1989))即使违反了共同效应假设,也保持一致。此外,可以使用普通的bootstrap方法一致地估计渐近方差。在后一节中,通过仿真评估了同类估计量的经验性能。