A Note on the Mantel-Haenszel Estimators When the Common Effect Assumptions Are Violated

Hisashi Noma; Kengo Nagashima

doi:10.1515/em-2015-0004

公开可用发布人：德古意特出版社 2016年5月6日

违反共同效应假设时Mantel-Haenszel估计的一个注记

野田久志和长岛贤吾

来自日志流行病学方法

https://doi.org/10.1515/em-2015-0004

摘要

分层2×2表共同效应参数的Mantel-Haenszel估计量在流行病学和临床研究中被广泛采用，以控制混杂因素的影响。尽管Mantel-Haenszel估计量是简单有效的估计方法，但在一般实践中无法证明共同效应假设的正确性。此外，目标“共同效应参数”也不存在。在这些设置下，即使Mantel-Haenszel估计量具有理想的属性，它们估计的内容以及如何解释估计值也相当不确定。在本文中，我们对它们在违反共同效应假设时的渐近行为进行了理论评估。我们明确表明，Mantel-Haenszel估计量收敛于特定于地层的影响参数的加权平均值，它们可以被解释为特定于地层影响测量的直观总结。此外，Mantel-Haenszel估计量对应于分层变量标准分布的标准化效应度量，约为总队列。此外，对于量化Mantel-Haenszel估计量的变量，普通的sandwich型方差估计量仍然有效。我们基于乳腺癌和精神分裂症的两项流行病学研究进行了数值研究，以评估这些估计量的经验特性，并证实了这些理论结果的一般有效性。

关键词：分层分析;Mantel-Haenszel估值器;共同效应参数;标准化;型号规格错误

1简介

在流行病学和临床研究分析中，Mantel-Haenszel估计量(Mantel和Haenszel 1959年; 罗斯曼，格陵兰和拉什2008)对于常见的影响参数，2×2分层表已被广泛用于控制混杂因素的影响。由于其简单性和高效性，这些估计值受到流行病学家的青睐，也是荟萃分析的标准方法之一(希金斯与格林2008). 尽管Mantel-Haenszel估计量是公共效应参数的有效估计方法，但公共效应假设在实践中无法得到严格证明(格陵兰1982; Mantel等人，1977年）。当违反共同效应假设时，Mantel-Haenszel方法估计的目标参数非常不确定，也不清楚它们估计的是什么。格陵兰和马尔多纳多（1994)推断Mantel-Haenszel比率估计值是由分层变量的标准分布上的标准化比率近似得出的，即总队列。虽然没有足够的理论依据，但通过数值研究，他们也表明了其一般正确性。

违反共同效应假设可以被视为模型错误指定问题之一。在理论研究中，主要针对基于White里程碑论文的最大似然估计量，对模型的误指定问题进行了广泛的研究(1982). 虽然它是对估计方程理论的推广(戈达姆1969)直到最近的研究才发现，Yi和Reid（2010年)提供了White的一般结果(1982)关于在错误指定模型下最大似然估计量行为的渐近结果。众所周知，通过估计方程理论，Mantel-Haenszel估计量可以被视为零效应（暴露效应为零）下公共效应参数的局部有效估计量(2005年藤井和柳本;佐藤1990;Yanagimoto 1990年)，可以使用Yi和Reid（2010年)的结果。

在本文中，我们评估了当违反共同效应假设时Mantel-Haenszel估计量的渐近行为。我们表明，Mantel-Haenszel估计值可以近似地解释为跨地层效应异质性下平均暴露效应的估计值。我们将表明，在某些条件下，平均效应通常被视为标准化估值的良好近似值。此外，我们将讨论Mantel-Haenszel估计量的普通方差估计量在异质环境下的有效性。我们还通过基于乳腺癌和精神分裂症两项流行病学研究的数值研究来评估它们的经验特性。

2使用二进制数据分析队列研究

2.1 Mantel-Haenszel风险比率和风险差异估计值

首先，我们讨论了队列研究中分层分析的常见风险比和风险差异估计。考虑一系列K（K）由两对独立二项式观测值组成的2×2表格X（X）0k个,X（X）1k个具有样本大小N个0k个,N个1k个和成功概率第页0k个,第页1k个对于k个=1,2,…,K（K）.在风险比率的共同效应假设下，我们假设特定阶层的风险比率ψk个=第页1k个/第页0k个所有阶层都是平等的，即。，ψ=ψ1=ψ2=…=ψK（K）同样，对于风险差异，我们假设特定阶层风险差异的共同影响ωk个=第页1k个−第页0k个穿过地层，即。，ω=ω1=ω2=…=ωK（K）.

共同风险比率的Mantel-Haenszel估计ψ(Nurminen 1981年;Tarone 1981年)以及共同的风险差异ω(科克伦1954)显示为

ψˆM（M）H（H）=∑k个=1K（K）X（X）1k个N个0k个/N个k个∑k个=1K（K）X（X）0k个N个1k个/N个k个=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ1k个∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个ψˆk个∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个,

ωˆM（M）H（H）=∑k个=1K（K）(X（X）1k个N个0k个−X（X）0k个N个1k个)/N个k个∑k个=1K（K）N个0k个N个1k个/N个k个=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ1k个∑k个=1K（K）w个M（M）H（H）,k个−∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个∑k个=1K（K）w个M（M）H（H）,k个=∑k个=1K（K）w个M（M）H（H）,k个ωˆk个∑k个=1K（K）w个M（M）H（H）,k个,

哪里第页ˆ0k个=X（X）0k个/N个0k个,第页ˆ1k个=X（X）1k个/N个1k个,N个k个=N个1k个+N个0k个和w个M（M）H（H）,k个=N个0k个N个1k个/N个k个。此外，ψˆk个=第页ˆ1k个/第页ˆ0k个和ωˆk个=第页ˆ1k个−第页ˆ0k个这些估计量是作为下列估计方程的解获得的，

问ψ=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ1k个−ψ第页ˆ0k个=0,

R（右）ω=∑k个=1K（K）w个M（M）H（H）,k个ω−第页ˆ1k个−第页ˆ0k个=0

请注意，这些估算函数在共同影响假设下是无偏的E类问ψ=0和E类R（右）ω=0估计量的一致性直接遵循。这里，假设违反了常见的效果假设，即。，ψ1,ψ2,…,ψK（K）和ω1,ω2,…,ωK（K）可能是异质的。在这种情况下，目标参数ψ和ω对于上述估计方程不再解释为共同效应。

为了评估Mantel-Haenszel估计量的渐近行为，有必要制定两个分层分析常用的大样本方案。第一个，表示为渐近I，是具有固定数量的地层K（K）虽然N个0k个,N个1k个→∞在第二种中，表示为渐近线II，N个0k个,N个1k个有界，而K（K）渐近II的一个著名例子是匹配设计。

首先，表示问k个ψ=第页ˆ1k个−ψ第页ˆ0k个,R（右）k个ω=ω−第页ˆ1k个−第页ˆ0k个，Mantel-Haenszel估计在渐近I下的渐近行为可以刻画如下。

定理1

在渐近I下，我们假设N个0k个/N个→λ0k个>0,N个1k个/N个→λ1k个>0，其中N个=N个01+…+N个0K（K）+N个11+…+N个1K（K）然后，Mantel-Haenszel估计收敛到均值等于的正态分布

ψ我∗=∑k个=1K（K）αk个第页1k个∑k个=1K（K）αk个第页0k个=∑k个=1K（K）αk个第页0k个ψk个∑k个=1K（K）αk个第页0k个,

ω我∗=∑k个=1K（K）αk个第页1k个∑k个=1K（K）αk个−∑k个=1K（K）αk个第页0k个∑k个=1K（K）αk个=∑k个=1K（K）αk个ωk个∑k个=1K（K）αk个,

和差异

V（V）A类ψˆM（M）H（H）=∑k个=1K（K）αk个2V（V）A类问k个ψ我∗∑k个=1K（K）αk个第页0k个2,V（V）A类ωˆM（M）H（H）=∑k个=1K（K）αk个2V（V）A类R（右）k个ω我∗∑k个=1K（K）αk个2,

哪里αk个=λ0k个λ1k个/λ0k个+λ1k个和V（V）A类.表示渐近方差。

附录中提供了证明大纲。请注意N个−1w个M（M）H（H）,k个是一个经验量αk个.直观地看，数量ψ我∗和ω我∗可以粗略地解释为标准化风险比率的预期数量和与标准权重的风险差异αk个由于Mantel-Haenszel风险比率和风险差异估计值表示为具有权重的标准化估计值w个M（M）H（H）,k个（Rothman等人，2008年），这个结果是直观的。然而，这一标准并没有任何内在的流行病学意义。格陵兰和马尔多纳多（1994)推断出Mantel-Haenszel比率估计收敛到类似数量的ψ我∗（请参见第3.1节)可以预期，在暴露无效的情况下，在整个队列中分层因子的标准分布上，可以近似得出一个标准化比率。Mantel-Haenszel风险比率估计器也会有类似的论据，即Mantel-Haneszel风险率估计器可能被解释为在传统标准权重上近似标准化风险比率w个N个k个=N个k个/∑我=1K（K）N个我无效。此外，标准w个N个k个和w个M（M）H（H）,k个当暴露流行率的乘积为小时k个=N个1k个/N个k个及其补充1−小时k个是跨地层的常数，即。，w个M（M）H（H）,k个=N个k个1−小时k个N个k个小时k个/N个k个=N个k个小时k个1−小时k个与…成比例N个k个什么时候小时k个1−小时k个是常量。同样，风险差异的论据也成立。在这个不变假设下，ψ我∗和ω我∗几乎符合标准化风险比率和标准风险差异αk个虽然它不一定要求小时k个（暴露流行率的分布）w个N个k个和w个M（M）H（H）,k个主要取决于混淆的强度。

此外，Mantel-Haenszel估计值也可以解释为收敛于特定阶层风险比率的加权平均值ψk个的或风险差异ωk个是的，有重量第页0k个αk个和αk个.Mante-Haenszel型砝码w个M（M）H（H）,k个将大致反映地层特定效应估计值的精度（尤其是在零效应下；佐藤1990),ψ我∗和ω我∗也可能被解释为针对特定地层的效应测量的直观总结。

其次，我们考虑渐近II。此处考虑的极限模型与布雷斯洛（1981）)和格陵兰和罗宾斯（1985年). 我们假设总样本大小的可能配置数量有限N个0k个,N个1k个在…之间K（K）地层，我们将其数量表示为我然后，重量w个M（M）H（H）,k个在每个配置中都是常量，我们将其表示为一我我=1,2,…我。此外，我们假设G公司异质风险比率和/或风险差异K（K）地层，即。，ψ1,ψ2,…,ψK（K）和ω1,ω2,…,ωK（K）可能是异构的，但这些被分类为G公司公共效应假设在每个子集中保持的子集。我们表示这些G公司异质效应参数asψ˜1,ψ˜2,…,ψ˜G公司和ω˜1,ω˜2,…,ω˜G公司。我们还假设K（K）我克地层我配置和克th子集和K（K）我,克/K（K）收敛到π我克取决于岩层中的暴露分布(我= 1,2,…,我;克= 1,2,…,G公司). 此外，妨害参数第页0k个假设从某个概率分布中取样F类0我克z（z）对于我th和克第个子集。相应的第页1k个指定为ψ˜克第页0k个或ω˜克+第页0k个然后，我们表示第页1k个作为F类1我克z（z）正式的，在这里。此外，我们表示F类0我克z（z）和F类1我克z（z）作为ρ0我克和ρ1我克此外，我们表示特定地层统计的条件方差问k个ψ,R（右）k个ω对于我th和克th子集为V（V）问,我克ψ|z（z）,V（V）R（右）,我克ω|z（z）调节开第页0k个=z（z）之后，Mantel-Haenszel估计量的渐近行为可以刻画为如下。

定理2

在渐近II下，Mantel-Haenszel估计收敛到正态分布，平均值等于

ψ我我∗=∑我=1我∑克=1G公司π我克一我ρ1我克∑我=1我∑克=1G公司π我克一我ρ0我克=∑我=1我∑克=1G公司π我克一我ρ0我克ψ˜克∑我=1我∑克=1G公司π我克一我ρ0我克,

ω我我∗=∑我=1我∑克=1G公司π我克一我ρ1我克∑我=1我∑克=1G公司π我克一我−∑我=1我∑克=1G公司π我克一我ρ0我克∑我=1我∑克=1G公司π我克一我=∑我=1我∑克=1G公司π我克一我ω˜克∑我=1我∑克=1G公司π我克一我,

和差异

V（V）A类ψˆM（M）H（H）=∑我=1我∑克=1G公司π我克2一我2E类V（V）问,我克ψ我我∗|z（z）∑我=1我∑克=1G公司π我克一我ρ0我克2,

V（V）A类ωˆM（M）H（H）=∑我=1我∑克=1G公司π我克2一我2E类V（V）R（右）,我克ω我我∗|z（z）∑我=1我∑克=1G公司π我克一我2.

附录II提供了证明大纲。与渐近I类似，一我刚好符合Mantel-Haentszel标准重量w个M（M）H（H）,k个，数量ψ我我∗和ω我我∗也可以解释为标准化风险比率的预期数量和与标准权重的风险差异一我的。只有讨厌的参数第页0k个的可能在不同地层中不同，但它被替换为特定底层中的平均值ρ0我克的。因此，与上面讨论的类似，曼特尔-哈内泽尔风险比率和风险差异估计值可能被解释为标准化风险比率和传统标准权重上的风险差异的近似值w个N个k个=N个k个/∑我=1K（K）N个我此外，Mantel-Haenszel估计量也可以被解释为收敛于异质风险比率的加权平均值ψ˜克的或风险差异ω˜克是的，有重量π我克一我ρ0我克和π我克一我.Mante-Haenszel型砝码w个M（M）H（H）,k个将大致反映地层特定效应估计值的精度（尤其是在零效应下；佐藤1990),ψ我我∗和ω我我∗也将被解释为针对特定地层的效应测量的直观总结。

另一个关注点是的渐近方差估计ψˆM（M）H（H）和ωˆM（M）H（H）在异质性假设下。然而，如定理1和2所示，渐近方差具有标准的sandwich型形式。因此，使用现有的sandwich型渐近方差估计量，可以有效地估计这些量。例如，风险比率的标准双重一致估计值（在渐近I和II下）格陵兰和罗宾斯（1985)和风险差异佐藤（1989）)即使违反了共同效应假设，也保持一致。此外，可以使用普通的bootstrap方法一致地估计渐近方差。在后一节中，通过仿真评估了同类估计量的经验性能。

2.2说明：三苯氧胺的使用与乳腺癌复发

表1介绍了一项队列研究的部分结果，以评估乳腺癌辅助三苯氧胺治疗后第二原发癌的风险(松山等人，2000年；佐藤和松山2003). 在未经批准的分析中，观察到三苯氧胺的作用几乎为零（粗风险比：1.011，粗风险差：0.002）。然而，通过手术时淋巴结转移进行分层，可以在每一层观察到可能的预防效果（层别风险比：0.910和0.670，风险差异：−0.030和−0.035）。虽然几乎不会对风险差异进行影响修正，但风险比率也会存在影响修正。我们假设在渐近I下的异质性设置。Mantel-Haenszel风险比估计值为0.830，Mantel-Haanszel的风险差异估计值为-0.033。此外，标准化风险比率和与标准的风险差异N个k个分别为0.832和−0.033。与流行病学研究的常规分析一样，尽管不能严格证实共同效应假设，但Mantel-Haenszel估计值和标准化估计值大致相同。

此外，我们还进行了模拟研究，以研究异质性下Mantel-Haenszel估计量的经验性质。我们基于分层数据集考虑了几个场景表1，例如N个11=1215,N个01=760,N个12=1334,N个02=1592、和第页01=253/760=0.333,第页12=96/1334=0.072,第页02=171/1592=0.107在这种情况下，第二层的风险比率和风险差异为第页12/第页02=0.670（RR2）和第页12−第页02=−0.035（RD2）。将第一层的风险比率和风险差异表示为RR1和RD1，我们定义了异质性因素ζR（右）R（右）=R（右）R（右）1/R（右）R（右）2和ζR（右）D类=R（右）D类1−R（右）D类2.变化ζR（右）R（右）和ζR（右）D类通过0.001，我们模拟了25000个数据集，并将Mantel-Haenszel估计量和标准化估计量的经验平均值与标准值进行了比较N个k个.图1显示了Mantel-Haenszel估计值（蓝线）和标准化估计值（黑线）的每个场景的25000个估计值的平均值。我们还策划ψ∗和ω∗对于每个场景（灰色线）。

因此，在所有情况下，Mantel-Haenszel估计的分布平均值大多符合Mantel-Haanszel估值器分布的渐近平均值ψ我∗和ω我∗根据这些结果，上一节中的大样本结果被认为在综合有限样本设置中有效。此外，正如所料，在通用效果设置中(ζR（右）R（右）=1和ζR（右）D类=0)，Mantel Haenszel估计的平均值和标准化估计的平均值完全相同。此外，在跨地层影响的异质性下，即使存在较大异质性（如ζR（右）R（右）≥2和ζR（右）D类≥0.15). 当存在定性交互作用时，也观察到这些趋势（RR1>1，RD1>0）。这些结果可能有些出乎意料，但可能表明Mantel-Haenszel估计值可以被解释为异质性下平均暴露效应的近似值，尤其是标准化估计值。

表1：

评估乳腺癌辅助三苯氧胺治疗后第二原发癌风险的队列研究结果（Matsuyama等人，2000年；佐藤和松山2003).

	手术时淋巴结转移		手术时无淋巴结转移
	他莫昔芬的使用	不使用	他莫昔芬的使用	不使用
复发	368	253	96	171
不重复发生	847	507	1,238	1,421
总计	1,215	760	1,334	1,592
经常性比例	0.303	0.333	0.072	0.107
风险比率	0.910		0.670
风险差异	−0.030		−0.035

$图1：模拟结果：Mantel-Haenszel估计值的25000个估计值的平均值（ψMH${hat\psi_{MH}$和ωMH$}hat\omega_{MH{}$）、标准化估计值（ΨNk${had\psi_}}$和ΩNk$}had\omega_}{Nk}}$）以及Mantel-Haanszel估计器收敛到（ψI*$\psi）的数量_{\rm{I}}^{\rm{*}}$和ωI*$\omega_{\rm{I}}^{\rm}}$）。$

图1：

模拟结果：Mantel-Haenszel估计值的25000个平均值(ψˆM（M）H（H）和ωˆM（M）H（H）)、标准化估算(ψˆN个k个和ωˆN个k个)，以及Mantel-Haenszel估计收敛到的量(ψ我∗和ω我∗).

3用个人时间数据分析队列研究

3.1 Mantel-Haenszel比率和比率差异估计值

我们考虑估计队列研究的分层人时数据的共同发病率比率和发病率差异。假设一系列K（K）由独立泊松观测构建的地层Y（Y）0k个,Y（Y）1k个具有固定的个人时间分母T型0k个,T型1k个和手段T型0k个第页0k个,T型1k个第页1k个对于k个=1,2,…,K（K）。此外，第页0k个,第页1k个是暴露人群和未暴露人群的瞬时发病率。在比率的共同效应假设下，我们假设地层特定比率ϕk个=第页1k个/第页0k个所有阶层都是平等的，即。，ϕ=ϕ1=ϕ2=…=ϕK（K）此外，对于利率差异，我们假设特定阶层利率差异的共同影响ξk个=第页1k个−第页0k个穿过地层，即。，ξ=ξ1=ξ2=…=ξK（K）.普通利率的Mantel-Haenszel估计值ϕ(格陵兰和罗宾斯1985;沃克1985)和共同的风险差异ξ(格陵兰和罗宾斯1985)表示为

ϕˆM（M）H（H）=∑k个=1K（K）Y（Y）1k个T型0k个/T型k个∑k个=1K（K）Y（Y）0k个T型1k个/T型k个=∑k个=1K（K）u个M（M）H（H）,k个第页ˆ1k个∑k个=1K（K）u个M（M）H（H）,k个第页ˆ0k个=∑k个=1K（K）u个M（M）H（H）,k个第页ˆ0k个第页ˆ1k个∑k个=1K（K）u个M（M）H（H）,k个第页ˆ0k个,

ξˆM（M）H（H）=∑k个=1K（K）(Y（Y）1k个T型0k个−Y（Y）0k个T型1k个)/T型k个∑k个=1K（K）T型0k个T型1k个/T型k个=∑k个=1K（K）u个M（M）H（H）,k个第页ˆ1k个∑k个=1K（K）u个M（M）H（H）,k个−∑k个=1K（K）u个M（M）H（H）,k个第页ˆ0k个∑k个=1K（K）u个M（M）H（H）,k个=∑k个=1K（K）u个M（M）H（H）,k个ξˆk个∑k个=1K（K）u个M（M）H（H）,k个,

哪里第页ˆ0k个=Y（Y）0k个/T型0k个,第页ˆ1k个=Y（Y）1k个/T型1k个,T型k个=T型1k个+T型0k个和u个M（M）H（H）,k个=(T型0k个T型1k个/T型k个)。此外，ϕˆk个=第页ˆ1k个/第页ˆ0k个和ξˆk个=第页ˆ1k个−第页ˆ0k个。Mantel-Haenszel估计量作为估计方程的解，

H（H）ϕ=∑k个=1K（K）u个M（M）H（H）,k个第页ˆ1k个−ϕ第页ˆ0k个=0,

U型ξ=∑k个=1K（K）u个M（M）H（H）,k个(第页ˆ1k个−第页ˆ0k个)−ξ=0

应该注意的是，在共同效应假设下，这些估计函数是无偏的，因此，估计值的一致性如下。

在这里，我们考虑上一节中的类似极限模型。大比例限制模型，渐近I，具有固定数量的地层K（K）虽然T型0k个,T型1k个→∞此外，对于表示为渐近II的稀疏数据限制模型，T型0k个,T型1k个有界，而K（K）很大。我们还表示H（H）k个ψ=第页ˆ1k个−ϕ第页ˆ0k个,U型k个ω=(第页ˆ1k个−第页ˆ0k个)−ξ，在这里。Mantel-Haenszel估计量的渐近行为可以描述如下。

定理3

在渐近I下，我们假设T型0k个/T型→ν0k个>0,T型1k个/T型→ν1k个>0，其中T型=T型01+…+T型0K（K）+T型11+…+T型1K（K）。Mantel-Haenszel估计量收敛到正态分布，平均值等于

ϕ我∗=∑k个=1K（K）γk个第页1k个∑k个=1K（K）γk个第页0k个=∑k个=1K（K）γk个第页0k个ϕk个∑k个=1K（K）γk个第页0k个,

ξ我∗=∑k个=1K（K）γk个第页1k个∑k个=1K（K）γk个−∑k个=1K（K）γk个第页0k个∑k个=1K（K）γk个=∑k个=1K（K）γk个ξk个∑k个=1K（K）γk个,

和差异

V（V）A类ϕˆM（M）H（H）=∑k个=1K（K）γk个2V（V）A类H（H）k个ϕ我∗∑k个=1K（K）γk个第页0k个2,V（V）A类ξˆM（M）H（H）=∑k个=1K（K）γk个2V（V）A类U型k个ξ我∗∑k个=1K（K）γk个2,

哪里γk个=ν0k个ν1k个/ν0k个+ν1k个.

此外，在渐近II下，我们假设总样本大小的可能配置数量有限T型0k个,T型1k个在…之间K（K）地层，我们将其数量表示为我然后，重量u个M（M）H（H）,k个在每个配置中形式上是恒定的，我们将其表示为秒我我=1,2,…我。此外，我们假设G公司异质比率和/或K（K）地层，即。，ϕ1,ϕ2,…,ϕK（K）和ξ1,ξ2,…,ξK（K）可能是异构的，但这些被分类为G公司公共效应假设在每个子集中保持的子集。我们表示这些G公司异质效应参数asϕ˜1,ϕ˜2,…,ϕ˜G公司和ξ˜1,ξ˜2,…,ξ˜G公司。我们还假设K（K）我克地层我配置和克th子集和K（K）我,克/K（K）收敛到π我克取决于岩层中的暴露分布(我= 1,2,…,我;克= 1,2,…,G公司). 此外，滋扰参数第页0k个假设从某个概率分布中取样F类0我克z（z）对于我th和克第个子集。相应的第页1k个指定为ϕ˜克第页0k个或ξ˜克+第页0k个，然后。我们表示第页1k个作为F类1我克z（z）正式的，在这里。我们还表示F类0我克z（z）和F类1我克z（z）作为τ0我克和τ1我克，在这里。此外，我们表示特定地层统计的条件方差H（H）k个ϕ,U型k个τ对于我th和克th子集为V（V）H（H）,我克ϕ|z（z）,V（V）U型,我克ξ|z（z）在下面第页0k个=z（z）之后，Mantel-Haenszel估计量的渐近行为可以表征如下。

定理4

在渐近II下，Mantel-Haenszel估计收敛到正态分布，平均值等于

ϕ我我∗=∑我=1我∑克=1G公司π我克秒我τ1我克∑我=1我∑克=1G公司π我克秒我τ0我克=∑我=1我∑克=1G公司π我克秒我τ0我克ϕ˜克∑我=1我∑克=1G公司π我克秒我τ0我克,

ξ我我∗=∑我=1我∑克=1G公司π我克秒我τ1我克∑我=1我∑克=1G公司π我克秒我−∑我=1我∑克=1G公司π我克秒我τ0我克∑我=1我∑克=1G公司π我克秒我=∑我=1我∑克=1G公司π我克秒我ξ˜克∑我=1我∑克=1G公司π我克秒我,

和差异

V（V）A类ϕˆM（M）H（H）=∑我=1我∑克=1G公司π我克2秒我2E类V（V）H（H）,我克ϕ我我∗|z（z）∑我=1我∑克=1G公司π我克秒我τ0我克2,

V（V）A类ξˆM（M）H（H）=∑我=1我∑克=1G公司π我克2秒我2E类V（V）U型,我克ξ我我∗|z（z）∑我=1我∑克=1G公司π我克秒我2.

这些结果可以用与定理1和定理2相同的方法得到（见附录）。因此，类似于第2节，当违反共同效应假设时，这些量可以解释为标准化比率的预期量以及与标准权重的比率差异γk个或u个M（M）H（H）,k个该标准也没有任何内在的流行病学意义。尽管格陵兰和马尔多纳多（1994)由此推断，Mantel-Haenszel速率比估计量收敛于相似的量，这在理论上是合理的。作为格陵兰和马尔多纳多（1994)经讨论，可以预期，在暴露无效的情况下，将分层因子在总队列中的标准分布近似为一个标准化比率。此外，正如第2节，在渐近I下，标准u个T型k个=T型k个/∑我=1K（K）T型我和u个M（M）H（H）,k个当暴露流行率的乘积为（f）k个=T型1k个/T型k个及其补充1−（f）k个是跨地层的常数，即。，u个M（M）H（H）,k个=T型k个1−（f）k个T型k个（f）k个/T型k个=T型k个（f）k个1−（f）k个≈T型k个什么时候（f）k个1−（f）k个是常量。在这个不变假设下，ψ我∗和ω我∗符合标准化率和标准化率差u个N个,k个此外，Mantel-Haenszel估计量也可以被解释为收敛于地层特定速率比的加权平均值ϕk个的或费率差异ξk个是的，有重量γk个第页0k个和γk个.ϕ我∗和ξ我∗也将被解释为针对特定地层的效应测量的直观总结。ϕ我我∗和ξ我我∗也可以用二项式的情况进行类似的解释第2节。渐近方差可以由普通的夹心方差型估计量估计，如格陵兰和罗宾斯（1985)，也可以通过bootstrap方法。

3.2说明：氯氮平使用者的死亡率

表2介绍了氯氮平治疗精神分裂症的当前使用者和过去使用者死亡率的研究结果(罗斯曼2002; Walker等人，1997年）。氯氮平的使用被认为与当前使用者的死亡率有关，因此过去的使用者被用作对照。按两个年龄组（10–54岁和55–95岁）分层，尽管在这两个地层中观察到了可能的保护作用（地层特定比率：0.448和0.486，比率差异：−388.7和−2903/10⁵人年）。在这项研究中，虽然利率差异会存在一定的效应修正，但几乎不会对利率比率进行效应修正。这里我们还考虑了大比例极限模型。Mantel-Haenszel比率估计值为0.469，Mantel-Haanszel风险差异估计值为−710.7/10⁵人年。此外，标准化比率和与T型k个为0.466和−633.2/10⁵分别为人年。至于乳腺癌的例子第2节在这种情况下，Mantel-Haenszel估计值和标准化估计值大致相同。

在此，我们还进行了模拟实验，以研究异质性下Mantel-Haenszel估计量的经验性质。我们基于分层数据集考虑了几个场景表2，例如T型11=62119,T型01=15763,T型12=2744,T型02=2780、和第页11=196/62119=315.5×105,第页01=111/15763=704.2×105,第页02=157/2780=5647×105在这种情况下，第一层的比率和比率差为第页11/第页01=0.448（内部收益率1）和第页11−第页01=−388.7×105（IRD1）。将第二层的比率和比率差表示为IRR2和IRD2，我们定义了非均质性因素ζ我R（右）R（右）=我R（右）R（右）2/我R（右）R（右）1和ζ我R（右）D类=我R（右）D类2−我R（右）D类1.变化ζ我R（右）R（右）和ζ我R（右）D类通过0.0001，我们模拟了25000个数据集，并将Mantel-Haenszel估计量和标准化估计量进行了比较T型k个.图2显示了Mantel-Haenszel估计值（蓝线）和标准化估计值（黑线）的每个场景的25000个估计值的平均值。我们还展示了ϕ我∗和ξ我∗对于每个场景（灰色线）。

在所有情况下，Mantel-Haenszel估计的分布平均值大多符合Mantel-Haanszel估值器分布的渐近平均值ϕ∗和ξ∗此外，正如预期的那样，在周围的设置中ζ我R（右）R（右）≈1,ζ我R（右）D类≈0（几乎在共同效应假设下），Mantel-Haenszel估计值和标准化估计值的平均值大致相同。然而，当地层之间的非均质性变大时，这两个估计值就会有一定的差异。在这些情况下，当前氯氮平使用者的总人数比例并不完全相同，并且（f）11−（f）1=0.161,（f）21−（f）2=0.215因此，可以预见这些差异。此外，这些差异并不大，例如，当ζ我R（右）R（右）=1.5，的平均值ϕˆM（M）H（H）为0.574ϕˆT型k个为0.557。此外，当ζ我R（右）D类=2000×10−5，的平均值ξˆM（M）H（H）是125×10−5和的ξˆT型k个是184×10−5这些结果可能表明，Mantel-Haenszel估计值不一定能被解释为异质性下平均暴露效应的近似值，但它们的不一致性并不严重。在任何情况下，在地层间强烈异质性下都不建议使用Mantel-Haanszel估算值。然而，在小异质性下，它们可以被解释为平均暴露效应的近似值，即标准化估计值T型k个.

表2：

队列研究结果：当前和过去氯氮平使用者的死亡率（Walker等人，1997年）；数据来自罗斯曼（2002）第154页）。

	年龄（岁）：10–54		年龄（岁）：55-94
	当前	过去的	当前	过去的
死亡人数	196	111	167	157
人-年	62,119	15,763	6,085	2,780
费率（每10⁵人年）	315.5	704.2	2,744	5,647
利率比率	0.448		0.486
费率差异（每10⁵人年）	−388.7		−2,903

$图2：模拟结果：Mantel-Haenszel估计值的25000个估计值的平均值（ˆMH${\hat\phi_{MH}}$和ξ\rm{I}}^{\rm{*}}$和ξI*$\xi_{\rm{I}}^{\rm}}$）。$

图2：

模拟结果：Mantel-Haenszel估计值的25000个平均值(ϕˆM（M）H（H）和ξˆM（M）H（H）)、标准化估算(ϕˆT型k个和ξˆT型k个)，以及Mantel-Haenszel估计收敛到的量(ϕ我∗和ξ我∗).

4病例对照研究分析

4.1 Mantel-Haenszel比值比估计器

我们讨论了病例对照研究中分层分析的常见优势比估计。考虑使用相同的设置第2节，一系列K（K）由两对独立二项式观测值组成的2×2表格X（X）0k个,X（X）1k个具有样本大小N个0k个,N个1k个和成功概率第页0k个,第页1k个对于k个=1,2,…,K（K）.在病例对照研究中，N个0k个和N个1k个对应于案例和控制的总数，以及X（X）0k个和X（X）1k个是暴露案例和控制的数量。通过交换行和列，这种设置通常适用于队列和病例对照研究，因此我们这里采用了相同的符号。在共同效应假设下，我们假设特定于地层的比值比θk个=第页1k个1−第页0k个/第页0k个1−第页1k个在整个地层中都是相等的，即。，θ=θ1=θ2=…=θK（K）.普通比值比的Mantel-Haenszel估计θ(Mantel和Haenszel 1959年)显示为

θˆM（M）H（H）=∑k个=1K（K）X（X）1k个N个0k个−X（X）0k个/N个k个∑k个=1K（K）X（X）0k个N个1k个−X（X）1k个/N个k个=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ1k个1−第页ˆ0k个∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个1−第页ˆ1k个

=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个1−第页ˆ1k个θˆk个∑k个=1K（K）w个M（M）H（H）,k个第页ˆ0k个1−第页ˆ1k个,

哪里θˆk个=第页ˆ1k个1−第页ˆ0k个/{第页ˆ0k个(1−第页ˆ1k个)}该估计器也是作为以下估计方程的解而获得的，

W公司θ=∑k个=1K（K）w个M（M）H（H）,k个第页ˆ1k个1−第页ˆ0k个−θ第页ˆ0k个1−第页ˆ1k个=0

在共同效应假设下，该估计函数是无偏的，即。，E类W公司θ=0和估计量的一致性θˆM（M）H（H）是有保证的。我们认为这里违反了共同效应假设。在此设置下，目标参数θ对于上述估计方程，不一定定义为一般比值比。然而，作为前瞻性队列研究的风险比估计，渐近行为可以被描述为以下特征。使用相同的符号第2节,

定理5。

在渐近I下，Mantel-Haenszel估计收敛到平均值等于的正态分布

θ我∗=∑k个=1K（K）αk个第页1k个1−第页0k个∑k个=1K（K）αk个第页0k个1−第页1k个=∑k个=1K（K）αk个第页0k个1−第页1k个θk个∑k个=1K（K）αk个第页0k个1−第页1k个.

和差异

V（V）A类θˆM（M）H（H）=∑k个=1K（K）αk个2V（V）A类W公司k个θ我∗∑k个=1K（K）αk个第页0k个1−第页1k个2,

哪里W公司k个θ=第页ˆ1k个1−第页ˆ0k个−θ第页ˆ0k个1−第页ˆ1k个.

此外，在渐近线II下，θˆM（M）H（H）收敛于平均正态分布

θ我我∗=∑我=1我∑克=1G公司π我克一我ρ1我克1−ρ0我克∑我=1我∑克=1G公司π我克一我ρ0我克1−ρ1我克=∑我=1我∑克=1G公司π我克一我ρ0我克1−ρ1我克θ˜克∑我=1我∑克=1G公司π我克一我ρ0我克1−ρ1我克,

和差异

V（V）A类θˆM（M）H（H）=∑我=1我∑克=1G公司π我克2一我2E类V（V）W公司,我克θ我我∗|z（z）∑我=1我∑克=1G公司π我克一我ρ0我克1−ρ1我克2,

哪里θ˜1,θ˜2,…,θ˜G公司在G公司地层和V（V）W公司,我克θ|z（z）是的条件方差W公司k个θ什么时候第页0k个=z（z）.

因此，类似于第2节和三Mantel-Haenszel比值比估计器也可以被解释为收敛于特定阶层比值比的加权平均值θk个与重量有关αk个第页0k个1−第页1k个或π我克一我ρ0我克1−ρ1我克.Mantel-Haenszel型砝码w个M（M）H（H）,k个将反映地层特定影响估计值的精度(2005年藤井和柳本;佐藤1990)近似（特别是在零效应下），因此θ我∗和θ我我∗也可以解释为对特定于地层的影响度量的直观总结。虽然比值比本身不能解释为一种效果度量，但当发病风险较低时，可以解释为风险比的良好近似值(格陵兰1987; Rothman等人，2008年）。因此，在罕见假设下，θ我∗和θ我我∗可以解释为在某些条件下的标准化风险比率第2节此外θˆM（M）H（H）在异质性下以及第2节此外，当违反共同效应假设时，Robins、Breslow和Greenland（1986）的双重一致方差估计仍然是一致的。哈克（1979）)的方差估计在渐近I下也是一致的，因为它只是通过组合特定于地层的方差估计来推导的。bootstrap方差估计是另一种有效的估计。

4.2通过模拟进行数值评估

4.2.1 Mantel-Haenszel估计器的行为

我们评估了Mantel-Haenszel估计量的经验特性θˆM（M）H（H）通过仿真研究。首先，我们生成了2×2个表(K（K）=2）模拟乳腺癌研究的队列数据（Matsuyama等人，2000；佐藤和松山2003)英寸第2.2节，例如N个11=1200,N个01=800,N个12=1400,N个02=1600。我们考虑第二层（RR2）的风险比变化为0.75、1.00，并设置第页12=0.050,0.075此外，我们将第一层的风险比率（RR1）设置为ζ⋅R（右）R（右）2，其中ζ是异质性因素（当ζ=1，共有效应假设成立）。我们还假设第页02=第页01=第页12/R（右）R（右）2。这里，变化ζ，我们模拟了3600个队列数据集。然后，我们通过抽样所有病例和10%，生成病例对照数据集假设设置为渐近I，队列数据集中的非病例随机（两个阶层的抽样概率相同）。在生成的病例对照数据集中，我们计算了Mantel-Haenszel比值比估计值和最大似然估计值。此外，我们用标准计算了标准化的风险比率估计N个k个用于原始队列数据。图3给出了曼特尔-海恩斯泽尔（Mantel-Haenszel）估计值（蓝线）和标准化估计值（黑线）各情景下3600个估计值的平均值。我们还考虑了渐近II设置。我们通过对所有病例进行抽样，并对与淋巴结转移状态匹配的1:2对照组进行匹配，生成匹配的病例对照数据集。在这两个生成的病例对照数据集中，我们计算了Mantel-Haenszel比值比估计值。此外，我们使用标准计算了标准化风险比率估计值N个k个原始队列数据。图3和4给出曼特尔·海恩斯泽尔（Mantel-Haenszel）估计值（蓝线）和标准化估计值（黑线）的每个场景的3600个估计值的平均值。

在所有设置的结果中，如预期一样，在公共效果设置中(ζ=1)在队列中，Mantel-Haenszel比值比估计值和标准化风险比估计值的平均值大致相同，因为稀有疾病假设成立。此外，在违反共同效应假设的情况下，即使存在较大异质性，这些估计也几乎相同。这些结果可以通过以下数值结果进行预测第2.2节，因为当持有罕见疾病假设时，风险比和优势比大致相同。这些结果表明，在罕见假设下，普通比值比的Mantel-Haenszel估计值可以解释为跨层平均暴露效应的近似值，即标准化风险比估计值。

$图3：渐近线I下的模拟结果：Mantel-Haenszel估计值（θMH${hat\theta_{MH}}$）的3600个估计值的平均值，以及相应队列研究的标准化风险比率估计值（ψNk${had\psi_{Nk}}$。$

图3：

渐近I下的模拟结果：Mantel-Haenszel估计值的3600个估计值的平均值(θˆM（M）H（H）)以及相应队列研究的标准化风险比率估计(ψˆN个k个).

$图4：渐近线II下的模拟结果：Mantel-Haenszel估计值（θMH${hat\theta_{MH}}$）的3600个估计值的平均值，以及相应队列研究的标准化风险比率估计值（ψNk${had\psi_{Nk}}$。$

图4：

渐近II下的模拟结果：Mantel-Haenszel估计值的3600个估计值的平均值(θˆM（M）H（H）)以及相应队列研究的标准化风险比率估计(ψˆN个k个).

4.2.2方差估计

我们还评估了方差估计的有效性。设置大致模拟了先前模拟中生成的病例对照数据集。首先，对于大比例设置，我们生成了2×2个表(K（K）=2）例如N个11=150,N个01=285,N个12=160,N个02=190。我们将第一层和第二层的优势比表示为OR₁和OR₂.我们设置OR₁为0.500、0.750、1.000和OR₂为OR的0.500、0.750、1.000、1.250、1.500、1.750、2.000倍₁。我们还设置第页11至0.450。我们模拟了3600个病例对照数据集，并评估了Mantel-Haenszel估计的实际标准误差（SE）和Hauck估计的方差平方根平均值(V（V）ˆ_哈克)Robins-Breslow Greenland的估算师(V（V）ˆ_RBG公司)，和bootstrap方差估计量(V（V）ˆ_靴子)3600次复制。引导重新采样的数量设置为5000。模拟结果如所示表3。在所有考虑的设置下，这三个估计器有效地量化了整体的实际SE。

其次，对于稀疏数据设置，我们在可能异质的两个种群下生成了1:1和1:4匹配的病例对照数据集。我们将病例数据集分为N个11=150和N个12=160，并认为这两个阶层之间的真实优势比可能是异质的。我们将第一层和第二层的比值比表示为OR₁和OR₂也是。我们设置OR₁为0.500、0.750、1.000和OR₂为OR的0.500、0.750、1.000、1.250、1.500、1.750、2.000倍₁。我们还设置第页11至0.450。我们在每种设置下模拟了3600个匹配的病例对照数据集，并评估了Mantel-Haenszel估计量的实际标准误差（SE）和Robins-Breslow-Green估计量的方差平方根平均值(V（V）ˆ_RBG公司)，和bootstrap方差估计量(V（V）ˆ_靴子)3600个复制。引导重新采样的数量设置为5000。模拟结果如所示表4对于稀疏数据设置，方差估计器有效地量化了所有考虑的设置下的实际SE。即使违反了共同效应假设，现有的方差估计量对于量化Mantel-Haenszel估计量的SE通常也是有效的。

表3：

渐近I：Mantel-Haenszel估计量的实际SE和Hauck估计量方差平方根均值下的模拟结果(V（V）ˆH（H）一u个c（c）k个)Robins-Breslow Greenland的估算师(V（V）ˆR（右）B类G公司)，和bootstrap方差估计量(V（V）ˆb条o个o个t吨)3600个复制。

		实际SE	V（V）H（H）一u个c（c）k个1/2	V（V）R（右）B类G公司1/2	V（V）b条o个o个t吨1/2
或₁= 0.500	或₂= 0.250	0.151	0.156	0.152	0.151
	或₂= 0.375	0.153	0.151	0.150	0.150
	或₂= 0.500	0.148	0.150	0.149	0.150
	或₂= 0.625	0.149	0.150	0.149	0.149
	或₂= 0.750	0.150	0.151	0.149	0.149
	或₂= 0.875	0.150	0.152	0.149	0.149
	或₂= 1.000	0.148	0.153	0.149	0.149
或₁= 0.750	或₂= 0.375	0.151	0.154	0.150	0.149
	或₂= 0.563	0.150	0.150	0.148	0.149
	或₂= 0.750	0.149	0.148	0.148	0.148
	或₂= 0.938	0.146	0.148	0.147	0.148
	或₂= 1.125	0.147	0.149	0.147	0.147
	或₂= 1.313	0.150	0.150	0.147	0.147
	或₂= 1.500	0.146	0.151	0.147	0.146
或₁= 1.000	或₂= 0.500	0.148	0.155	0.150	0.150
	或₂= 0.750	0.149	0.150	0.149	0.149
	或₂= 1.000	0.149	0.149	0.148	0.148
	或₂= 1.250	0.150	0.149	0.148	0.148
	或₂= 1.500	0.150	0.149	0.147	0.147
	或₂= 1.750	0.147	0.150	0.147	0.147
	或₂= 2.000	0.147	0.152	0.148	0.146

表4：

渐近II下的模拟结果：Mantel-Haenszel估计量的实际SE和Robins-Breslow-Green估计量的方差平方根平均值(V（V）ˆR（右）B类G公司)和bootstrap方差估计器(V（V）ˆb条o个o个t吨)3600个复制。

		1:1匹配			1:4匹配
		实际SE	V（V）R（右）B类G公司1/2	V（V）b条o个o个t吨1/2	实际SE	V（V）R（右）B类G公司1/2	V（V）b条o个o个t吨1/2
或₁= 0.500	或₂= 0.250	0.180	0.178	0.181	0.136	0.135	0.136
	或₂= 0.375	0.171	0.172	0.174	0.133	0.132	0.132
	或₂= 0.500	0.171	0.169	0.171	0.131	0.130	0.131
	或₂= 0.625	0.168	0.168	0.169	0.131	0.129	0.130
	或₂= 0.750	0.166	0.166	0.168	0.128	0.129	0.129
	或₂= 0.875	0.166	0.166	0.167	0.130	0.129	0.129
	或₂= 1.000	0.169	0.165	0.167	0.131	0.129	0.129
或₁= 0.750	或₂= 0.375	0.169	0.169	0.170	0.130	0.132	0.133
	或₂= 0.563	0.170	0.165	0.166	0.129	0.129	0.130
	或₂= 0.750	0.165	0.163	0.164	0.129	0.128	0.129
	或₂= 0.938	0.162	0.162	0.163	0.129	0.127	0.128
	或₂= 1.125	0.162	0.162	0.163	0.127	0.127	0.128
	或₂= 1.313	0.160	0.162	0.163	0.124	0.127	0.128
	或₂= 1.500	0.164	0.162	0.163	0.126	0.128	0.128
或₁= 1.000	或₂= 0.500	0.165	0.166	0.168	0.129	0.132	0.132
	或₂= 0.750	0.165	0.163	0.165	0.128	0.129	0.129
	或₂= 1.000	0.164	0.162	0.164	0.126	0.128	0.128
	或₂= 1.250	0.164	0.162	0.163	0.126	0.128	0.128
	或₂= 1.500	0.163	0.162	0.164	0.127	0.128	0.128
	或₂= 1.750	0.160	0.163	0.164	0.126	0.128	0.128
	或₂= 2.000	0.160	0.163	0.165	0.125	0.128	0.129

5结束语

Mantel-Haenszel估计量因其简单有效而被广泛应用于流行病学和临床研究，包括荟萃分析。然而，一般实践中无法证明共同效应假设的正确性，因此，目标“共同效应参数”并不存在。在这种情况下，即使Mantel-Haenszel估计量具有理想的性质，也无法确定其估计的内容以及如何解释这些估计。然而，许多流行病学家和统计学家预计，它们可能被解释为某种方式的平均暴露效应，尽管没有一定的理论原因。在本研究中，我们对Mantel-Haenszel估计量在违反共同效应假设的情况下进行了理论评估，并表明直觉基本正确。这些结果也符合以下预期格陵兰和马尔多纳多（1994). 通过一系列的数值研究，我们还表明这些大样本结果在有限样本的实际情况下是有效的。

作为相关的近期理论著作，Xu和O'Quigley（2000）和Hattori和Henmi（2012年)表明，即使违反比例风险假设，Cox回归模型的偏似然估计也可以解释为平均风险比估计。根据本研究的结果，Mantel-Haenszel估计量也被解释为（i）当共同效应假设正确（作为最佳情景）时，它们几乎是共同效应参数的有效估计量，以及（ii）当共同作用假设不正确时，它们可以被解释为跨地层的平均暴露效应估计值。显然，当存在强效应修正时，不建议将特定于地层的效应措施合成为共同效应(格陵兰1982; Mantel等人，1977年）。至少对于中等效果修改的设置，使用通用效果估算器是合适的。从这两个方面来看，Mantel-Haenszel估计量的这些理论和数值证据将为流行病学和临床研究实践提供有意义的信息。

资金报表：基金：这项工作得到了日本教育、文化、体育、科学和技术部科学研究拨款的支持（拨款编号：25280008，15K15954）。

工具书类

Breslow，N.E.（1981年）。数据稀疏时的奇数比估计。《生物特征》，68:73-84。10.1093/生物组/68.1.73在谷歌学者中搜索

Cochran，W.G.（1954年）。加强普通卡方检验的一些方法。生物统计学，10:417-451。10.2307/3001616在谷歌学者中搜索

Fujii，Y.和Yanagimoto，T.（2005）。成对条件得分函数：Mantel-Haenszel估计量的推广。《统计规划与推断杂志》，128:1-12。2016年10月10日/j.jspi.2003.09.035在谷歌学者中搜索

Godambe，V.P.（1969年）。正则极大似然估计的一个最佳性质。《数理统计年鉴》，31:1208–1212。10.1214/aoms/1177705693在谷歌学者中搜索

格陵兰，S.（1982年）。异质性下汇总比率的解释和估算。医学统计，1:217–227。10.1002/sim.4780010304在谷歌学者中搜索公共医学

格陵兰，S.（1987）。流行病学分析中效果指标的解释和选择。美国流行病学杂志，125:761-768。10.1093/oxfordjournals.aje.a114593在谷歌学者中搜索公共医学

格陵兰，S.和马尔多纳多，G.（1994）。将乘法模型参数解释为标准化参数。医学统计，13:989–999。10.1002/sim.4780131002在谷歌学者中搜索公共医学

格陵兰，S.和罗宾斯，J.（1985）。从稀疏的随访数据中估计共同效应参数。生物统计学，41:55–68。10.2307/2530643在谷歌学者中搜索

Hattori，S.和Henmi，M.（2012年）。根据可能错误的Cox回归估计治疗效果。终身数据分析，18:408–433。2007年10月10日/10985-012-9222-8在谷歌学者中搜索公共医学

霍克，W.W.（1979）。常见比值比的Mantel-Haenszel估计值的大样本方差。生物统计学，35:817–819。10.2307/2530114在谷歌学者中搜索

Higgins，J.P.T.和Green，S.（2008）。Cochrane干预措施系统审查手册。奇切斯特：威利-布拉克韦尔。10.1002/9780470712184在谷歌学者中搜索

Mantel，N.、Brown，C.和Byar，D.P.（1977年）。流行病学调查中效果的同质性测试。美国流行病学杂志，106:125-129。10.1093/oxfordjournals.aje.a112441在谷歌学者中搜索

Mantel，N.和Haenszel，W.H.（1959年）。疾病回顾性研究数据分析的统计方面。国家癌症研究所杂志，22:719-748。在谷歌学者中搜索

Matsuyama，Y.、Tominaga，T.、Nomura，Y.等人（2000年）。日本乳腺癌辅助三苯氧胺治疗后的第二种癌症。《肿瘤年鉴》，11:1537–1543。10.1093/oxfordjournals.annonc.a010406在谷歌学者中搜索

Nurminen，M.（1981）。一般相对风险非迭代估计的渐近效率。生物特征，68:525–530。10.1093/生物组/68.2.525在谷歌学者中搜索

Robins，J.M.、Breslow，N.和Greenland，S.（1986年）。稀疏数据和大比例限制模型中Mantel-Haenszel方差的估计值一致。生物统计学，42:311-323。10.2307/2531052在谷歌学者中搜索

Rothman，K.J.（2002年）。流行病学：导论。纽约：牛津大学出版社。在谷歌学者中搜索

Rothman，K.J.、Greenland，G.和Lash，T.L.（2008）。现代流行病学。第3版。费城：Lippincott Williams&Wilkins。在谷歌学者中搜索

佐藤（1989）。Mantel-Haenszel风险差异的方差估计。生物统计学，45:1323–1324。在谷歌学者中搜索

佐藤（1990）。癌症流行病学中常见影响参数的置信区间。《环境金属健康展望》，87:95-101。10.1289/ehp.908795在谷歌学者中搜索

Sato，T.和Matsuyama，Y.（2003年）。边缘结构模型作为标准化工具。流行病学，14:680-686。10.1097/01.EDE.0000081989.82616.7d在谷歌学者中搜索

Tarone，R.E.（1981）。关于相对风险的汇总估计。《慢性病杂志》，34:463–468。10.1016/0021-9681(81)90006-0在谷歌学者中搜索

Walker，A.M.（1985）。常见风险比的一些估计值的小样本性质。应用统计学，34:42–48。10.2307/2347883在谷歌学者中搜索

Walker，A.M.、Lanza，L.L.、Arellano，F.和Rothman，K.J.（1997）。氯氮平当前和以前使用者的死亡率。流行病学，8:671-677。10.1097/00001648-199711000-00014在谷歌学者中搜索

White，H.（1982）。错误指定模型的最大似然估计。计量经济学，50:1-9。10.2307/1912526在谷歌学者中搜索

Xu，R.和O’Quigley，J.（2000）。估计非比例风险下的平均回归效应。生物统计学，1:423-439。10.1093/生物统计/1.4.423在谷歌学者中搜索

Yanagimoto，T.（1990）。地层共同参数的组合矩估计。统计规划与推断杂志，25:187-198。10.1016/0378-3758(90)90065-3在谷歌学者中搜索

Yi，G.Y.和Reid，N.（2010年）。关于误定估计函数的注释。中国统计局，20:1749-1769。在谷歌学者中搜索

附录

在本附录中，我们概述了Mantel-Haenszel估计量渐近分布的推导证明。由于Mantel-Haenszel估计函数的函数形式是通用的，证明的基本原理是通用的。在这里，我们简要描述了比值比案例。

渐近IMantel-Haenszel估计函数的泰勒展开W公司θ给予

θˆM（M）H（H）−θ≈−1N个∑k个=1K（K）w个M（M）H（H）,k个∂W公司k个θ∂θ−11N个∑k个=1K（K）w个M（M）H（H）,k个W公司k个θ

由于大数定律，∂W公司k个θ/∂θ≈E类∂W公司k个θ/∂θ在极限模型下。因此，利用中心极限定理推导了估计量的渐近正态性W公司k个θ的渐近平均值θˆM（M）H（H）对应于

我我米N个→∞∑k个=1K（K）w个M（M）H（H）,k个N个W公司k个θ=0

它符合θ我∗此外，渐近方差表示为

∑k个=1K（K）αk个2V（V）A类[W公司k个θ我∗/∑k个=1K（K）αk个E类∂W公司k个θ我∗∂θ2.

因此，导出了渐近分布。

渐近II对于稀疏数据限制模型K（K）→∞,W公司θ被视为许多不相同但独立的量的总和，因此θˆM（M）H（H）是推断出来的。此外，Mantel-Haenszel估计函数的Taylor展开W公司θ提供

θˆM（M）H（H）−θ≈−1K（K）∑k个=1K（K）w个M（M）H（H）,k个∂W公司k个θ∂θ−11K（K）∑k个=1K（K）w个M（M）H（H）,k个W公司k个θ

右手边的第一项可以表示为

1K（K）∑k个=1K（K）w个M（M）H（H）,k个∂W公司k个θ∂θ=∑我=1我∑克=1G公司K（K）我克K（K）一我1K（K）我克∑k个∈Ξ我克∂W公司k个θ∂θ→∑我=1我∑克=1G公司π我克一我E类∂W公司k个θ∂θ.

哪里Ξ我克是对应于我,克因此θˆM（M）H（H）对应于

我我米K（K）→∞∑k个=1K（K）w个M（M）H（H）,k个K（K）W公司k个θ=0

目标函数的表达式为

∑k个=1K（K）w个M（M）H（H）,k个K（K）W公司k个(θ)=∑我=1我∑克=1G公司K（K）我克K（K）一我{1K（K）我克∑k个∈Ξ我克W公司k个(θ)}→∑我=1我∑克=1G公司π我克一我{E类[第页^1k个(1−第页^0k个)]−θE类[第页^0k个(1−第页^1k个)]}=∑我=1我∑克=1G公司π我克一我{ρ1k个(1−ρ0k个)−θρ0k个(1−ρ1k个)}

因此，该解决方案对应于θ我我∗此外，渐近方差表示为

∑我=1我∑克=1G公司π我克2一我2E类V（V）W公司,我克θ我我∗|z（z）/∑我=1我∑克=1G公司π我克一我E类∂W公司k个θ我我∗∂θ2.