总结

在将模型拟合到对数变换的响应变量的一般情况下,从理论上研究了Fay–Herriot正态误差模型中小面积估计量的均方误差的精确估计问题。对于偏差修正的经验最佳线性无偏预测小面积点估计量,给出了均方误差公式和估计量,其偏差小于小面积数的倒数。在美国人口普查局正在进行的“小地区收入和贫困估算”项目中,一项模拟研究和一个与县一级儿童贫困率估算相关的实际数据示例说明了这些均方误差估算器的性能。

1.简介

小面积估算在调查应用中变得越来越重要,尤其是在官方统计领域,因为立法授权要求在比国家调查直接估算准确描述的范围更窄的管辖范围内进行社会经济估算。由于使用调查结果作出的决策可能会产生很大的影响,因此报告估计值及其精度非常重要,而均方误差(MSE)是衡量精度的标准,已成为小面积领域(Rao,2003).

特别是当调查测量变量时,如人口数量或监测到的零星变化的货币数量,涉及这些变量的小面积模型通常是根据对数或应用于采样数据的其他转换来指定的。在对采样响应进行变换后,将逆变换应用于变换后响应的小面积估计,可以很好地估计出偏差修正后的小面积响应。有时会选择变换,以便小面积参数的置信区间在变换尺度上近似对称,但在原始尺度上不对称。尽管如此,均方根误差和变异系数仍然是报告测量估算精度的标准方法,并且可能更容易在有意义的而非转换后的测量尺度上进行解释。

到目前为止,普拉萨德和拉奥的非常有用的理论还没有扩展(1990)还有Datta和Lahiri(2001)关于非线性变换响应情况下Fay–Herriot小面积估计的MSE的“二阶正确”估计。等。(2002)提出了一种基于jackknife的有效MSE估计偏差校正方法,该方法可以得到最佳预测值的MSE估计值,尽管通常不是最佳线性无偏预测值。迈蒂(2004)在经验贝叶斯框架中应用了MSE估计的折刀法,使用了易于计算矩的对数正态模型。饶(2003)第133页,指出了通过泰勒线性化将Prasad–Rao和Datta–Lahiri的方法推广到转换响应情况的非私利性。基于线性化的扩展二阶MSE公式和估计量是本文的主要贡献。

论文组织如下。费伊和赫里奥特(1979)第节介绍了应用于转换数据的模型2以及偏差校正的小面积估计公式。章节发展了小面积点估计量MSE的理论表达式,对于大数是渐近的小面积。即使在未转换的Fay–Herriot数据的情况下,这些推导也遵循了一种新颖的方法,但它们在非线性,尤其是对数转换数据的扩展中显示出了真正的有用性。章节4提供了小面积估算(SAE)的MSE估算值,这些估算值按顺序无偏𝒪(1/). 剖面图中的模拟研究5即使在仅有100个小区域的研究中,也强烈支持我们的MSE估计器的理论预测行为。接下来,第节给出了实际数据集中MSE估计的数据分析应用6最后,我们在第节中总结了我们的结论和建议7.

2.小面积估算的Fay–Herriot模型

本文针对小面积应用研究的混合效应线性模型均基于Fay和Herriot(1979)模型形式。对于由索引的每个区域=1,…,,假设样本大小n个-维向量x个的预测变量已知,且响应变量满足

=x个信托收据β+u个+e(电子)u个~N个(0σ2)e(电子)~N个(0)
1

被观察到(无论何时n个>0),其中βR(右)是未知固定效应系数的向量u个e(电子)分别是区域随机效应和采样误差,在区域内和区域间相互独立。差异假定为已知函数n个可能除了常量v(v)e(电子)相称性:通常的形式是v(v)e(电子)/n个通常情况下,σ2是未知和估计的,而v(v)e(电子)已知。在某些应用中,如Section附录A)和v(v)e(电子)未知,但我们没有给出这种情况下的显式公式。

小型企业基于这种Fay–Herriot模型的统计数据旨在用较小的MSE估计参数

ϑ=x个信托收据β+u个=1.

在对数转换的Fay–Herriot模型中,是观察到的日志响应第个区域,可解释的小区域参数由指数定义:

ϑ*=经验(ϑ)经验(x个信托收据β+u个).
2

2.1、。小面积估算公式

在Fay–Herriot模型中,我们考虑的估计量ϑj个基于数据{n个:n个>0,1}以上是估计的最佳线性无偏预测估值器(Rao,2003)

ϑ^j个=x个j个信托收据β^+γ^j个(j个负极x个j个信托收据β^)

哪里(β^σ^2)(β^υ^e(电子))是模型(1)中的最大似然估计量

γ^j个=σ^2σ^2+v(v)e(电子)/n个j个.

我们遵循惯例γ^j个0(以便ϑ^j个=x个j个信托收据β^)何时n个j个=0.此外,我们定义了供将来参考=υe(电子)/n个τ=σ2+γ=σ2/τη=x个信托收据βη^=x个信托收据β^.

我们给出了通常的Fay–Herriot模型的结果,误差直接评估为ϑj个ϑ^j个和之间测量的误差

ϑj个*=小时(ϑj个)

以及该变换参数的直接估计,其中小时(x个)是已知的光滑单调函数(exp(x个)对于当前论文的大部分内容)。在转换的情况下,参数ϑj个*由近似偏差修正公式估计

ϑ^j个*=ρ^小时(ϑ^j个)ρ^=E类^{小时(ϑj个)}/E类^{小时(ϑ^j个)}
4

其中表示法E类^()是指通过代入(β^σ^2)的(βσ2)在指定期望的渐近正确表达式中。在最有趣的情况下小时(x个)=经验(x个),公式(4)为

ϑ^j个*=经验{x个j个信托收据β^+γ^j个(j个负极x个j个信托收据β^)+12σ^2(1负极γ^j个)}

它忽略了参数估值器的可变性,但修正了由于面积随机效应而产生的偏差。与通用小时,类似的公式是

ϑ^j个*=小时(ϑ^j个)E类{小时(ηj个+u个j个)}E类[小时{ηj个+γj个(u个j个+e(电子)j个)}]|(βσ2)=(β^σ^2).
6

3.均方误差公式

在本节中,我们提供了模型(1)中MSE的大样本近似值,该模型与独立项和的最大似然估计(MLE)的标准表达式密切相关。本节假设响应变量=1,…,,满足模型(1),并且

  • (a)

    随机向量x个和样本大小n个或者是一致有界的,或者是具有有限四阶矩的独立同分布变量的实现,

  • (b)

    无论是否随机,向量x个R(右)是这样的(概率接近1)=1x个2是正定矩阵,其中,对于列向量v(v),我们表示v(v)⊗2=v(v)v(v)信托收据

  • (c)
    存在以下大样本(概率)极限→∞,带有错误项O(运行)P(P)(−1/2):
    ¯(1)=(负极1=1x个2σ2+)¯(2)={负极1=112(σ2+)2}.

数据的对数似然由下式给出

洛格里克=负极12=1日志(σ2+)负极=1(负极x个信托收据β)22(σ2+)

并部分最大化(inβ,用于固定σ2)何时

β=β^(σ2)(=1x个2σ2+)负极1=1x个σ2+.

β^(σ2)替换为β被称为轮廓对数似然,并且在σ2生成估计器σ^2.

大样本信息矩阵(F类)的(βσ2)根据数据很容易计算出块分解形式

=(β^负极100信托收据σ^2负极1)β^负极1==1x个2σ2+σ^2负极1==112(σ2+)2

以及,根据假设(c)per-observation信息−1存在并与块对角线¯(1)¯(2).然后得分统计向量很容易计算为

βσ2日志喜欢==112(σ2+)(2x个(负极x个信托收据β)负极1+(负极x个信托收据β)2/(σ2+))

以及基于简单泰勒级数展开的局部一致极大似然估计的标准一般结果

(β^负极βσ^2负极σ2)==1τ(β^x个(u个+e(电子))σ^2(u个+e(电子))2负极τ2τ)+o(o)P(P)(1)
7

使用o(o)P(P)(1) 模型(1)下具有实际参数的剩余保持概率(βσ2). 然而,我们要求的精度略高于方程式提供的精度(7). 关于泰勒级数的更仔细展开(βσ2)在模型(1)下,使用对数似然的形式,对似然方程(将对数似然梯度设置为MLE处的0)进行了计算,结果表明,方程中的误差(7)实际上是𝒪P(P)(−1/2). 我们在下一个结果中证明了这一点,其证据可以在附录A.

引理1。在正态误差Fay–Herriot模型(1)中,

β^负极β负极β^=1x个τ(u个+e(电子))=负极β^=1x个τ2(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2                  +β^=1x个2τ2β^=1x个τ(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2+o(o)P(P)(1)
8

σ^2负极1{σ^2负极σ2负极σ^2=1(u个+e(电子))2负极τ2τ2}           ==1[负极(u个+e(电子))x个信托收据τ2(β^负极β)+{x个信托收据(β^负极β)}22τ2+(σ^2负极σ2)2τ]负极σ^2=1(u个+e(电子))2负极τ2τ2           ×=1(u个+e(电子))2负极ττ+o(o)P(P)(1).
9

推论1。估计量的偏差β^σ^2,最多可订购1/项,由公式给出

E类(β^负极β)=o(o)(1)
10
E类(σ^2负极σ2)=负极σ^2=1x个信托收据β^x个2τ2+o(o)(1).
11

推论1紧跟方程式(8)和(9),在检查以下余数的一致可积性之后(β^负极β)(σ^2负极σ2)在引理1的证明中。下一个引理导致在扩展ϑ^j个负极ϑj个并在中得到证明附录A.

引理2。定义每个=1,…,

α=γe(电子)负极(1负极γ)u个.

然后αj个在条件上独立于{u个+e(电子)}=1鉴于{(x个+n个)}=1,而大样本一致根(β^σ^2)似然方程(25)–(26)取决于变量{u个+e(电子)}=1通过{u个+e(电子)}=1独自一人。

根据方程式(7)–(9),我们获得了给定MLE的大样本近似条件分布(u个j个e(电子)j个)对于每个固定j个=1,…,.

定理1。对于固定j个∈ {1,…,},定义

Z轴j个(Z轴j个(1)Z轴j个(2))    =:j个1σ2+(β^1/2x个(u个+e(电子))12σ^21/2{(u个+e(电子))2σ2+负极1}).
12

然后,对于每个j个,渐近表示大型随机变量Z轴j个(1)~N个(0d日)Z轴j个(2)~N个(01)相互独立(u个j个e(电子)j个)有条件地给予{x个n个:=1,…,}. 此外,对于固定j个,调用符号τj个=σ2+j个

(β^负极β负极β^1/2Z轴j个(1)负极β^x个j个(u个j个+e(电子)j个)/τj个σ^2负极σ2负极σ^21/2Z轴j个(2)负极σ^2{(u个j个+e(电子)j个)2负极τj个}/2τj个2)=O(运行)P(P)(1)
13

和等式的右边(13)等于连接方程式右侧的向量(8)等式的右边(9)乘以σ^2.

证明。我们用索引把术语分开j个在方程式中(7)并认识到方程右侧产生的误差(13)从更换β^σ^2省略相同和的(倒数)=j个在概率上比−1除此之外,这个断言紧接着来自引理1的证明。

通过定理1,我们展开ϑ^j个纳入涉及的条款u个j个+e(电子)j个,涉及随机效应变量的术语,其指数除j个和剩余物。我们保留了所需的所有条款,以便剩下的条款ϑ^j个为1阶/概率和预期(1-规范)。

定理2。根据本节的假设和定理1的符号变大,

ϑ^j个=ϑj个+αj个+(1负极γj个)x个j个信托收据β^1/2Z轴j个(1)+1负极γj个τj个(u个j个+e(电子)j个)σ^21/2Z轴j个(2)+1负极γj个τj个(u个j个+e(电子)j个)   ×[x个j个信托收据β^x个j个+12τj个σ^2{(u个j个+e(电子)j个)2τj个负极1}]+(1负极γj个)x个j个信托收据β^{负极=1x个τ2(u个+e(电子))σ^2   ×=1(u个+e(电子))2负极τ2τ2+=1x个2τ2β^=1x个τ(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2}   +(u个j个+e(电子)j个)j个τj个2σ^2=1{负极(u个+e(电子))x个信托收据τ2β^1/2Z轴j个(1)+x个信托收据β^2x个2τ2(Z轴j个(1))2+σ^2(Z轴j个(2))2τ}   负极(u个j个+e(电子)j个)j个τj个2σ^22=1(u个+e(电子))2负极τ2τ2=1(u个+e(电子))2负极ττ   负极j个x个j个信托收据τj个2β^1/2Z轴j个(1)σ^21/2Z轴j个(2)负极j个(u个j个+e(电子)j个)τj个σ^2(Z轴j个(2))2+o(o)P(P)(1)
14

并且在𝒪P(P)(1/)等式项(14)所有总和可以更改为仅运行:j个.

利用定理2,我们展开MSE公司j个E类(ϑ^j个负极ϑj个)2MSE公司j个*E类(ϑ^j个*负极ϑj个*)2符合订单1的条款/,以期为MSE公司j个*对于非线性变换的小面积参数,这种扩展是新的ϑ^j个*=小时(ϑj个)但到目前为止,在未经转化的案件中众所周知(Rao,2003).

3.1. 使用未转换的数据进行简化

我们首先解释已知理论表达式中出现的极端简化MSE公司j个=E类(ϑ^j个负极ϑj个)2通过与在非线性变换情况下导出的表达式进行比较。有条件的独立性αj个ϑ^j个负极ϑj个负极αj个鉴于{(x个n个)}=1,这是在引理2中获得的,允许MSE中的大多数交叉项消失。

引理3。在模型(1)和假设(a)-(c)下,

MSE公司=E类(ϑ^j个负极ϑj个)2       =1j个+2j个+j个+O(运行)(负极/2)
15

哪里

1j个=E类(αj个2)=j个γj个2j个=(1负极γj个)2x个j个信托收据β^x个j个j个=(1负极γj个)2τj个σ^2.

证明。修复和条件{(n个x个)}=1:通过引理2和方程(14),平均0变量αj个独立于

ϑ^j个负极ϑj个负极αj个=(1负极γj个)x个j个信托收据β^1/2Z轴j个(1)+1负极γj个τj个(u个j个+e(电子)j个)σ^21/2Z轴j个(2)+o(o)P(P)(负极1/2)

其中最后余项也很容易被看到𝒪P(P)(1/). 紧接着MSE公司j个=E类(αj个2)+E类(ϑ^j个负极ϑj个负极αj个)2和条款

(1负极γj个)x个j个信托收据β^1/2Z轴j个(1)

(1负极γj个)u个j个+e(电子)j个τj个σ^21/2Z轴j个(2)

有各自的秒数2j个j个和预期产品o(o)(1/)=𝒪(−3/2). 证据是完整的。

理论MSE中的这些简化在本文感兴趣的情况下并不存在,其中估计器(4)用于估计变换后的小面积参数ϑj个*=小时(ϑj个).

3.2. 指数变换

在非转换(线性)情况下,不能简单地从增量法平差中获得对数转换模型中MSE的公式。我们首先计算顶级MSE表达式(类似于1线性情况下)。与线性情况下的计算不同,这些计算特别使用对数正态矩公式:Z轴𝒩(0,1),k个0,

E类{(Z轴)k个经验(b条Z轴)}=d日k个 d日t吨k个经验(2t吨22)|t吨=b条.
16

首先,我们计算,用“≈”表示相等到o(o)(1) 余数,

MSE公司j个*选择E类(经验[(1负极γ^j个)σ^22+η^j个+γ^j个{u个j个+e(电子)j个负极x个j个信托收据(β^负极β)}]负极经验(ηj个+u个j个))2        =E类[经验{ηj个+(u个j个+e(电子)j个)γj个+12σ2(1负极γj个)}负极经验(ηj个+u个j个)]2+o(o)(1)        经验(2ηj个)[经验{(1负极γj个)σ2+2γj个σ2}+经验(2σ2)        负极2经验{σ22(1负极γj个)+j个2γj个2+σ22(1+γj个)2}]        =经验{2(ηj个+σ2)}[经验{负极(1负极γj个)σ2}+1负极2经验(负极j个σ2τj个)]        =经验{2(ηj个+σ2)}{1负极经验(负极γj个j个)}.
17

这个初步结果是最重要的𝒪(1) 中的术语MSE公司j个*指数尺度上的表达式,定义于公式(17):

MSE公司j个*G公司1j个经验{2(ηj个+σ2)}{1负极经验(负极γj个j个)}

可以在以下时间内估计o(o)P(P)(1) 由

G公司^1j个=经验{2(η^j个+σ^2)}{1负极经验(负极γ^j个j个)}.
18

作为前面讨论的推论,这个估计量在余数之前是无偏的𝒪P(P)(1/). 其余部分用表达式进行分析(22)如下所示。

现在可以计算指数变换情况下MSE(17)的完整表达式,正如我们所做的那样𝒪P(P)(1/)剩余物。我们记录下方程式中的简化公式供日后参考(16)对于以下几个术语MSE公司j个*.

引理4。

  • (a)
    对于k个0,j个=1,…,
    E类{(u个j个+e(电子)j个)k个(经验[γj个{j个+2(u个j个+e(电子)j个)}]负极经验{γj个(j个2+u个j个+e(电子)j个)+u个j个})}=0
  • (b)
    对于0k个2,
    μj个k个E类((u个j个+e(电子)j个)k个经验[γj个{j个+2(u个j个+e(电子)j个)}])     =经验{σ2(1+γj个)}×{1k个=02σ2k个=14σ4+τj个k个=2

现在方程中的所有项(14)符合订单要求−1被替换为ϑ^j个*在内部MSE公司j个*如中所示附录A,这导致以下简化表达式MSE公司j个*.

定理3。在与定理2中相同的假设下,

MSE公司j个*=经验{2(ηj个+σ2)}{1负极经验(负极γj个j个)}+j个2τj个2经验{2ηj个+σ2(1+γj个)}x个j个信托收据β^x个j个         +σ^2j个2τj个2经验{2ηj个+σ2(1+γj个)}{14(1+γj个)2+1τj个}+O(运行)(负极/2).
19

备注1。定理3的结果包含了许多简化,特别是那些由于引理4引起的简化,这些简化是在转换时产生的小时是指数型的。对于完全一般的平滑和单调非线性变换小时,定理3有一个不那么简单的类比。如前所述,通用公式取决于ϑ^j个*负极ϑj个*包括泰勒级数展开(βσ2)方程中的期望项(6),以及膨胀方程(14)第页,共页ϑ^j个在定理2中。这些公式,包括详细的证明和相关的二阶修正估计,是在Slud和Maiti中计算出来的(2005).

备注2。我们的结果在很大程度上依赖于面积随机效应的假定正态分布u个在Fay–Herriot模型中(1)。在未经翻译的案件中,拉希里和拉奥都知道(1995)二阶修正MSE估计基于动量法经验最佳线性无偏预测SAE对非正态u个,但基于MLE经验最佳线性无偏预测因子的SAE不存在类似结果,如Datta和Lahiri(2001).

4.均方误差估计

4.1. 线性(未转换)案例

我们从未转换的情况开始,考虑用MLE代替表达式中参数的估值器(15). 天真的经验最佳线性无偏预测估计量为^1j个+^2j个+^j个,其中(根据τ^选择σ^2+)

^1j个=j个σ^2τ^j个^2j个=j个2τ^j个2x个j个信托收据(=1x个2τ^)负极1x个j个^j个=2j个2τ^j个/=11τ^2
20

很容易看出,两者都是^2j个=2j个+o(o)P(P)(负极1)^j个=j个+o(o)P(P)(负极1)然而,^1j个=1j个偏差为𝒪P(P)(−1),因为根据引理1(公式(9))

E类(^1j个负极1j个)=E类{j个2τj个τ^j个(σ^2负极σ2)}        =j个2τj个2E类{σ^2负极σ2负极(σ^2负极σ2)2τj个}+o(o)(负极1)

根据推论1等于

负极σ^2j个2τj个2(=1x个信托收据β^x个2τ2+1τj个)+o(o)(1)=负极σ^2j个2τj个2=1x个信托收据β^x个2τ2负极j个+o(o)(1).

这种发展的结果是在未转换情况下的二阶修正估计量,它与Datta和Lahiri的结果一致(2001)单方差分量Fay–Herriot MLE情况下的估计量。

定理4。在未转换的Fay–Herriot模型(1)中,假设(a)–(c)

^β^=(=1x个2τ^)负极1^σ^2=(=112τ^2)负极1.

然后是MSE公司=E类(ϑ^j个负极ϑj个)2在余数中是无偏的𝒪(−3/2)由提供

毫秒j个=^1j个+^2j个+2^j个+j个2τ^j个2^σ^2=1x个信托收据^β^x个2τ^2
21

其中估计值^k个j个如上文表达式(20)所定义。

这个定理没有什么可证明的了。同样,新引入的校正项是𝒪P(P)(1/)他们清楚地估计和补偿了E类(^1j个负极1j个)以上计算得出的剩余量o(o)P(P)(−1)=O(运行)P(P)(−3/2).

4.2. 指数变换情况

现在我们开始考虑MSE公司j个*在指数变换的情况下。通过将估计量代入定理3的展开式中,直接得到了天真的插件估计量,得到了一个展开式,其中除了第一个估计量外,其他所有估计量都有误差地估计了定理3表达式中的相应项𝒪P(P)(−3/2). 为了估计最高阶项,我们再次获得一个表达式并校正偏差:

G公司2j个E类[经验{2(η^j个+σ^2)}{1负极经验(负极γ^j个j个)}负极经验{2(ηj个+σ2)}{1负极经验(负极γj个j个)}]      =经验{2(ηj个+σ2)}E类([1负极经验{负极j个(1负极j个τj个)}][2x个j个信托收据(β^负极β)+2{x个j个信托收据(β^负极β)}2]      +[2+(j个2τj个2负极2)经验(负极γj个j个)](σ^2负极σ2)+12[2{2+(2j个2τj个2负极2)经验(负极γj个j个)}      负极(2+j个2τj个)j个2τj个经验(负极γj个j个)](σ^2负极σ2)2+{2+(j个2τj个2负极2)经验(负极γj个j个)}(σ^2负极σ2)x个j个信托收据(β^负极β))      =经验{2(ηj个+σ2)}[2{1负极经验(负极γj个j个)}x个j个信托收据β^2x个j个负极σ^2{2+(j个2τj个2负极2)经验(负极γj个j个)}=1x个信托收据β^2x个2τ2      +{2+(2j个2τj个2负极2)经验(负极γj个j个)负极j个2τj个经验(负极γj个j个)(1+j个22τj个)}σ^2]+o(o)(1).
22

同样,很容易通过一致的插件估计器来补偿这种偏差,直到o(o)(−1)剩余物。我们通过给出指数变换情形的二阶修正估计来记录结果。

定理5。在Fay–Herriot模型(1)和假设(a)–(c)下,其中转换的小面积参数ϑj个*=经验(ϑj个)由估计ϑj个*定义于公式(5),估计值MSE公司*=E类(ϑ^j个*负极ϑj个*)2在余数中是无偏的𝒪(−3/2)由提供

毫秒j个*=经验{2(η^j个+σ^2)}{1负极经验(负极γ^j个j个)}+j个2τ^j个2经验{2η^j个+σ^2(1+γ^j个)}x个j个信托收据^β^x个j个       +^σ^2j个2τ^j个2经验{2η^j个+σ^2(1+γ^j个)}{14(1+γ^j个)2+1τ^j个}       负极经验{2(η^j个+σ^2)}[2{1负极经验(负极γ^j个j个)}x个j个信托收据^βx个j个负极^σ^2{2+(j个2τ^j个2负极2)经验(负极γ^j个j个)}       ×=1x个信托收据^β^x个τ^2+^σ^2{2+(2j个2τ^j个2负极2)经验(负极γ^j个j个)负极j个2τ^j个经验(负极γ^j个j个)(1+j个22τ^j个)}].
23

5.仿真研究

我们进行了一项模拟研究,以检查前几节中介绍的估算方法的性能。我们的模拟设计紧密模仿了美国人口普查局正在进行的“小地区收入和贫困估算”(SAIPE)项目(Citro和Kalton,2000). 为保密起见,我们使用的协变量是从多元正态分布中模拟的伪值(仅一次),其平均值和方差与SAIPE 1993年抽样户主学龄儿童贫困对数模型中使用的所有美国县的原始协变量相同。(这是1993年收入年度实际SAIPE生产模型的一个微小变化,该模型使用了1992-1994年的当前人口调查(CPS)抽样数据。)这些协变量表示x个1,是本年度美国国税局估算的该县儿童贫困率的对数,x个2,是当年县食品券参与率的对数,x个,本年度县国税局儿童免税额除以本年度县人口估计数的对数,以及x个4,是最近十年一次人口普查中5-17岁居民贫困率的对数。我们固定了县协变值x个ki公司,1k个4,11488年,一劳永逸。样本大小n个与SAIPE项目一样,是1992年至1994年美国CPS抽样家庭的实际数量按字母顺序排列的美国县,删除了洛杉矶县(目前为止最大的):这样做是因为,在这里没有报告的模拟中,固定值为σ2小到0.014,我们发现洛杉矶县的SAE非常不稳定,扭曲了MSE的汇总度量。

我们固定了回归系数β接近SAIPE项目中1993年数据的实际拟合值(Citro和Kalton,2000)和生成的值{}=1根据模型(1)=v(v)e(电子)/n个。我们探索了参数值的各种组合(σ2v(v)e(电子))但仅显示的结果=501002005001000和四个标签组合(σ2v(v)e(电子)):

A类1 A类2 B1 B2(σ2v(v)e(电子))=(0.130)(0.117)(0.530)(0.517).
24

这些参数值具有σ2略大于Citro和Kalton中描述的SAIPE对数计数和对数速率模型中的固定值(2000)但接近于在以下方面联合最大化Fay–Herriot可能性时发现的值(βσ2v(v)e(电子)). 参见Slud(2004)比较这些不同模型的拟合和SAE。

1显示了样本大小的平均值n个和小面积参数ϑ*模拟中的面积,作为数字的函数包括个区域。它还显示了MLE的负偏差的方式σ^2随变化和方差参数组合σ2=0.1,0.5和v(v)e(电子)=30,17,由A1、A2、B1和B2索引,如表达式所示(24).

表1

基于10000次复制的模拟实验中的参数和估计数据

n个˜ϑ¯*标准偏差(ϑ*)A类v(v)(σ^2)对于以下组合:
A1类A2类地下一层地下二层
50680.2000.08470.0650.0660.3740.404
100630.2110.08630.0720.0780.4350.446
200780.1910.08080.0860.0930.4710.477
500540.1780.08330.0920.0940.4850.488
1000600.1780.08750.0960.0970.4930.494
n个˜ϑ¯*标准偏差(ϑ*)A类v(v)(σ^2)对于以下组合:
A1类A2类地下一层地下二层
50680.2000.08470.0650.0660.3740.404
100630.2110.08630.0720.0780.4350.446
200780.1910.08080.0860.0930.4710.477
500540.1780.08330.0920.0940.4850.488
1000600.1780.08750.0960.0970.4930.494
表1

基于10000次复制的模拟实验中的参数和估计数据

n个˜ϑ¯*标准偏差(ϑ*)A类v(v)(σ^2)对于以下组合:
A1类A2类地下一层地下二层
50680.2000.08470.0650.0660.3740.404
100630.2110.08630.0720.0780.4350.446
200780.1910.08080.0860.0930.4710.477
500540.1780.08330.0920.0940.4850.488
1000600.1780.08750.0960.0970.4930.494
n个˜ϑ¯*标准偏差(ϑ*)A类v(v)(σ^2)对于以下组合:
A1类A2类地下一层地下二层
50680.2000.08470.0650.0660.3740.404
100630.2110.08630.0720.0780.4350.446
200780.1910.08080.0860.0930.4710.477
500540.1780.08330.0920.0940.4850.488
1000600.1780.08750.0960.0970.4930.494

这项模拟研究与之前在小范围文献中报道的研究不同,是专门为在SAIPE环境中有意义而设计的。给出的结果集中于点估计量(4)的性能、定理3中给出的理论MSE公式的有效性以及所提出的MSE估计量(23)及其理论值和经验模拟MSE之间的比较。我们还报告了两个天真的MSE估计器的性能:第一,Prasad和Rao的天真应用(1990)公式

毫秒项目需求编号*(ϑ^*)=经验(2ϑ^)毫秒

其中mse由方程式给出(21)其次,估计量G公司^1根据方程式(18)仅包含O(运行)P(P)(1) 方程式中的项(23). 特别是R(右)=每个参数组合的10 000次模拟复制,并用索引表示第页第页复制后,我们计算了估计器性能的以下度量:

T型0=1R(右)第页=1R(右){ϑ^*(第页)负极ϑ*(第页)}
T型1=E类{毫秒项目需求编号*(ϑ^*)}负极中小企业(ϑ^*)
T型2=E类(G公司^1)负极中小企业(ϑ^*)
T型=E类(毫秒*)负极中小企业(ϑ^*)
T型4=中小企业2(ϑ^*)负极MSE公司*
T型5=E类(毫秒*)负极MSE公司*

哪里MSE公司*毫秒*在定理3和方程中给出(23),

中小企业(ϑ^*)=1R(右)第页=1R(右){ϑ^*(第页)负极ϑ*(第页)}2

E类方程式中的(·)符号T型1T型2T型T型5表示模拟复制的平均值。在这些简要措施中,T型0是唯一一个直接总结SAE偏见的人。经验MSE估计值SMSE如表所示2用于与MSE绝对误差大小进行比较。立柱T型k个解决MSE估计的偏差:T型1T型2关于天真的估计量和T型我们提出的估计量(23),具有T型4评估理论MSE公式(19)和T型5显示估计器(23)跟踪其理论对应物(19)的程度。

表2

MSE估计的模拟结果

参数T型0中小企业T型1T型2T型T型4T型5标准偏差(T型/中小企业)
50A1类4.107.861.35−4.370.950.291.24166.3
A2类1.375.930.17−2.970.080.130.20109.7
地下一层1.7638.44−1.14−7.72−1.961.62−0.3484.6
地下二层0.8128.85−1.52−4.44−0.630.730.1075.5
100A1类1.156.660.20−2.880.110.140.2673.5
A2类0.385.54−0.12−1.88−0.090.08−0.0141.1
地下一层0.5738.66−2.98−3.87−0.190.400.2059.3
地下二层0.1430.73−2.94−2.60−0.140−0.1445.5
200A1类0.514.61−0.08−1.09−0.030.060.0322.6
A2类0.154−0.10−0.67−0.020.02−0.0018.7
地下一层0.7928.98−3.20−1.110.090.030.1249.9
地下二层0.4223.78−2.69−0.080.040.010.0446.4
500A1类0.204.01−0.10−0.57−0.010.010.0118.4
A2类−0.023.64−0.13−0.37−0.020−0.0218.5
地下一层0.4027.96−4.03−0.520.0200.0246.6
地下二层0.2023.92−3.31−0.40−0.020.02−0.0145.4
1000A1类0.163.80−0.12−0.250.0100.0119
A2类0.053.50−0.12−0.1600019.3
地下一层0.1326.89−4.10−0.120.06−0.07−0.0143
地下二层0.0222.81−3.21−0.170−0.09−0.0943.2
参数T型0中小企业T型1T型2T型T型4T型5标准偏差(T型/中小企业)
50A1类4.107.861.35−4.370.950.291.24166.3
A2类1.375.930.17−2.970.080.130.20109.7
地下一层1.7638.44−1.14−7.72−1.961.62−0.3484.6
地下二层0.8128.85−1.52−4.44−0.630.730.1075.5
100A1类1.156.660.20−2.880.110.140.2673.5
A2类0.385.54−0.12−1.88−0.090.08−0.0141.1
地下一层0.5738.66−2.98−3.87−0.190.400.2059.3
地下二层0.1430.73−2.94−2.60−0.140−0.1445.5
200A1类0.514.61−0.08−1.09−0.030.060.0322.6
A2类0.154−0.10−0.67−0.020.02−0.0018.7
地下一层0.7928.98−3.20−1.110.090.030.1249.9
地下二层0.4223.78−2.69−0.080.040.010.0446.4
500A1类0.204.01−0.10−0.57−0.010.010.0118.4
A2类−0.023.64−0.13−0.37−0.020−0.0218.5
地下一层0.4027.96−4.03−0.520.0200.0246.6
地下二层0.2023.92−3.31−0.40−0.020.02−0.0145.4
1000A1类0.163.80−0.12−0.250.0100.0119
A2类0.053.50−0.12−0.1600019.3
地下一层0.1326.89−4.10−0.120.06−0.07−0.0143
地下二层0.0222.81−3.21−0.170−0.09−0.0943.2

T型k个和SMSE在各区域的平均值。参数组合(σ2v(v)e(电子))根据方案(24),在第二列中标记为A1–B2。所有条目都乘以10.

表2

MSE估计的模拟结果

参数T型0中小企业T型1T型2T型T型4T型5标准偏差(T型/中小企业)
50A1类4.107.861.35−4.370.950.291.24166.3
A2类1.375.930.17−2.970.080.130.20109.7
地下一层1.7638.44−1.14−7.72−1.961.62−0.3484.6
地下二层0.8128.85−1.52−4.44−0.630.730.1075.5
100A1类1.156.660.20−2.880.110.140.2673.5
A2类0.385.54−0.12−1.88−0.090.08−0.0141.1
地下一层0.5738.66−2.98−3.87−0.190.400.2059.3
地下二层0.1430.73−2.94−2.60−0.140−0.1445.5
200A1类0.514.61−0.08−1.09−0.030.060.0322.6
A2类0.154−0.10−0.67−0.020.02−0.0018.7
地下一层0.7928.98−3.20−1.110.090.030.1249.9
地下二层0.4223.78−2.69−0.080.040.010.0446.4
500A1类0.204.01−0.10−0.57−0.010.010.0118.4
A2类−0.023.64−0.13−0.37−0.020−0.0218.5
地下一层0.4027.96−4.03−0.520.0200.0246.6
地下二层0.2023.92−3.31−0.40−0.020.02−0.0145.4
1000A1类0.163.80−0.12−0.250.0100.0119
A2类0.053.50−0.12−0.1600019.3
地下一层0.1326.89−4.10−0.120.06−0.07−0.0143
地下二层0.0222.81−3.21−0.170−0.09−0.0943.2
参数T型0中小企业T型1T型2T型T型4T型5标准偏差(T型/中小企业)
50A1类4.107.861.35−4.370.950.291.24166.3
A2类1.375.930.17−2.970.080.130.20109.7
地下一层1.7638.44−1.14−7.72磅−1.961.62−0.3484.6
地下二层0.8128.85−1.52−4.44−0.630.730.1075.5
100A1类1.156.660.20−2.880.110.140.2673.5
A2类0.385.54−0.12−1.88−0.090.08−0.0141.1
地下一层0.5738.66−2.98−3.87−0.190.400.2059.3
地下二层0.1430.73−2.94−2.60−0.140−0.1445.5
200A1类0.514.61−0.08−1.09−0.030.060.0322.6
A2类0.154−0.10−0.67−0.020.02−0.0018.7
地下一层0.7928.98−3.20−1.110.090.030.1249.9
地下二层0.4223.78−2.69−0.080.040.010.0446.4
500A1类0.204.01−0.10−0.57−0.010.010.0118.4
A2类−0.023.64−0.13−0.37−0.020−0.0218.5
地下一层0.4027.96−4.03−0.520.0200.0246.6
地下二层0.2023.92−3.31−0.40−0.020.02−0.0145.4
1000A1类0.163.80−0.12−0.250.0100.0119
A2类0.053.50−0.12−0.1600019.3
地下一层0.1326.89−4.10−0.120.06−0.07−0.0143
地下二层0.0222.81−3.21−0.170−0.09−0.0943.2

T型k个和SMSE在各区域的平均值。参数组合(σ2v(v)e(电子))根据方案(24),在第二列中标记为A1–B2。所有条目都乘以10.

2显示这些度量值T型k个小范围内的平均值=1,…,。在表中2,我们可以从中看到T型0-SAE的面积平均偏差较小且系统性降低的列. TheT型1-列显示了天真的估计毫秒项目需求编号*一点也不准确,MSE没有随着增加。接下来,T型2测量O(运行)(1) 全面估算条款MSE公司*,自表面活性剂(ϑ^*)估计MSE公司*高达𝒪(−3/2)根据定理3。因此,我们预计T型2-第1级条款/作为变大,这在T型2-表的列2.措施T型直接比较公式(23)带有中小企业(ϑ^*)。根据我们的理论发展,这种差异的衰减速度应该超过1/,它在T型-表的列2(决赛的量级,=500和=1000,术语太小,无法通过模拟有效区分。)两者之间的差异T型2T型表明MSE估计中的二阶校正是有用的。关于的评论T型保持同样好T型4两者的区别是中小企业(ϑ^*)MSE公司*如定理3所示。这个定理说,区别是O(运行)(−3/2),这一预测得到了表格的证实T型4-结果。T型5定义为以下各项的总和T型T型4,它的行为可以从T型-以及T型4-列。表的最后一列2是比率区域的标准偏差T型/中小企业(ϑ^*)例如,在A1情况下=100,平均绝对误差T型除以平均SMSE为0.112/6.66=0.017,而标准偏差为T型/SMSE为0.073。

SAIPE和其他报告变换模型中小面积结果的调查通常通过置信区间报告小面积点估计量的可变性,置信区间是通过使用Prasad–Rao MSE估计量对置信区间进行反变换而形成的(21)。在我们的模拟设置中,这将是经验{ϑ^±z(z)α/2毫秒(ϑ^)},其中z(z)α/2−1(1−α/2) 是(1−α/2) -标准正态分布的分位数。此转换间隔的半宽度除以z(z)α/2提供了另一种朴素的MSE估计量,实际上可以用泰勒级数近似毫秒项目需求编号*(ϑ^*),在MSE较小时具有很好的精度,但在其他情况下精度较差。但是专栏T型1T型4比较表明,该方法不如方程式中开发的方法好(23).

我们还根据与拉希里和拉奥相似的模拟设计检查了我们的结果(1995). 特别是,我们做了一个小的模拟,选择(σ2)遵循拉希里和拉奥的模式(a)。与他们的常数平均模型不同,我们采用了η=β0+β1 pt(磅)日志(x个),使用x个分布均匀(0,1),β0=0和β1=1.我们的mse的偏差*(类似于T型)分别为0.086和0.075=20和=30.

6.实际数据示例

我们用2000年的数据说明了如何将本文的MSE估计值用于上一节的县级SAIPE设置。该示例的主题是,SAE的MSE(平方根)可以方便地量化模型估计值与外部来源参数值之间的差异程度。在其他示例中,可以通过MSE对估计的SAE和竞争模型的估计进行类似的比较。

在SAIPE 2000县级数据中,响应和预测变量与1994年前一节中描述的相同,但响应变量是1999年至2001年三年CPS数据得出的对数转换加权儿童贫困率,以及第四个预测变量x个4是1990年人口普查中1990年儿童贫困率的对数(经过调整以反映CPS抽样范围和定义)。数据仅用于1990年和2000年894个县,其中观察到的5-17岁贫困相关儿童(3年)CPS计数为非零。我们对这些数据拟合了Fay–Herriot模型(1),确定了该值σ2=0.016,如同已知和估计系数β^υ^e(电子)以最大可能性。价值观σ2按照实际SAIPE实践(雪铁龙和卡尔顿,2000)在与人口普查数据相吻合的类似对数贫困率模型中发现的剩余方差;1989-2000年间的数值在0.013到0.017之间。σ2固定和v(v)e(电子)估计,SAE公式与方程中给出的公式完全相同(5),但是MSEMSE公司*和估算员毫秒*修改了Slud和Maiti中给出的公式(2005). 根据这些估计,我们构建了县域对数贫困率的SAE(3)ϑ和SAEϑ^*通过将这些SAE与根据CPS范围和定义调整的相应2000年人口普查儿童贫困率进行比较,可以部分评估这些SAE是否符合CPS目标估计值。(有关1990年的类似比较,见Kalton和Citro(2000),附录C;迈蒂(2004)只考虑了1990年SAIPE数据的子集;Slud(泥浆)(2003)研究了1990年和2000年人口普查率与严重不良事件之间的高度相关性。)

2000年的SAE与人口普查率有多大不同?我们可以看到差异ϑ^*负极ϑ许可证负极(ϑ^*负极ϑ*)+(ϑ*负极ϑ许可证)作为方差约为的第一项之和MSE公司*加上一个系统术语ϑ*负极ϑcens公司我们无法单独观察。然而,自从第一学期除以MSE公司*1/2理论上应近似于标准正常偏差z(z),的大小

w个(ϑ^*负极ϑ许可证)/毫秒*1/2

给出了人口普查与CPS目标率之间差异的有用度量。我们在表中总结了结果.

表3

的描述性统计ϑ^*ϑ许可证毫秒*1/2w个=(ϑ^*负极ϑ许可证)/毫秒*1/2根据SAIPE 2000数据计算,=1, …, 894

统计的最小值问题1中值的平均值第3季度最大值标准偏差
w个−7.946−0.833−0.142−0.1220.5864.0841.152
ϑ^*0.0210.1040.1430.1540.1910.5070.073
ϑ许可证0.0180.1000.1420.1580.2000.5890.084
毫秒*1/20.0040.0140.0180.0200.0250.0740.010
统计的最小值问题1中值的平均值第3季度最大值标准偏差
w个−7.946−0.833−0.142−0.1220.5864.0841.152
ϑ^*0.0210.1040.1430.1540.1910.5070.073
ϑ许可证0.0180.1000.1420.1580.2000.5890.084
毫秒*1/20.0040.0140.0180.0200.0250.0740.010

Q1和Q3表示四分位数,SD表示标准偏差。

表3

的描述性统计ϑ^*ϑ许可证毫秒*1/2w个=(ϑ^*负极ϑ许可证)/毫秒*1/2根据SAIPE 2000数据计算,=1, …, 894

统计的最小值问题1中值的平均值第3季度最大值标准偏差
w个−7.946−0.833−0.142−0.1220.5864.0841.152
ϑ^*0.0210.1040.1430.1540.1910.5070.073
ϑcens公司0.0180.1000.1420.1580.2000.5890.084
毫秒*1/20.0040.0140.0180.0200.0250.0740.010
统计的最小值问题1中值的平均值第3季度最大值标准偏差
w个−7.946−0.833−0.142−0.1220.5864.0841.152
ϑ^*0.0210.1040.1430.1540.1910.5070.073
ϑ许可证0.0180.1000.1420.1580.2000.5890.084
毫秒*1/20.0040.0140.0180.0200.0250.0740.010

Q1和Q3表示四分位数,SD表示标准差。

为了与二阶修正估计量进行比较毫秒*属于MSE公司*在这个例子中,我们计算了最高订单条款G公司^1如方程式所示(18). 正如我们在模拟中发现的那样(列的比较T型2T型在表中2),顶级项系统地小于二阶修正估计量毫秒*事实上,相对差异的十分之一(在894个县中)(毫秒*负极G公司^1)/毫秒*根据2000年SAIPE数据

10%20%30%40%50%60%70%80%90%0.0410.0540.0630.0740.0840.0960.1210.1550.220.

因此,修正后的估计值通常比最高阶、未修正、估计值和基于修正后的置信区间高6%至16%未修正的估计值通常会宽3-8%。此比较与表中的比较类似2,尽管设置不同,因为差异σ2在SAIPE项目中比在模拟中小得多,因为SAIPE分析处理σ2而不是v(v)e(电子)如已知的那样。

对于大多数县来说,如果人口普查率为ϑ许可证和真正的小面积CPS目标速率ϑ*完全一样。因此,学生化直方图的中心部分(未显示)偏离w个大致对称且呈钟形,仅略低于标准正常密度。然而,经验的尾部w个-分布明显大于正常值:894个县中的60个(“预期”人数为40.5)|w个|>在一些县w个震级在4到8之间,表明人口普查率与(Fay–Herriot-model-fitted)CPS目标率之间存在实际差异。大数值w个通常发生在以下县ϑ*1990年至2000年人口普查期间发生了重大变化。

图。1以2000年SAIPE对数模型SAE为对照,以1990年和2000年的人口普查率为研究对象,以SAE为中心,按平方根误差估计值进行缩放毫秒*1/2在1990年至2000年的人口普查中,仅针对儿童贫困率变化0.05或以上的165个县绘制了分数。图。1显示了学生价值观和人口普查变化之间的关联,并按县量化了根平方单位的变化。(换句话说,这张图使我们能够直观地比较人口普查之间的变化幅度和基于模型的SAE标准误差。)由于SAE是基于使用2000年SAIPE数据的模型,因此正如预期的那样,它们通常更接近2000年,而不是1990年的人口普查值。总之,估计毫秒*在本例中,当SAE2000年人口普查的差异比Fay–Herriot模型下偶然出现的差异要大。

图1

1990年县域儿童贫困率散点图()和2000()人口普查,从SAE(5)的差异除以MSE的意义上进行研究1/2,对于两次人口普查率相差0.05或以上的165个县:····,-协调2000年人口普查率

7.结论

本文基于Fay和Herriot提出了一种小面积点估计的最小均方误差的“二阶修正”估计理论(1979)模型应用于非线性转换的测量数据。我们的重点是对数转换病例,但其他病例在斯拉德和迈蒂进行治疗(2005). 正如我们的数据示例所示,MSE有助于简要总结SAE与外部标准的差异。

断面模拟研究5涵盖了与美国人口普查局SAIPE计划类似的一系列数据大小和参数设置,以日志转换的调查数据为例。研究首先显示(列T型0第页,共页2)小面积估计器的自然偏差校正在消除偏差方面取得了出色的成功,并且通常支持理论MSE公式的准确性MSE公司j个*在定理3和估计量(23)中𝒪(1/). 在模拟和数据示例中,有无二阶校正的MSE估计值的精度差异表明,这种校正在SAIPE项目等环境中可能很重要。

致谢

本文描述了作者的研究和分析,发布目的是通知相关方并鼓励讨论。结果和结论是作者的,尚未得到美国人口普查局的认可。大部分研究都是在人口普查局进行的。第二位作者的研究得到了美国统计协会人口普查奖学金的支持,也得到了国家科学基金会SES-0318184的资助。我们感谢Bill Bell就SAIPE项目中的方法问题进行了有益的对话,并感谢裁判提出了改进演示的建议。

参考文献

奇特罗
C。
卡尔顿
G.公司。
(编辑)(
2000
)
贫困学龄儿童的小面积估算:现行方法的评估
.
华盛顿特区
:
国家学院出版社
.

达塔
G.公司。
拉希里
第页。
(
2001
)
小面积估计问题中估计的最佳线性无偏预报器不确定性的统一度量
.
统计人员。罪。
10
613
627
.

费伊
R。
赫里奥特
R。
(
1979
)
小地方收入估算:James-Stein程序在人口普查数据中的应用
.
《美国统计杂志》。助理。
74
341
353
.

高希
M。
J.N.K。
(
1994
)
小面积估算:评估
.
统计人员。科学。
9
55
93
.

J。
拉希里
第页。
S.-M.公司。
(
2002
)使用M估计进行经验最佳预测的统一折刀理论。
安。统计师。
30
1782
1810
.

拉希里
第页。
J.N.K。
(
1995
)
小面积估计量均方误差的稳健估计
.
《美国统计杂志》。助理。
90
758
766
.

梅蒂
T。
(
2004
)
均方预测误差估计的折刀法在SAIPE中的应用
.
统计人员。传神
6
685
695
.

普拉萨德
N。
J.N.K。
(
1990
)
小面积估计量的均方误差估计
.
《美国统计杂志》。助理。
85
163
171
.

J.N.K。
(
2003
)
小面积估算
.
纽约
:
威利
.

Slud(泥浆)
E.公司。
(
2003
)评估SAIPE模型对人口普查和CPS县儿童贫困率的适用性。
程序。联邦统计方法研究委员会。
阿灵顿
,11月。

Slud(泥浆)
E.公司。
(
2004
)
使用GLM与FH模型在SAIPE中的小面积估计误差
.
程序。Surv公司。研究方法。第节。美国统计局。助理。

Slud(泥浆)
E.公司。
梅蒂
T。
(
2005
)变换Fay-Herriot模型中的MSE估计及其在SAIPE中的应用。
报告
.
美国人口普查局
华盛顿特区
.

附录A:杂项结果证明

在本附录中,我们收集了上文中所述各种结果的证据。自始至终,我们应用模型(1),无需注释即可表示

负极x个信托收据β=负极η=u个+e(电子)负极x个信托收据β^=u个+e(电子)负极x个信托收据(β^负极β).

A.1、。引理1的证明

我们的方法是围绕(βσ2)精确似然方程

β^负极β=(=1x个2σ^2+)负极1=1x个(u个+e(电子))σ^2+
25
0==1(负极x个信托收据β^)2负极σ^2负极(σ^2+)2.
26

方程的第一个方程(表达式(7)紧接着从25)和(a)–(c)部分,然后通过方程的泰勒级数展开(25)直到二阶项,我们发现

β^负极1(β^负极β)==1x个τ(u个+e(电子))(1负极σ^2负极σ2τ)+=1x个2τ2β^=1x个τ(u个+e(电子))(σ^2负极σ2)+o(o)P(P)(1).

方程式(8)从这个方程中直接代入方程的表达式(7)对于σ^2负极σ2.

其次,通过方程的泰勒级数展开(26)大约σ2作为的函数σ^2,直到二阶,我们发现

0==1(负极x个信托收据β^)2负极ττ2+=1τ负极2(负极x个信托收据β^)2τ(σ^2负极σ2)+12=16(负极x个信托收据β^)2负极2ττ4(σ^2负极σ2)2+o(o)P(P)(1).

第二个表达式(7)紧跟着这个方程,以及(a)-(c)部分中隐含的大数定律,除以系数σ^2负极σ2并通过替换来检查顶级条款β对于β^特别是,对于k个=2,3,如变大

=1k个(负极x个信托收据β^)2负极ττk个+1==1k个负极1τk个+o(o)P(P)().

接下来,再除以σ^2负极σ2现在认识到β^负极βσ^2负极σ2𝒪P(P)(−1/2)按表达式(7),我们发现σ^2负极σ2相等,带余数o(o)P(P)(−1),至

(=12τ[(u个+e(电子))2负极τ2负极2(u个+e(电子))x个信托收据(β^负极β)+{x个信托收据(β^负极β)}2])负极1                     ×=1[(u个+e(电子))2负极2(u个+e(电子))x个信托收据(β^负极β)+{x个信托收据(β^负极β)}2负极ττ2+2(σ^2负极σ2)2τ].

因为最后一个方程式中的第一个倒置项等于

12σ^2{1+σ^2=1(u个+e(电子))2负极ττ}负极1+O(运行)P(P)(12)

收集订单1之前的条款/在最后一个方程式中给出方程式(9).

A.2。引理2的证明

随机向量(αj个u个j个+e(电子)j个)是二元正态的,因为它是独立正态分布变量的线性变换u个j个e(电子)j个因此,要检查条件独立性,只需检查给定的条件协方差x个是0:

冠状病毒(αj个u个j个+e(电子)j个)=γj个无功功率,无功功率(e(电子)j个)负极(1负极γj个)无功功率,无功功率(u个j个)         =σ2j个负极j个σ2τj个=0

自(αj个u个j个+e(电子)j个)通过假设独立于{(u个e(电子)):j个},我们得出结论αj个实际上是有条件独立于{u个+e(电子)}=1剩下的断言是(β^σ^2)取决于{(u个e(电子))}=1仅通过{u个+e(电子)}=1-然后检查似然方程(25)–(26)还有一个标准事实是在一个小的(但固定的)球周围的似然方程的唯一根(βσ2).

答3。定理2的证明

在方程式中替换后(),我们有

ϑ^j个=ηj个+(u个j个+e(电子)j个)γ^j个+x个j个信托收据(β^负极β)(1负极γ^j个).

现在替换功能1负极γ^j个属于σ^2通过泰勒级数近似到二阶,只留下o(o)P(P)(1/)剩余物,获取

ϑ^j个=ηj个+(u个j个+e(电子)j个)γj个+x个j个信托收据(β^负极β)(1负极γj个)+{u个j个+e(电子)j个负极x个j个信托收据(β^负极β)}j个τj个2(σ^2负极σ2)        负极(u个j个+e(电子)j个)j个τj个(σ^2负极σ2)2+o(o)P(P)(1).
27

最后,替换β^负极βσ^2负极σ2来自方程式(8)–(9)导致

ϑ^j个=ηj个+(u个j个+e(电子)j个)γj个+(1负极γj个)x个j个信托收据{β^=1x个τ(u个+e(电子))负极β^=1x个τ2(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2   +β^=1x个2τ2β^=1x个τ(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2}+(u个j个+e(电子)j个)j个τj个2(σ^21/2Z轴j个(2)+σ^2(u个j个+e(电子)j个)2负极τj个2τj个2   +σ^2=1[负极(u个+e(电子))x个信托收据τ2(β^负极β)+{x个信托收据(β^负极β)}22τ2+(σ^2负极σ2)2τ]   负极σ^22=1(u个+e(电子))2负极τ2τ2=1(u个+e(电子))2负极ττ)负极j个x个j个信托收据τj个2β^1/2Z轴j个(1)σ^21/2Z轴j个(2)负极(u个j个+e(电子)j个)j个τj个σ^2(Z轴j个(2))2+o(o)P(P)(1).

此公式中的所有保留项都是有序的−1或更大。现在将条款安排在ϑ^负极ϑ以最高阶优先获得方程(14). 将总额更改为只超过j个会改变方程(14)按数量计算𝒪(−3/2).

A.4、。引理4的证明

  • (a)
    这个结果本质上是引理2的一个推论。首先要注意αj个=γj个e(电子)j个−(1−γj个)u个j个平均值为0且方差为正态分布E类(αj个2)=γj个2j个+(1负极γj个)2σ2=(σ2j个/τj个2)τj个=j个γj个,所以E类{exp(−j个γj个/2+αj个)}=1. 然后我们计算
    E类{(u个j个+e(电子)j个)k个(经验[γj个{j个+2(u个j个+e(电子)j个)}]负极经验{γj个(j个/2+u个j个+e(电子)j个)+u个j个})}                     =E类[(u个j个+e(电子)j个)k个经验[γj个{j个+2(u个j个+e(电子)j个)}]{1负极经验(负极j个γj个/2负极αj个)}]=0

    最后的平等来自于αj个u个j个+e(电子)j个.

  • (b)
    这个结果只是重复了方程式(16)对于k个=0,1,2,通过插入2=τj个b条=2γj个,到公式中E类{经验(abZ公司)}=经验{(ab公司)2/2} 和
    E类{(Z轴)k个经验(b条Z轴)}=经验{(b条)2/2}×{2b条k个=14b条2+2k个=2
    28

答5。定理3的证明

通过方程式(17)和()以及αj个

ϑj个+αj个=ηj个+γj个(u个j个+e(电子)j个)

MSE公司j个*=E类(经验(2ηj个)[经验{(ϑ^j个负极ϑj个负极αj个)+γj个(u个j个+e(电子)j个+j个/2)+(γ^j个负极γj个)j个/2}负极经验(u个j个)]2).

现在替换等式(14)对于ϑ^j个负极ϑj个负极αj个,注意到术语(γ^j个负极γj个)j个/2方括号内的指数具有变化的效果u个j个+e(电子)j个u个j个+e(电子)j个+j个/第(27)行内和相应条款内公式(14),屈服MSE公司j个*最多剩余部分𝒪(−3/2)作为

经验(2ηj个)E类(e(电子)x个{γj个(u个j个+e(电子)j个+j个2)}[1+(1负极γj个)x个j个信托收据β^1/2Z轴j个(1)+1负极γj个τj个(u个j个+e(电子)j个)x个j个信托收据β^x个j个+1负极γj个τj个(u个j个+e(电子)j个+j个2)×[σ^21/2Z轴j个(2)+12τj个σ^2{(u个j个+e(电子)j个)2τj个负极1}]+(1负极γj个)x个j个信托收据β^{负极=1x个τ2(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2+=1x个2τ2β^=1x个τ(u个+e(电子))σ^2=1(u个+e(电子))2负极τ2τ2}+(u个j个+e(电子)j个+j个/2)j个τj个2σ^2=1{负极(u个+e(电子))x个信托收据τ2β^1/2Z轴j个(1)+x个信托收据β^x个2τ2(Z轴j个(1))2+σ^2(Z轴j个(2))2τ}负极(u个j个+e(电子)j个+j个/2)j个τj个2σ^22=1(u个+e(电子))2负极τ2τ2=1(u个+e(电子))2负极ττ负极j个x个j个信托收据τj个2β^1/2Z轴j个(1)σ^21/2Z轴j个(2)负极j个(u个j个+e(电子)j个+j个/2)τj个σ^2(Z轴j个(2))2+12{(1负极γj个)x个j个信托收据β^1/2Z轴j个(1)+1负极γj个τj个(u个j个+e(电子)j个+j个2)σ^21/2Z轴j个(2)}2]负极经验(u个j个))2.

现在,我们通过首先将𝒪(1) 项,然后是顺序的交叉项𝒪(1/√)(立即显示期望值为0),然后𝒪P(P)(−1/2)项,然后是其他预期顺序项𝒪(1/). 结果,使用方程式(16)带有k个=0,是

经验(负极2ηj个)MSE公司j个*+O(运行)(负极/2)=经验(2σ2){1负极经验(负极γj个j个)}+(1负极γj个)2×E类{{x个j个信托收据β^x个j个+(u个j个+e(电子)j个+j个/2)2τj个2σ^2}(2经验[γj个{j个+2(u个j个+e(电子)j个)}]负极经验{γj个(j个2+u个j个+e(电子)j个)+u个j个})}+j个σ^2τj个E类{{(u个j个+e(电子)j个)2τj个负极1}(u个j个+e(电子)j个+j个2)(经验[γj个{j个+2(u个j个+e(电子)j个)}]负极经验{γj个(j个2+u个j个+e(电子)j个)+u个j个})}+21负极γj个τj个E类{[(u个j个+e(电子)j个)x个j个信托收据β^x个j个+(u个j个+e(电子)j个+j个2)σ^2{负极1τj个+=1(x个信托收据β^x个2τ2+σ^2τ)}]×(经验[γj个{j个+2(u个j个+e(电子)j个)}]负极经验{γj个(j个2+u个j个+e(电子)j个)+u个j个})}.

通过直接应用引理4,所有其他交叉项都有0的期望,或者有顺序的期望𝒪(−3/2).

基于直接应用引理4的进一步简化

经验(负极2ηj个)MSE公司j个*=经验(2σ2){1负极经验(负极γj个j个)}+O(运行)(1/2)+经验{σ2(1+γj个)}(1负极γj个)2                   ×{x个j个信托收据β^x个j个+σ^2τj个2(4σ4+τj个+2j个σ2+j个24)}.

最后,我们在代数上进行了简化:𝒪(−3/2)条款,

经验(负极2ηj个)MSE公司j个*=经验(2σ2){1负极经验(负极γj个j个)}+j个2τj个2经验{σ2(1+γj个)}x个j个信托收据β^x个j个+σ^2j个2τj个2经验{σ2(1+γj个)}      ×{1τj个+14τj个2(4σ2+j个)2}      =经验{2(ηj个+σ2)}{1负极经验(负极γj个j个)}+j个2τj个2经验{2ηj个+σ2(1+γj个)}x个j个信托收据β^2x个j个      +σ^2j个2τj个2经验{2ηj个+σ2(1+γj个)}{14(1+γj个)2+1τj个}.
本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)