总结

区域级模型,如Fay–Herriot模型,旨在通过借鉴相关协变量和所有区域的直接估计值的优势,改进小区域的直接调查估计值。在多变量形式中,相关的人口特征是联合建模的,区域级模型允许对两个或多个特征的函数进行推断,并可以利用响应变量之间的相关性来改进小区域预测。当观察到模型协变量存在随机误差时,例如从另一次调查中得出的协变量,在建模中说明此误差非常重要。我们对具有函数测量误差的多元Fay–Herriot模型进行了贝叶斯分析,允许对相关特征进行联合建模,并考虑一些协变量中的随机观测误差。我们将其应用于美国各县2010年和2011年学龄儿童贫困率的建模,以预测2011年的贫困率和2010-2011年的变化。在这种应用中,与直接估计相比,测量误差模型在预测方面有了很大的改进,而忽略测量误差会导致误导性的不确定性估计。我们提出了一种通过独立链马尔可夫链蒙特卡罗算法实现该模型的计算方法,并证明了后验分布在一类无信息先验下的适当性。

1简介

用于小面积估算的区域级模型,特别是Fay和Herriot模型(1979),通过从所有地区的调查估计值和从其他地区级数据获得的回归协变量中借用信息,寻求改进小地区人口特征的直接调查估计值。Fay–Herriot模型在这里以两种方式进行了扩展。第一种是多元扩展,其中对两个或多个不同但相关的人口特征的调查估计进行了联合建模。第二个扩展是功能测量误差模型,该模型处理一个或多个误差观测到的回归协变量,当另一项调查的相关特征估计值用作回归协变量时。在这里,我们将这两个扩展结合在Fay–Herriot模型的多元版本中,并使用遵循函数测量误差结构的协变量。

Fay–Herriot模型的多元扩展是由Fay提出的(1987)Datta进一步研究. (1991,1996)和Ghosh. (1996)。在单位层面,Fuller和Harter(1987)开发了Battese的一元嵌套误差回归模型的多元扩展. (1988)。他们的模型可以被视为基于随机效应模型的单向多元方差分析的方差分析方法。有关此模型对小面积估算的其他贡献,请参见Datta. (1999)对于频率专家方法和Datta. (1998)用于贝叶斯方法。

对于小面积估算,考虑多元模型而不是单变量模型有两个主要原因。一是捕捉模型方程中随机效应之间的依赖关系可以产生改进的小面积预测。第二个问题是,如果人们希望推断不同人口特征的函数,例如对逐年变化的估计和相关的不确定性度量,那么需要不同特征的联合(多元)模型。

许多研究人员研究了用于处理小面积估算模型协变量中误差的单变量测量误差模型。这可能是为了尝试改进小面积预测,或更准确地解释与小面积预测相关的不确定性。伊巴拉和洛尔(2008)结果表明,当小面积协变量值的测量具有足够的误差时,基于模型的小面积估计器实际上会比直接估计器产生更差的预测(更高的均方误差)。Ghosh对这篇涉及贝叶斯和频率学家治疗的文献做出了进一步贡献. (2006)、戈什和辛哈(2007),托拉比. (2009),达塔. (2010)和Arima. (2012,2015).

事实上,在刚刚引用的参考文献中考虑了两种类型的测量误差模型。这个功能测量误差模型我们在这里检查的假设协变的潜在真值是固定的,但未知的量。这个结构测量误差模型假设这些真实值遵循一个模型,即协变量和原始因变量的多元模型。请参阅Fuller(1987)供进一步讨论。我们打算在未来的研究中检验结构测量误差模型在小面积估算中的应用。

本文对Arima方法进行了多元推广. (2015),当一些协变量的测量存在误差时,他对单变量Fay–Herriot模型进行了Bayesian处理。他们使用Fuller中描述的协变量的功能测量误差模型(1987)。我们将我们的方法应用于美国县学龄儿童(5-17岁)贫困率的数据。州、县和学区各级学龄儿童的贫困估算是美国人口普查局“小地区收入和贫困估算”(SAIPE)计划的关键产品。我们对两年的直接调查贫困估计值使用了一个双变量模型,其中一个模型的回归协变量是从前5年的合并样本数据中获得的直接调查估计值。该协变量中的采样误差由测量误差结构解释。该模型对这两年的贫困率、年变化以及相应的后验方差进行了估计。我们将这些结果与朴素模型这忽略了协变量测量误差,以表明忽略协变量测量错误如何对预测和预测误差方差(后验方差)产生不利影响。我们还将双变量模型的结果与连续几年拟合两个单变量测量误差模型得到的结果进行了比较,采用所得估计值的差异,并通过错误地假设两年之间的独立性来计算差异的后验方差。

本文的其余部分进行如下。章节2提出了我们的多元测量误差模型,并提出了一种基于马尔可夫链蒙特卡罗(MCMC)仿真的贝叶斯仿真计算方法。章节然后将该模型应用于美国县级学龄儿童贫困率的实证研究。附录A提供了关于一般先验下后验分布适当性的结果,也提供了便于模型的双变量版本的替代先验的结果。这些结果的详细证明见在线补充材料.

用于分析数据的程序可以从

https://academy.oup.com/jrsssb/issue网站/

2协变量中函数测量误差的多元Fay–Herriot模型

假设Y(Y)=(Y(Y)1,,Y(Y))T型是一个直接测量估值器的×1向量θ=(θ1,,θ)T型,的的第个小面积平均向量相关人口特征,针对地区= 1, …,.让e(电子)成为×1采样误差矢量Y(Y)以便

Y(Y)=θ+e(电子).
(1)

我们假设e(电子)= (e(电子)1, …,e(电子))T型独立分布在作为N个(0,),使用×正定抽样协方差矩阵视为已知。实际上必须使用调查微观数据进行估计。

模型的一般形式θ

θj个=x个j个T型βj个+z(z)j个T型δj个+v(v)j个,j个=1,,,=1,,,
(2)

其中x个ij公司z(z)ij公司第页×1和q个预测变量的×1向量,以及βj个δj个是相应的回归系数。在矩阵向量表示法中,这是

θ=x个·β+z(z)·δ+v(v)=x个1T型·00·x个T型β+z(z)1T型·00·z(z)T型δ+v(v),
(3)

哪里β=(β1T型,,βT型)T型δ=(δ1T型,,δT型)T型、和v(v)= (v(v)1, …,v(v))T型独立且一致分布N个(0,Σv(v))。这个z(z)ij公司在模型(2)中,假设是固定的和已知的(可观测协变量)。我们假设,尽管我们没有观察到x个ij公司,我们有观察结果X(X)ij公司x个ij公司包含错误,我们将其写为

X(X)j个=x个j个+ηj个,j个=1,,,=1,,,
(4)

其中“测量误差”ηij公司独立分布在作为N个(0,C类,日本),和带有cov(ηij公司,η伊克) =C类,jk公司。我们假设C类,jk公司已知。这个X(X)ij公司可以是独立于产生Y(Y)ij公司在这种情况下,C类,jk公司将使用该调查的微观数据进行估算。{e(电子)ij公司}, {v(v)ij公司}和{ηij公司}假设彼此独立。

假设x个ij公司正常且独立于ηij公司、和var(x个j个)=σx个2具有σx个2(导致x个ij公司第节中给出2.1),由方程式得出(4)那个E类(x个ij公司|X(X)ij公司) X(X)ij公司和cov(x个ij公司,x个伊克|X(X)ij公司,X(X)伊克) C类,jk公司由此我们得出,在极限为σx个2,

E类(θj个|X(X)j个)=X(X)j个T型βj个+z(z)j个T型δj个,覆盖(cov)(θj个,θk个|{X(X)j个})=βj个T型C类,j个k个βk个+σv(v),j个k个,
(5)
E类(Y(Y)j个|X(X)j个)=X(X)j个T型βj个+z(z)j个T型δj个,覆盖(cov)(Y(Y)j个,Y(Y)k个|{X(X)j个})=βj个T型C类,j个k个βk个+σv(v),j个k个+d日,j个k个,
(6)

其中∑v(v)= [σv(v),jk公司]以及= [d日,jk公司].

该模型的某些特殊情况很有趣。特别是,如果X(X)ij公司=X(X)(和x个ij公司=x个)的j个= 1, …,,即X(X)ij公司(和x个ij公司)在每个方程式,然后是术语x个β在方程式中(3)可以改为Bx公司,其中B类×第页矩阵,其行是β1T型,,βT型类似地,如果z(z)ij公司=z(z)对所有人来说都是一样的j个,然后z(z)δ= Δz(z)在方程式中(3)其中Δ是×q个带行的矩阵δ1T型,,δT型如果这两个条件都成立,则方程给出的模型(1)(3)可以写为

Y(Y)=θ+e(电子),θ=B类x个+Δz(z)+v(v),=1,,,
(7)

和关系(5)(6)可以写为

E类(θ|X(X))=B类X(X)+Δz(z),无功功率,无功功率(θ|X(X))=v(v)+B类C类B类T型,
(8)
E类(Y(Y)|X(X))=B类X(X)+Δz(z),无功功率,无功功率(Y(Y)|X(X))=v(v)+B类C类B类T型+.
(9)

当这些条件成立时,这些替代表达式在模型的推导和编程计算中非常有用。

因服用σx个2类似于假设{x个ij公司}是固定的未知量,如第节所述1,是功能测量误差模型与结构测量误差模型的区别。在后者中x个ij公司遵循某种模式,例如Fay–Herriot模式。在这种情况下θij公司x个ij公司可以组合成一个随机效应的扩展向量,并且该模型可以重新构建为一个只包含观测到的回归协变量的多元模型。这不能通过功能测量误差模型实现。

2.1先前分配

我们用于由方程给出的模型的非信息先验的一般类(1),(3)(4)

π(x个1,,x个,β,δ,v(v))π(v(v)).
(10)

此先验值是独立统一先验值的乘积x个1, …,x个(前面提到的漫反射),均匀先验βδ,以及选择πv(v))对于随机效应方差–协方差矩阵∑v(v).作为后者的一般形式,我们考虑πv(v))∞|∑v(v)|α/2|一个+ Σv(v)|τ/2关于第节的经验示例我们设置了α=τ=0以使用∑的均匀先验v(v),即。πv(v))■常数。对于以下情况=2,即二元模型,一个自然的替代方法是为两个方差指定(0,∞)上的独立一致先验,σv(v),11σv(v),22,以及相关性的统一先验ρ=σv(v),12/√(σv(v),11σv(v),22)打开(-1,1)。

由于这些先验密度不合适,因此有必要在适当的条件下验证后验密度的适当性。验证一般形式的后验适当性的结果πv(v))∝|Σv(v)|α/2|一个+ Σv(v)|τ/2,在适当的限制下ατ,作为附录A的定理1和定理2给出,在线补充材料。这涵盖了∑上的一致先验v(v)(案例α=τ=0),附录A说明了结果如何意味着二元情况下刚才提到的特殊先验的后验适当性。

2.2计算方法

对于使用任一方程的多元测量误差模型(3)(7)上面给出的,以及表达式(10)中给出的先验πv(v))形式|∑v(v)|α/2(将上述一般规定限制在案件范围内τ=0),的完整条件分布β,δ,{θ}和∑v(v)作为正态或逆Wishart进行计算相对简单,这表明Gibbs采样器具有潜在的用途。Arima对模型的单变量版本进行了此类推导. (2015)。这也可能建议使用BUGS(Spiegelhalter。,2003)或JAGS(管道工,2010)软件,分层指定Y(Y)|θ,然后θ|x个、和X(X)|x个,或将最后两部分组合以指定θ|X(X)通过使用表达式(5)或(8)。还可以为模型参数指定适当的(尽管可能是漫反射的)优先级。不幸的是,吉布斯采样器通常不适用于该模型,因为它可以为参数生成高度依赖的MCMC序列。1(a) –1(c) 显示三个参数a的JAGS自相关函数β-参数,aδ-参数和σv(v),22-从带有=51个观察值,在两个方程中,同一个单一协变量与测量误差。(我们省略了应用程序的细节,因为我们在这里仅将其用于数字说明。)高水平的自相关,特别是对于β,即使对于这个简单的示例也是有问题的。对于大量观察结果,如第吉布斯采样器实际上可能变得不可行。

图1

形式为(2)的二元测量误差模型的三个参数的自相关图=51个观测值和一个具有两个方程共同测量误差的单一协变量:(a)–(c)当模型分层指定给JAGS,以便使用吉布斯采样器时,自相关;(d) –(f)当模型由所提出的独立链MCMC算法处理时的自相关性;(a) ,(d)β-参数;(b) ,(e)δ-参数;(c) ,(f)σv(v),22

为了避免MCMC序列的强烈依赖性,我们寻求吉布斯采样器的替代品。为了表示的简单性,我们将这一点用于编写允许潜在不同协变量的模型z(z)ij公司在每个方程式中j个=1…,如方程式所示(3),但很常见x个对于的所有组件Y(Y),如方程式中所示(9)。然后是var的表达式(Y(Y)|X(X))在方程式中(9)仍然有效。我们使用Y(Y)表示该方差矩阵θ就是那个时候

θ=B类X(X)+z(z)·δ+v(v).

假设一个先验值π(B类,δv(v)) =πv(v)),后部密度B类,δ和∑v(v)由提供

π(B类,δ,v(v)|Y(Y),X(X))π(v(v))如果(Y(Y)|X(X),B类,δ,v(v))=π(v(v))π=1|Y(Y)|-1/2经验-12=1(Y(Y)-B类X(X)-z(z)·δ)T型Y(Y)-1(Y(Y)-B类X(X)-z(z)·δ).

完成上指数中的平方δ,可以改写为

π(B类,δ,v(v)|Y(Y),X(X))π(v(v))|V(V)δ^|1/2π=1|Y(Y)|1/2×经验12=1(Y(Y)B类X(X)z(z)·δ^)T型Y(Y)1(Y(Y)B类X(X)z(z)·δ^)×|V(V)δ^|1/2经验12(δδ^)T型V(V)δ^1(δδ^)=π(B类,v(v)|Y(Y),X(X))×π(δ|Y(Y),X(X),B类,v(v)),
(11)

哪里

V(V)δ^==1z(z)·T型Y(Y)1z(z)·1,δ^=V(V)δ^=1z(z)·T型Y(Y)1(Y(Y)B类X(X)).
(12)

所以,有条件地Y(Y),X(X),B类和∑v(v),δN个(δ^,V(V)δ^)根据标准结果θ|Y(Y),X(X),B类,δ,v(v)是正常的

E类(θ|Y(Y),X(X),B类,δ,v(v))=Y(Y)E类(e(电子)|Y(Y),X(X),B类,δ,v(v))=Y(Y)Y(Y)1(Y(Y)B类X(X)z(z)·δ),
(13)
无功功率,无功功率(θ|Y(Y),X(X),B类,δ,v(v))=Y(Y)1.
(14)

因此,构建模型参数和θ主要在于从π(B类v(v)|Y(Y),X(X))如等式中第一行右侧所示(11).

Chib和Carlin(1999)以及Wolfinger和Kass(2000)提出了改进混合线性模型吉布斯采样器的模拟方法。(前者还将分析扩展到非高斯和纵向混合模型。)Chib和Carlin(1999)建议使用Metropolis–Hastings算法,在我们的符号中,π(∑v(v)|Y(Y),X(X)),使用多元t吨-密度作为建议分布。这个t吨-密度被拟合到吉布斯采样器附近的一个算法的模拟中,除了(在我们的符号中)δ模拟自δ|Y(Y),X(X)v(v)(注意表达式(12)和以下文本),然后{v(v)}来自v(v)|Y(Y),X(X),δv(v),均为高斯分布。(吉布斯采样器将模拟δδ|{θ},v(v))Wolfinger和Kass(2000)建议使用独立链来模拟方差分量{σk个2}通过使用近似于π({σk个2}|Y(Y))并在整个模拟过程中保持不变。它们近似于π({σk个2}|Y(Y))使用逆伽马密度的乘积进行{σk个2}.

对于我们的模型,我们建议使用正态或多元t吨-近似值π(B类v(v)|Y(Y),X(X))通过最大化对数给出平均值{π(B类v(v)|Y(Y),X(X))}超过(B类v(v))(后验模式),取对数的负逆Hessian矩阵{π(B类v(v)|Y(Y),X(X))}在后验模式下确定协方差或标度矩阵。该建议密度可用于类似于Chib和Carlin的Metropolis-Hastings算法(1999)或在类似于沃尔芬格和卡斯的独立链中(2000)。这里我们使用独立链方法。可以对协方差矩阵或标度矩阵进行一些膨胀,以防止使用尾部非常窄的近似分布。正常或t吨-近似也可以应用于原始参数的转换。B类作为一组回归参数,除了影响表达式(6)或(9)中的协方差矩阵外,正常或t吨-近似其分布是一种自然的选择。对于∑v(v)使用上三角Cholesky因子的元素可以获得更合适的参数化U型= [u个jk公司]这样∑v(v)=U型T型U型直接使用Cholesky因子的替代方法是通过对数变换其对角线元素(限制为正)(u个日本)或u个j个j个2/.取对数强制相应的u个日本积极地说,消除了约束优化的需要。正在转换为u个j个j个2/应提供最接近正态分布的近似值,因为u个j个j个2是条件方差,因此u个j个j个2/是威尔逊和希尔弗蒂的转变(1931).

对于图。1,图1(d) –1(f) 显示与图中相同参数的自相关图1(a) ——1(c) ,但使用独立链MCMC方法N个{(β^,U型^),4无功功率,无功功率(β^,U型^)}提案分发。在这里(β^,U型^)是的后向模式(β,U型)、和var(β^,U型^)是对数的负Hessian逆矩阵{π(β,U型)|Y(Y),X(X)}在(β^,U型^)我们发现,独立MCMC链的自相关性大大低于图1(a) –1(c) 使用吉布斯采样器时会产生这种结果。

结果(13)和(14)假设向量的所有元素Y(Y)已观察到。如果需要对某个区域进行预测其中没有Y(Y)观察到(即没有样本的区域)θ|X(X),B类,δ,v(v)正态分布,平均值和协方差由表达式(8)(或更通用的表达式(5))而不是方程给出(13)(14)。如果某些元素Y(Y)我们可以表示为K(K)Y(Y)哪里K(K)是一个矩阵,其行是选择向量,用于拾取Y(Y),然后是θ|K(K)Y(Y),X(X),B类,δ,v(v)正态分布,平均值和协方差由

E类(θ|K(K)Y(Y),X(X),B类,δ,v(v))=B类X(X)+z(z)·δ+θK(K)T型(K(K)Y(Y)K(K)T型)1{K(K)(Y(Y)B类X(X)z(z)·δ)},
(15)
无功功率,无功功率(θ|K(K)Y(Y),X(X),B类,δ,v(v))=θθK(K)T型(K(K)Y(Y)K(K)T型)1K(K)θ,
(16)

哪里θ表示var(θ|X(X))=v(v)+B类C类B类T型.

结果(15)和(16)将在后验分布的模拟中适当平均π(B类,δv(v)|Y(Y),X(X))以获得E类(θ|Y(Y),X(X))和var(θ|Y(Y),X(X))。中缺少观察结果Y(Y)也会改变th区域对可能性的贡献,从而对后验的贡献π(B类,δv(v)|Y(Y),X(X)),来自N个{K(K)(B类X(X)+z(z)·δ),K(K)Y(Y)K(K)T型}密度。

3美国县域学龄儿童贫困率的多元测量误差模型

美国人口普查局(US Census Bureau)的SAIPE项目对各州、县和学区的几个年龄组的贫困人口进行了估算。本节探讨了使用双变量测量误差模型来估计最近一年的贫困率以及县学龄(5-17岁)儿童贫困率的逐年变化。

当前的SAIPE县一级生产模型使用美国人口普查局的美国社区调查(ACS)的估计值作为主要数据来源。ACS是美国最大的家庭调查,每年抽样350万个地址。它根据1年或5年的汇总数据(美国人口普查局,2014)。尽管ACS的总体样本量很大,但对于许多小县来说,对贫困学龄儿童的1年直接估计是高度可变的。因此,SAIPE生产使用一个小面积估算模型,从协变量和其他县的估算中借入强度,特别是通过一个单变量Fay–Herriot模型,对经对数转换的ACS直接1年贫困人口估算进行计算。SAIPE计划可以从行政记录中获得县级的协变量,包括根据与美国国税局达成的协议获得的所得税数据表,以及“补充营养援助计划”(SNAP)的参与者计数表,向低收入人群提供食品补贴。SAIPE项目还使用最近一次人口普查长形式样本中5-17个贫困估计值的对数作为回归变量。上一次人口普查长样本是在2000年人口普查时进行的,之后人口普查就停止了。有关SAIPE计划的更多信息,请参阅Bell. (2016)或SAIPE网页http://www.census.gov/did/www/saipe/.

为了估计单年贫困率和贫困率的逐年变化,我们对连续两年的贫困率进行了联合建模。最近的研究(Huang和Bell,2012; 佛朗哥和贝尔,2015)表明最近的ACS 5年估算值(其5年与正在建模的两个1年估算值的年份不重叠)可能是县级的合适替代值。然而,这些估计值的抽样误差比人口普查长形式估计值要高,而且这种误差应在模型中加以说明。因此,一个合理的模型来估计最近一年的贫困率和每年的变化是一个双变量Fay–Herriot模型,该模型结合了ACS的2年1年估计值(Y(Y)=(Y(Y)1,Y(Y)2)T型),相应的行政记录协变量(z(z)1T型z(z)2T型)ACS五年期估计值作为一个协变量,其测量误差为两个方程所共有的(X(X))。这个模型可以写成

Y(Y)=θ+e(电子),=1,,,
(17)
θj个=βj个x个+z(z)j个T型δj个+v(v)j个j个=1,2,
(18)
X(X)=x个+η.
(19)

在这里ηN个(0,C类)带有C类(标量)ACS 5年估计值的抽样方差,以及e(电子)N个2(0,)带有中采样误差的2×2协方差矩阵Y(Y)1Y(Y)2。此外,v(v)= (v(v)1,v(v)2)T型N个2(0,Σv(v)),其中2×2矩阵∑v(v)是正定的,并且{e(电子)ij公司}, {η}和{v(v)ij公司}被假定为独立的。

我们将该模型应用于2010年和2011年县级学龄儿童贫困率,其中Y(Y)1Y(Y)2是ACS对这2年的1年预测,以及X(X)是ACS对2005-2009年贫困儿童的五年估计数。数据用于=3136个县,省略了3143个美国县中的7个县,这些县在所涉及的估算年份中没有统一定义。这里的兴趣在于预测两者θ1、最近(2011年)的2年贫困率,以及θ1θ2,= 1, …,2010-2011年的变化,以及为这些估计制定不确定性度量(后验标准差)。

在我们的应用程序中,矢量z(z)ij公司包括截距项(1)和以下变量:

  • (a)

    县的“贫困”儿童免税比例,即调整后总收入低于贫困线的纳税申报单上申请的儿童免税数量除以县的儿童免税总数的比率;

  • (b)

    县“儿童纳税申报率”,其定义为该县在纳税申报单上申请的儿童免税人数除以县人口0–17岁;

  • (c)

    “SNAP参与率”,是指上一年7月领取SNAP福利的县人口与上一年县人口的比率。

佛朗哥和贝尔(2013,2015)将上述比率变量的logit用于ACS县贫困估计的二项logit正态模型的二元和时间序列扩展;黄和贝尔(2012)在ACS贫困率的双变量Fay–Herriot模型中使用了它们,而Bell. (2007)在ACS贫困率对数模型中使用了它们的对数。它们与SAIPE国家贫困率模型中使用的回归变量类似(贝尔。,2016).

采样误差e(电子)1e(电子)2假设彼此独立,这意味着-矩阵是对角的。这个假设,以及他们假设独立于η,是合理的,因为模型中调查估计的年份之间没有样本重叠,ACS样本大约每年独立抽取。

对于小样本量,ACS对抽样方差的直接估计是不稳定的,而连续差异复制法(Fay和Train,1995)ACS使用的方法不适用于偶尔出现的0(样本中没有人处于贫困状态时)估计值。我们使用广义方差函数来获得抽样方差的改进估计。有关所用广义方差函数的详细信息,请参阅Franco和Bell(2013).

由方程式给出的模型(17),(18),(19),和方程给出的平坦先验(10)具有πv(v))通过使用第节中描述的独立链MCMC算法进行处理2.2,使用法线近似值π(β,U型|Y(Y),X(X)),其中U型是∑的上三角Cholesky因子v(v)MCMC提案分布将此正态分布的协方差矩阵乘以4。我们在R(R核心团队,2016).

前面的平面对应于α=0和τ在本节末尾介绍之前,一般为02.1。我们还实现了该模型,其中先验值对应于α=1和τ=0,即。πv(v))∝|Σv(v)|−1/2以及第节中讨论的双变量情况的自然先验2.1它指定了两个方差在(0,∞)上的平坦先验,σv(v)第11页σv(v),22,以及相关性的统一先验ρ=σv(v),12/√(σv(v),11σv(v)第22页)打开(-1,1)。我们使用第节中描述的MCMC算法实现了前者2.2后者使用JAGS。三种情况下的结果都非常相似,表明对先验选择不敏感。

尽管模型(17)–(19)是通过在所有县使用相同的模型进行拟合的,该模型假设了常见的回归系数和模型误差方差,但另一种方法是为根据规模、大地理区域或其他信息定义的县子集拟合单独的模型。我们推迟对这种方法进行研究。

图。2显示了因变量、测量误差变量和行政记录协变量的散点图。我们发现,除了2010年和2011年每年的儿童报税率的关系不太明确外,这些答复与所有协变量之间都有明确的关联。事实上,对于所提出的测量误差双变量模型,该变量的回归系数在2010年具有统计意义,但在2011年不具有统计意义。尽管如此,为了获得一个多年来一直定义的模型,我们没有在2011年放弃这个协变量。

图2

因变量、行政记录协变量和测量误差变量的散点图:其中,Y1是2011年ACS对县贫困学龄儿童比率的直接估计,IRSfr1、IRSpov1和SNAP1分别是2011年儿童税申报率、儿童税贫困率和SNAP参与率;Y2、IRSfr2、IRSpov2和SNAP2是2010年的相应数量;ACS5年是ACS对2005-2009年学龄儿童县贫困率的5年直接估计

3.1比较模型预测与直接估计

我们首先将模型预测与直接估计进行比较,以说明在此应用中建模的好处。图。(a) 对比ACS对2010-2011年县域学龄儿童贫困率变化的直接估计值与计量误差模型的模型预测值(后验均值)。它表明,收缩正在发生,在建模时,最极端的直接估计变得不那么极端。例如,请注意,一些对变化的直接估计可能非常高,甚至接近1,这表明相应县的贫困率从根本没有变为100%。这似乎不是一个可信的结果;估计值也没有接近-1。在进行模型预测时,对这两个令人难以置信的结果进行了重大调整。注意直接估算的轴范围之间的差异图中模型预测的轴范围。(a) ●●●●。

图3

(a) ACS直接估计和预测的比较θ1θ2根据2010-2011年学龄儿童县贫困率变化的测量误差模型和(b)对数标度上对应标准误差与样本量(家庭)的比值

图。(b) 显示了与图中估计值相对应的后验标准误差比率。(a) ●●●●。请注意,对于此应用,模型预测的标准误差始终低于直接估计值,并且差异往往很大:直接估计值的标准误差可能比模型估计值大大约七倍。随着样本量的增加,模型对直接估计的重视程度越来越高,因此模型与直接估计之间的标准误差差异减小。为2011年学龄儿童贫困率绘制了类似的地块(未显示),即θ1在我们的模型中。2011年直接估计值的标准误差与测量误差模型的预测标准误差的比率显示出与图相似的模式。(b) 直接估计的标准误差比测量误差模型的标准误差大五倍左右。

3.2比较测量误差模型和天真模型

接下来,我们将测量误差模型与“朴素”模型进行比较,该模型将ACS五年期估计值视为真实值,不受抽样误差的影响。该模型可以作为一个简单的双变量Fay–Herriot模型进行拟合,并将ACS五年期估计值作为额外的协变量,或者通过设置C类全部=0在测量误差模型中(19)。

图。4(a) 绘制了2011年学龄儿童贫困率的后验均值(θ1s) 对于测量误差和朴素模型。两者之间的轻微差异表明,忽略ACS 5年估算中的测量误差对点预测没有太大影响。图。4(b) 显示了对应的模型报告后验标准误差与C类.对于规模较小的县C类naive模型报告的后验标准误差大于测量误差模型,而对于具有较大误差的县C类它报告较小的后验标准误差。我们提到“报告的标准误差”是为了强调,在原始模型的情况下,这些误差是基于一个错误指定的模型,该模型忽略了X(X)s;因此,它们不同于模型的真实预测标准误差。我们稍后将更详细地讨论此模型错误指定的性质。这种错误说明的结果是,朴素模型的后验方差低估了具有较大值的县的真实预测最小有效误差C类(通常是小县,样本量较小),并夸大了值较小的县的真实最小经济体C类(样本量大的大县)。模型错误指定对小县的影响更大,因为这些县对模型的依赖程度更高;对大县的预测更倾向于直接调查估计。4(c) 和4(d) 类似于图4(a) 和4(b) 但与每年变化的预测相对应θ1θ2结论与图4(a) 和4(b) 除了朴素模型和测量误差模型的后验标准误差之间的差异较小外。这是因为在θ1θ2,这会产生较小的估计差异和较小的后验方差。对于的其他功能(θ1,θ2),通常不会发生这种模型错误规范的影响稀释。

图4

(a) 2011年县域学龄儿童贫困率的后验均值,计量误差模型天真模型,(b)与(a)中的估计相对应的模型报告的标准误差(测量误差/天真)与C类(对数标度),(c)θ1θ22010-2011年县域贫困率变化的计量误差模型与(c)中的估计值相对应的朴素模型和报告的标准误差的(d)比率C类(对数刻度)

这些图中测量误差的影响可能会被其他协变量的影响所掩盖。事实上,这里使用的SAIPE协变量是强有力的预测因子,可以解释数据中的重大变化。佛朗哥和贝尔(2015)他们被认为大大降低了替代建模假设的影响。为了说明强协变量不存在的情况,我们实现了相同的模型,但没有基于行政记录的回归变量,因此只有模型截距保留在协变量中z(z)ij公司没有错误。5(a) 和5(b) 类似于图4(a) 和4(b) 但没有行政记录协变量。他们对比了后验均值和标准误差θ1从朴素和测量误差模型。尽管图中的模式4(a) 和4(b) 和图5(a) 和5(b) 是相似的吗?请注意-图中的轴范围4(b) 和5(b) 这表明,当不使用行政记录协变量时,朴素模型和测量误差模型的报告后验标准误差的差异要大得多。在这种情况下,我们还看到了点预测中的一些差异。后验均值和报告的标准误差也不相同θ1θ2在没有协变量的情况下,这与测量误差和朴素模型相似(图中未显示)。

图5

(a) 后部平均值θ1从朴素的模型那些来自估计2011年县域贫困儿童比率的测量误差模型,与行政记录中的无协变量拟合,以及(b)来自测量误差和朴素模型的相应报告标准误差的比率,与C类s(对数刻度)

为了理解朴素模型的错误说明,请考虑由等式给出的测量误差模型的方差说明(9),它是var(Y(Y)|X(X))=v(v)+B类C类B类T型+。天真模型的错误说明是省略了该术语不列颠哥伦比亚省B类T型,这是测量误差模型中的方差分量,被视为已知。实际上C类s、 和此外,在应用测量误差模型之前,必须使用测量微观数据进行估算。虽然C类s和因此,s会出现误差,但它们会特别反映出大小县之间主要样本量差异对抽样方差的影响。由于模型指定错误,当朴素模型拟合其∑估计时v(v)会被类似的东西膨胀B类C类¯B类T型,其中C类¯C类和0<<1是衰减系数。这会低估模型误差方差∑v(v)+不列颠哥伦比亚省B类T型对于样本较少的县(有C类>C类¯)并夸大了样本量大的县(这些县C类<C类¯)。对于具有C类近的C类¯,以及何时较大时,估计的原始模型误差方差将大约正确。我们对单变量情况进行的模拟(此处未报告)证实了这一启发式论点。

我们强调,鉴于对C类s、 朴素模型的省略不列颠哥伦比亚省B类T型方差规范是已知的模型错误规范,而不是模型诊断评估的潜在错误规范。我们还注意到,错误规范的影响源于C类s、 即,如果实际上C类C类为所有人那么,对于预测来说,错误指定没有任何影响,可以使用朴素模型。错误指定将影响关于βj个s(测量误差模型的经典结果),但这不是我们的兴趣所在。

为了实证地说明上述观点,我们使用一阶近似计算了朴素模型的“真实”和“报告”预测误差方差,该近似假设测量误差模型正确且模型参数已知。(我们计算了预测误差方差而非均方误差,因为原始模型的均方误差有一个偏差分量,它取决于未知因素x个即使将真实模型视为已知模型,也无法计算s和so。)然后,我们将这些表达式中的模型参数替换为MCMC模拟的后验均值。虽然这是一个粗略的近似值,因为我们有一个很大的相对于参数的数量,这个近似值应该足以进行说明。为了保持一致,我们还计算了朴素模型报告的预测误差方差的一阶近似值,即我们计算了假设朴素模型为真(如果X(X)s无测量误差),其参数已知。然后,我们将参数设置为等于其后验均值。6(a) 和6(b) 绘制预测误差的真实标准偏差与报告标准偏差之比θ1θ1θ2分别是。注意,如上所述,天真模型有时低估,有时夸大预测标准误差。在这两种情况下,夸大的数量都很小。任何一种预测标准误差的错报θ1θ2很小,与图中所示的两个模型报告的标准误差之间的微小差异一致。4(d) ●●●●。

图6

对于(a),通过使用一阶近似计算的朴素模型的真实与报告预测标准误差之比θ12011年县学龄儿童贫困率,以及(b)θ1θ22010年至2011年学龄儿童贫困率的变化,与相应的C类s(对数刻度)

类似于图。6(a) (未显示)对于没有行政记录协变量的模型,显示天真模型的真实预测标准误差和报告预测标准误差的比率,表明θ1在这种情况下报告值可能高达1.9左右。

我们还可以使用一阶近似来比较原始和测量误差模型的“真实”后验标准误差。图。7显示了这两个量的比值θ1相对于C类s、 对于具有行政记录协变量的模型(图。7(a) )和没有这些协变量的模型(图。7(b) )。请注意,原始模型的预测标准误差都大于或等于测量误差模型的标准误差(比率为1或更小)。当测量误差很小时,比率基本上为1(C类接近0),或当C类在图中接近0.0013。7(a) 或图中的0.0012。7(b) ●●●●。这些是var估计值(θ|X(X))=v(v)+B类C类B类T型因为测量误差模型近似于∑的膨胀估计v(v)对于天真的模型。作为C类增长越大,朴素模型的性能就越差(比率从1下降),尽管对于具有管理记录协变量的模型来说,性能的下降幅度很小(小于1%)。

图7

实际预测标准误差估计值的比率θ1对于使用一阶近似值计算得出的相对于原始模型的测量误差模型,对于(a)具有行政记录协变量的模型和(b)不具有这些协变量的模式:根据相应的比率绘制比率C类s(对数刻度)

3.3比较双变量测量误差模型和单独的单变量模型的变化估计

人们可能会想,是否真的有必要应用双变量模型来估计年与年之间的差异。从业者可能会倾向于拟合每年的单变量模型,并利用结果估计值的差异来获得年度变化的估计值。然后,为了估计年度变化的方差,从业者可以简单地加上每年估计的方差,隐含地假设模型误差的独立性(因为单独的单变量模型无法估计2年之间模型误差的协方差)。然而,这可能导致结果估计值存在显著差异,并导致错误报告的标准误差。如图所示。8.图8(a) 和8(b) 对应于模型中包含来自行政记录的协变量的情况,以及图8(c) 和8(d) 对应于我们从模型中排除这些协变量的情况。图中的曲线8(a) 和8(c) 比较从二元测量误差模型获得的年变化后验均值与从2010年和2011年两个单独的单变量测量误差模型中取后验均值之差得到的估计值。请注意,后验均值存在显著差异,在无协变量的情况下,这些差异更为显著。8(b) 和8(d) 显示相应估计值的报告标准误差的比率,并与C类同样,差异是显著的,由于单变量年变化估计无法捕获和解释模型误差之间的协方差,因此报告的标准误差较大。

图8

(a) 由双变量测量误差模型得出的2010年至2011年学龄儿童贫困率变化估计值,并通过采用2010年和2011年两个单独的单变量测量误差模式得出的估计值之间的差异,(b)与(a)中预测相对应的报告标准误差比率阴谋反对C类s和(c),(d)通过使用从行政记录中排除协变量的测量误差模型,对(a)和(b)进行类似绘图

3.4结束语

本节的结果表明,建模大大提高了该应用的小面积(县)估计的准确性。原始模型和测量误差模型的点预测没有太大差异,特别是对于使用行政记录协变量的模型。然而,它们在其他应用中可能会有很大不同。幼稚模型和计量误差模型之间的后验方差存在差异,尤其是在估计2011年县域贫困率时。这两个模型估计2010-2011年贫困率变化的后验方差差异很小,因为这两年之间的预测误差的正相关部分被抵消了。然而,一般来说,朴素模型产生的后验方差可能会产生误导,这说明了解释协变量中测量误差的重要性。

为了估计每年的变化,我们还通过这个例子展示了联合建模年度估计的重要性,以说明每年模型误差的相关性。考虑两个单独拟合的单变量模型的估计值之间的差异,并假设两个模型方程中的测量误差独立,与拟合可以解释这种依赖性的双变量模型相比,可能会导致严重不同的估计值和错误的标准误差。

致谢

发布本报告是为了告知相关方正在进行的研究并鼓励讨论。就统计、方法、技术或操作问题发表的观点是作者的观点,不一定是罗马萨皮恩扎大学、美国人口普查局或格鲁吉亚大学的观点。

Brunero Liseo和Serena Arima感谢2015年PRIN拨款2015EASZFS的支持。Serena Arima感谢2015年PRIN拨款20154X8K23的支持。

工具书类

阿里马
,
美国。
,
达塔
,
通用标准。
利塞奥
,
B。
(
2012
)
测量误差小区域模型的客观贝叶斯分析
.
贝斯纳分析。
,
7
,
363
384
.

阿里马
,
美国。
,
达塔
,
通用标准。
利塞奥
,
B。
(
2015
)
辅助信息有误差测量时小区域模型的贝叶斯估计
.
扫描。J.统计。
,
42
,
518
529
.

巴蒂斯
,
通用电气公司。
,
哈特
,
风险管理。
富勒
,
水务局。
(
1988
)
利用调查和卫星数据预测县域作物面积的误差分量模型
.
《美国统计杂志》。助理。
,
83
,
28
36
.

潜水钟
,
W.R.公司。
,
巴塞尔
,
西-西。
,
克鲁斯
,
C、。
,
达尔泽尔
,
L。
,
Maples公司
,
J·J。
,
奥哈拉
,
B。
权力
,
D。
(
2007
)
使用ACS数据生成基于SAIPE模型的各县贫困估计值
.技术报告美国人口普查局,华盛顿特区。(可从http://www.census.gov/did/www/saipe/publications/files/report.pdf.)

潜水钟
,
W.R.公司。
,
巴塞尔
,
西-西。
枫树
,
J·J。
(
2016
)美国人口普查局的小范围收入和贫困估算项目概述。
贫困数据的小面积估算分析
(编辑)。
M。
普拉泰西
)第19章。
奇切斯特
:
威利
.

芯片
,
美国。
卡林
,
业务伙伴。
(
1999
)
分层纵向模型中的MCMC抽样
.
统计师。计算。
,
9
,
17
26
.

达塔
,
通用标准。
,
,
B。
巴萨瓦
,
I.V.公司。
(
1999
)
多元小面积估计中的经验最佳线性无偏和经验Bayes预测
.
J.统计。计划信息。
,
75
,
269
279
.

达塔
,
通用标准。
,
,
B。
梅蒂
,
T。
(
1998
)
多元贝叶斯小面积估计:在测量和卫星数据中的应用
.
桑赫亚
A、,
60
,
344
362
.

达塔
,
通用标准。
,
费伊
,
R.E.公司。
高希
,
M。
(
1991
)
小面积估计中的层次和经验多元Bayes分析
.英寸
程序。第七届美国人口普查局Res.Conf.Bureau of Census
,第页。
63
79
.
华盛顿特区
:
美国人口普查局
.

达塔
,
通用标准。
,
高希
,
M。
,
南佳
,
N。
纳塔拉詹
,
英国。
(
1996
)估计四口之家的中等收入:贝叶斯方法。
统计学和计量经济学中的贝叶斯分析
(编辑
D.A.博士。
贝里
,
K.M.公司。
查洛纳
J.K。
格威克
),第页。
129
140
.
纽约
:
威利
.

达塔
,
通用标准。
,
,
J.N.K。
托拉比
,
M。
(
2010
)
具有函数测量误差的嵌套误差线性回归模型下小面积均值的伪经验Bayes估计
.
J.统计。计划信息。
,
250
,
2952
2962
.

费伊
,
R.E.公司。
(
1987
)多元回归在小范围估计中的应用。
小区域统计
(编辑
R。
普拉泰克
,
J.N.K。
,
C.E.公司。
萨恩达尔
M.P.公司。
辛格
),第页。
91
102
.
纽约
:
威利
.

费伊
,
R.E.公司。
赫里奥特
,
注册会计师。
(
1979
)
小地方收入估算:James-Stein程序在人口普查数据中的应用
.
《美国统计杂志》。助理。
,
74
,
269
277
.

费伊
,
R.E.公司。
列车
,
G.公司。
(
1995
)
各州和县收入和贫困特征的调查和基于模型的事后估计
.
程序。政府统计员。第节。美国统计师。助理。
,
154
159
.

佛朗哥
,
C、。
潜水钟
,
W.R.公司。
(
2013
)
二元二项/对数正态模型在小面积估算中的应用
.
程序。Surv公司。研究方法。第节。美国统计师。助理。
,
690
702
.

佛朗哥
,
C、。
潜水钟
,
W.R.公司。
(
2015
)借用二项式/logit正态模型中随时间推移的信息进行小面积估计。联合特刊
转型期统计与调查方法
,
16
,
563
584
.

富勒
,
水务局。
(
1987
)
测量误差模型
.
纽约
:
威利
.

富勒
,
水务局。
哈特
,
风险管理。
(
1987
)小面积估计的多元方差分量模型。
小区域统计
(编辑
R。
普拉泰克
,
J.N.K。
,
C.E.公司。
萨恩达尔
M.P.公司。
辛格
),第页。
103
123
.
纽约
:
威利
.

高希
,
M。
,
南佳
,
N。
基姆
,
D。
(
1996
)
四口之家收入中位数的估计:贝叶斯时间序列方法
.
《美国统计杂志》。助理。
,
91
,
1423
1431
.

高希
,
M。
辛哈
,
英国。
(
2007
)
函数测量误差模型下有限总体抽样的经验Bayes估计
.
J.统计。计划信息。
,
137
,
2759
2773
.

高希
,
M。
,
辛哈
,
英国。
基姆
,
D。
(
2006
)
结构测量误差模型下有限总体抽样的经验和分层贝叶斯估计
.
扫描。J.统计。
,
33
,
591
608
.

,
E.T.公司。
潜水钟
,
W.R.公司。
(
2012
)
SAIPE贫困估算模型中使用先前美国社区调查数据与2000年人口普查数据的实证研究
.研究报告RRS2012–4华盛顿特区美国人口普查局统计研究与方法中心。(可从http://www.census.gov/srd/papers/pdf/rrs201204.pdf.)

水管工
,
M。
(
2010
)
JAGS——只是另一个吉布斯采样器
2.1.0版。(可从https://sourceforge.net/projects/mcmcjags网站.)

R核心团队
(
2016
)
R: 统计计算语言与环境
.
维也纳
:
R统计计算基金会
.

Spiegelhalter公司
,
D。
,
托马斯
,
答:。
,
最佳
,
N。
伦恩
,
D。
(
2003
)
WinBUGS用户手册,1.4版。
剑桥
:
医学研究委员会生物统计股
.

托拉比
,
M。
,
达塔
,
通用标准。
,
J.N.K。
(
2009
)
协变量中存在测量误差的嵌套误差线性回归模型下小面积均值的经验Bayes估计
.
扫描。J.统计。
,
36
,
355
368
.

美国人口普查局
(
2014
)
美国社区调查的设计和方法
2.0版。美国人口普查局,华盛顿特区。(可从http://www.census.gov/acs/www/methodology/methodocology_main/)

威尔逊
,
E.公司。
希尔弗蒂
,
M。
(
1931
)
X平方分布
.
程序。国家。阿卡德。科学。美国
,
17
,
684
688
.

沃尔芬格
,
钢筋混凝土。
卡萨丁
,
R.E.公司。
(
2000
)
方差分量模型的非共轭贝叶斯分析
.
生物计量学
,
56
,
768
774
.

伊巴拉
,
L.M.R.公司。
洛尔
,
S.L.公司。
(
2008
)
误差测量辅助信息时的小面积估计
.
生物计量学
,
95
,
919
931
.

附录A:后验分布的适当性

以下定理在适当的条件下建立了后验函数的适当性,且前验函数一致x个1, …,x个,β、和δ如方程式所示(10)和协方差矩阵∑先验的一般形式v(v):

π(v(v))|v(v)|α/2|一个+v(v)|τ/2
(20)

其中标量ατ、和×正定矩阵一个都是经过适当选择的。我们从测量误差共变的情况开始X(X)ij公司和观察到的协变量z(z)ij公司在方程式中都是相同的j个= 1, …,.

定理1

τ1=最小值(τ,0). 公式(4)、(7)和(20)规定的模型后验密度是适当的,前提是

  • (a)

    >第页+q个+ 2ατ1

  • (b)

    α< 2.

备注1

对于α=τ=0和=1,最后一个条件简化为>第页+q个+ 2. 这与Arima定理中的条件一致. (2015).

对于测量误差共变的情况X(X)ij公司在整个方程中是不相同的,甚至可能在数量上也不相同,我们让第页j个是中的元素数X(X)ij公司第页*=j个=1第页j个。我们现在仍然假设观测到的协变量z(z)ij公司在方程中是相同的。

定理2

方程(1)、(2)、(4)和(20)给出的模型的后验密度是适当的,如果α<2和>第页*+q个++ 1−τ1α.

备注2

定理2的条件比定理1的条件强。如果所有第页j个s等于第页,上的条件成为>+q个++ 1−τ1α,这意味着>第页+q个+ 2ατ1.

备注3

定理1和定理2的条件在实践中通常只满足中等值.

对于观察到的协变量的情况,后面的适当性z(z)ij公司方程之间的差异在在线补充材料.

对于以下情况=2,即双变量模型,上述结果也适用于第节中提到的替代双变量模型1(两个方差在(0,∞)上一致,相关性在(-1,1)上一致)。根据矩阵∑的不同元素转换这个先验v(v),通过简单代数,得到的先验值可以被证明有界于∑v(v)|−1/2,对应于α=1和τ=方程中考虑的先验值类别中的0(20).

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)