Small area estimation of expenditure means and ratios under a unit-level bivariate linear mixed model

María Dolores Esteban; María José Lombardía; Esther López-Vizcaíno; Domingo Morales; Agustín Pérez

doi:10.1080/02664763.2020.1803809

J应用统计。2022; 49(1): 143–168.

在线发布2020年8月5日。数字对象标识：10.1080/02664763.2020.1803809

PMCID公司：PMC9041861型

PMID：35707801

单位水平二元线性混合模型下支出均值和比率的小面积估计

玛丽亚·多洛雷斯·埃斯特班,^一玛丽亚·若泽·隆巴迪亚,^b条埃斯特·洛佩斯·维兹卡诺,^c（c）多明戈·莫拉莱斯,^一和阿古斯汀·佩雷斯^一

作者信息版权和许可信息 PMC免责声明

关联数据

补充资料: Suppemental材料.pdf
CJAS_A_1803809_SM4291.pdf（137K）
GUID:5AC9A331-B781-4D81-8B9C-C723228656D5

摘要

在单位水平二元线性混合模型下，引入了支出均值和支出比率的小面积预测因子，并导出了相应均方误差的近似值和估计值。对于所考虑的模型，采用REML估计方法。为了分析引入的拟合算法、预报器和均方误差估计器的性能，进行了几个仿真实验。对西班牙家庭预算调查的实际数据的应用说明了拟议统计方法的行为。目标是估计西班牙各省的粮食和非粮食家庭年度支出手段以及粮食家庭支出比率。

关键词：多元线性混合模型、嵌套误差回归模型、最佳线性无偏预测因子、比率估计、小面积估计、家庭预算调查

AMS科目分类：62E30、62J12

1.简介

似乎没有必要为消费在21世纪所获得的相关性辩解，因为当时经济发达国家已加入消费社会，消费社会是一种社会模式，在这种模式中，幸福和生活质量的一个非常重要的部分与商品和服务的获得有关。近年来消费发生的模式、对象、形状和地点的变化速度和多样性是人们从不同角度分析消费的兴趣所在。准确估计消费者支出对一个国家的经济很重要，因为这种支出约占西班牙国内生产总值的60%。然而，全球政治措施往往不能令区域当局满意，区域当局也可以制定自己的经济战略。他们需要一些工具来精确、可靠和可接受的准时性来确定主要变量和消费指标，以便实施他们的战略。

在主要消费指标中，我们可以引用当地家庭的粮食和非粮食年支出以及粮食家庭年支出比例。最后一个指标被定义为某一地区家庭的年均食品支出与所有支出项目的相应年均支出之间的商。

在有限总体中，比率的估计通常是通过直接估计分别估计分子和分母来完成的。一个领域中目标变量的总和或平均值的直接估计器只使用该领域的数据，它相对于样本设计的分布基本上是无偏的，并且当样本量增加时，其方差减小。比率估计器继承了这些特性的一部分，因此它们的偏差和方差也会随着样本量的增加而减小。然而，在小面积估计（SAE）设置中，域样本大小通常很小。

SAE在样本量较小时处理领域指标的估计，以构建精确的直接估计量。弥补样本量不足的一种方法是将模型与整个样本相匹配。因此，在估计一个领域的人口指标时，还考虑了其他领域的数据以及不同可用变量之间的关系。这就是所谓的基于模型的SAE方法。拉奥和莫利纳的专著[29]给出了SAE方法的一般描述。

如果有多个目标变量，多变量区域级或单位级混合模型可以考虑它们的相关性。这些相关性为域参数的估计提供了重要的附加信息。费伊[12]和Datta等。[9]结果表明，对于每个响应变量，从多元模型获得的小面积估计量通常比从单变量模型获得的估计量具有更好的精度。例如，这些估计值可能是Datta引入的层次和经验贝叶斯预测值等。[9]或González-Manteiga得出的经验最佳线性无偏预测等。[13]或者Benavent和Morales[2]在多元线性混合模型下。

关于使用统计模型估计小面积社会经济指标的文献很多。我们引用了一些基于区域级模型的应用程序的作品，但并不详尽。莫利纳等。[23]，洛佩兹·维兹卡诺等。[19,20]和埃斯特班等。[11]处理了估算劳动力指标的问题。莫拉莱斯等。[25]，波特等。[27]，布贝塔等人。[三,4]或Arima等。[1]介绍了贫困比例或差距估计的应用。最近，Marchetti和Secondi[21]利用Fay-Herriot模型和Ubaidillah研究了意大利省级家庭消费支出等。[32]在双变量Fay-Herriot模型下按小地区估算的粮食和非粮食支出。

另一方面，单元级模型也为微观数据建模提供了很高的灵活性。达塔等。[8]研究了小面积均值向量的经验Bayes预测。莫利纳[22]对数变换的多元嵌套误差回归模型下混合效应的预测指数。扎维迪斯等。[31]，钱伯斯等。[5]引入了基于M分位数回归模型的预测因子。钱德拉等。[6]将地理加权混合效应模型应用于澳大利亚农业和放牧业调查。霍布扎等。[16,17]基于单位级logit混合模型、Hobza和Morales导出的小区域贫困比例预测因子[15]还有莫拉莱斯和桑塔马利亚[24]分别在随机回归系数模型和时间线性混合模型下估计家庭归一化年净收入的领域平均数。恩加鲁耶等。[26]推导了多变量线性模型下重复测量数据领域均值的经验最佳线性预测因子。伊藤和久保川[18]采用多元嵌套误差回归模型对1998年至2001年京京铁路沿线公布的地价数据进行统计分析。

上述关于SAE应用区域级和单位级多元统计模型的论文的非完整列表显示了考虑目标变量的相关结构的好处。事实上，乌贝迪拉等。[32]考虑了多元FH模型，并通过使用响应变量之间的相关性证明了比单变量模型更有效的估计量，从而表明响应变量之间相关性的强度起着主要作用。然而，在SAE文献中，我们还没有发现基于模型的比率估值器，该模型考虑了相关目标变量的相关性。比率估计量通常由分子和分母的独立估计量构成。这可以通过对每个因变量拟合嵌套误差回归（NER）模型来实现，该模型是SAE中的基本单位级线性混合模型。然而，为每个目标变量选择单独的独立模型并没有考虑它们的相关性。这一事实降低了建模的预测能力，并且不允许正确估计比率预测因子的均方误差（MSE）。

虽然可以使用联合建模方法通过共享参数来联合建模双变量响应变量，以处理感兴趣的变量之间的关联，但本文采用了完全多元方法。提出的比率估计问题的解决方案是在单位级二元线性混合模型的基础上引入平均值的经验最佳线性无偏预报器（EBLUP）和比率的插件预报器。这种方法相对于单独建模改进了领域参数的预测。本文开发了预测因子，并提供了它们的MSE的近似值。它通过实证研究了新提议与基于单变量和独立模型构建的通常预测值的效率，显示了这两种程序的弱点和优势。最后，本文说明了引入的方法，并将其应用于2016年西班牙家庭预算调查的数据，估算了省级西班牙家庭的食品支出平均值和比率。

论文的其余部分组织如下。章节2描述了调查数据和感兴趣的估计问题。章节三介绍了一种二元嵌套误差回归模型，推导了均值的EBLUP和比率的插件预测因子。章节4近似于引入的预测因子的最小均方误差。章节5进行了仿真实验，以研究剩余最大似然（REML）拟合算法、域平均值和比率的预测因子以及MSE估计量的行为。章节6给出了对实际数据的应用，其中目标是对西班牙各省家庭年度支出的平均数和比率进行小范围估计。章节7总结了一些结论。本文包含两个附录。附录A给出了用于计算模型参数的REML估计量的Fisher评分算法。附录B概述了获得区域平均EBLUP的MSE近似值的一些数学推导。

2.数据和关注的问题

西班牙家庭预算调查（SHBS）每年由国家统计研究所（INE）进行，目的是获取有关消费支出的性质和目的地以及与家庭生活条件有关的各种特征的信息。我们处理来自2016年SHBS的数据。SHBS通过个人访谈收集西班牙各地私人住宅的支出和人口信息。住宅是通过在主要抽样单元中进行两阶段分层随机抽样来选择的。主要抽样单位为人口普查部门，次要抽样单位为住房。我们的分析基于家庭层面的文件，该文件总共包含近21000户家庭。目标域是西班牙的52个省。SHBS的样本量是为了计算自治社区（NUTS 2）层面的精确估计值，而不是省级（NUTS 3）层面的官方估计值。在这种情况下，估计域级消费指标是一个SAE问题。

响应变量为 $年_{d日 j 1}$ 和 $年_{d日 j 2}$ 家庭的食品和非食品年度支出j来自域d日食品包括食品和非酒精饮料，非食品代表剩余支出。目标参数是粮食和非粮食家庭年支出领域平均数和粮食家庭年支出领域比率，即。

{\bar{Y（Y）}}_{d日 1} = \frac{1}{{N个}_{d日}} \sum_{j = 1}^{{N个}_{d日}} 年_{d日 j 1}, {\bar{Y（Y）}}_{d日 2} = \frac{1}{{N个}_{d日}} \sum_{j = 1}^{{N个}_{d日}} 年_{d日 j 2}, {R（右）}_{d日} = \frac{{\bar{Y（Y）}}_{d日 1}}{{\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2}}, d日 = 1, \dots, D类 .

域平均值的Hájeck型直接估计 ${\bar{Y（Y）}}_{d日 k个}$ ,k个 = 1，2是

{\hat{\bar{Y（Y）}}}_{d日 k个}^{目录} = \frac{1}{{\hat{N个}}_{d日}^{目录}} \sum_{j \in 秒_{d日}} {w个}_{d日 j} 年_{d日 j k个}, {\hat{N个}}_{d日}^{目录} = \sum_{j \in 秒_{d日}} {w个}_{d日 j}, k个 = 1, 2,

(1)

哪里 $秒_{d日}$ 是域示例 ${w个}_{d日 j}$ 的是海拔系数。这些估计量的基于设计的协方差可以近似为

{\hat{覆盖（cov）}}_{π} ({\hat{\bar{Y（Y）}}}_{d日 1}^{目录}, {\hat{\bar{Y（Y）}}}_{d日 2}^{目录}) = ({\hat{N个}}_{d日}^{目录})^{- 2} \sum_{j \in 秒_{d日}} {w个}_{d日 j} ({w个}_{d日 j} - 1) (年_{d日 j 1} - {\hat{\bar{Y（Y）}}}_{d日 {k个}_{1}}^{目录}) (年_{d日 j 2} - {\hat{\bar{Y（Y）}}}_{d日 2}^{目录}) .

(2)

最后的公式来自于Särndal等。[30，第43、185和391页]，并进行了简化 ${w个}_{d日 j} = 1 / π_{d日 j}$ , $π_{d日 j, d日 j} = π_{d日 j}$ 和 $π_{d日我, d日 j} = π_{d日我} π_{d日 j}$ , $我 \neq j$ ，在二阶包含概率中。区域比率的直接估计 ${R（右）}_{d日}$ 是

{\hat{R（右）}}_{d日}^{目录} = \frac{{\hat{\bar{Y（Y）}}}_{d日 1}^{目录}}{{\hat{\bar{Y（Y）}}}_{d日 1}^{目录} + {\hat{\bar{Y（Y）}}}_{d日 2}^{目录}}, d日 = 1, \dots, D类 .

(3)

章节6显示了直接估计(1)和(三)在省一级并不精确。这就是为什么我们寻找替代的基于模型的估计方法，该方法从辅助变量中借力，并可能产生更精确的领域目标参数估计值。可用的解释变量有

收入。家庭年净收入总额（欧元）。
家庭构成（FC）。FC1：单身或成年夫妇，至少有一名成员年满65岁或以上，FC2：其他单身或无子女的组合，FC3：与16岁以下儿童或16岁以下子女的成人夫妇，FC4：其他家庭。
消耗单位数（乘以10）。 $网络控制单元 = 10 {1 + 0.5 ({N个}_{1} - 1) + 0.3 {N个}_{2}}$ ，其中 ${N个}_{1}$ 是指家庭中14岁或以上的人数，以及 ${N个}_{2}$ 是指家庭中14岁以下的人数。
农村。R1：人口稀少地区，R0：其他地区。

我们首先通过解释性数据分析分析这些辅助变量的潜在预测能力。图1绘制观察到的食品和非食品支出与收入的关系图。我们观察到，尽管在这两个图中观察到了很大的变异性，但这两个支出变量似乎随着收入线性增加。据估计，食品支出与收入之间的皮尔逊相关系数为0.36，非食品支出与收益之间的皮尔森相关系数为0.65。此外，相应的 $95 %$ 置信区间分别为（0.36,0.37）和（0.64,0.66）。因此，收入似乎对目标变量具有很好的解释力。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0001_OB.jpg

在单独的窗口中打开

图1。

收入与支出。

图2绘制每个家庭构成类别的食品和非食品支出。这两个反应变量在家庭构成类别中具有不同的均值和方差。因此，FC可以作为辅助变量输入到解释支出变量行为的模型中。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0002_OB.jpg

在单独的窗口中打开

图2。

家庭构成与支出。

图三绘制食品和非食品支出与消费单位的关系图。由于支出变量随着消费单位的增加而增加，NCU似乎是支出变量的一个很好的解释变量。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0003_OB.jpg

在单独的窗口中打开

图3。

消费单位数量与支出。

图4绘制粮食和非粮食支出与城市化程度的关系图。可变农村地区R0类和R1类的食品支出没有显著差异。然而，非农村地区的其他支出似乎更大，因此，可以将其视为一个合理的辅助变量。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0004_OB.jpg

在单独的窗口中打开

图4。

城市化程度与支出。

因此，收入、FC、NCU和农村变量可能是建模粮食和非粮食支出的良好协变量。在拟合独立嵌套误差回归模型后，对回归参数的显著性检验证实了这些辅助变量的解释力。然而，单独或联合建模粮食和非粮食支出的问题仍然存在。为了分析这个问题，我们计算了皮尔逊相关系数，P（P）和 ${P（P）}_{d日}$ ，以及相应的第页-域之间和域内的费用变量值。也就是说，对于值集

{({\hat{\bar{Y（Y）}}}_{d日 1}^{目录}, {\hat{\bar{Y（Y）}}}_{d日 2}^{目录}) : d日 = 1, \dots, D类}, {(年_{d日 j 1}, 年_{d日 j 2}) : j = 1, \dots, {n个}_{d日}}, d日 = 1, \dots, D类 .

域间相关系数为P（P） = 0.560，带第页-价值 $0.12 \times 10^{- 4}$ .域内相关系数 ${{P（P）}_{1}, \dots, {P（P）}_{D类}}$ 四分位数均为正 ${q个}_{0} = 0.188$ , ${q个}_{1} = 0.351$ , ${q个}_{2} = 0.398$ , ${q个}_{三} = 0.440$ , ${q个}_{4} = 0.539$ 和相应的第页-数值均小于0.05。这一事实促使我们需要对支出变量进行联合建模，并根据该模型引入双变量净入学率模型。章节三描述了新模型的基本属性，并提出了领域平均值和比率的预测值。

3.二元嵌套误差回归模型

3.1. 人口模型

让U型是一个庞大的群体N个分割成D类域或区域 ${U型}_{1}, \dots, {U型}_{D类}$ 的大小 ${N个}_{1}, \dots, {N个}_{D类}$ 分别是。让 $N个 = \sum_{j = 1}^{D类} {N个}_{d日}$ 是全球人口规模。让 $年_{d日 j} = (年_{d日 j 1}, 年_{d日 j 2})^{'}$ 是在样本单位上测量的连续变量向量j域的d日, $d日 = 1, \dots, D类$ , $j = 1, \dots, {N个}_{d日}$ 。对于k个 = 1，2，让 ${x个}_{d日 j k个} = ({x个}_{d日 j k个 1}, \dots, {x个}_{d日 j k个 {第页}_{k个}})$ 是包含以下内容的行向量 ${第页}_{k个}$ 解释变量和let ${X（X）}_{d日 j} = 诊断 ({x个}_{d日 j 1}, {x个}_{d日 j 2})_{2 \times 第页}$ 具有 $第页 = {第页}_{1} + {第页}_{2}$ .让 $β_{k个}$ 是大小的列向量 ${第页}_{k个}$ 包含回归参数和let $β = (β_{1}^{'}, β_{2}^{'})_{第页 \times 1}^{'}$ 人口二元嵌套误差回归（BNER）模型为

年_{d日 j} = {X（X）}_{d日 j} β + {单位}_{d日} + {e（电子）}_{d日 j}, d日 = 1, \dots, D类, j = 1, \dots, {N个}_{d日},

(4)

其中随机效应向量 ${单位}_{d日} = ({单位}_{d日 1}, {单位}_{d日 2})^{'}$ 和随机误差向量 ${e（电子）}_{d日 j} = ({e（电子）}_{d日 j 1}, {e（电子）}_{d日 j 2})^{'}$ 与多元正态分布相互独立

{单位}_{d日} \sim {N个}_{2} (0, {V（V）}_{单位 d日}), {e（电子）}_{d日 j} \sim {N个}_{2} (0, {V（V）}_{e（电子） d日 j}), d日 = 1, \dots, D类, j = 1, \dots, {N个}_{d日} .

这个 $2 \times 2$ 协方差矩阵 ${V（V）}_{单位 d日}$ 取决于3个未知参数， $θ_{1} = σ_{单位 1}^{2}$ , $θ_{2} = σ_{单位 2}^{2}$ 和 $θ_{三} = ρ_{单位}$ ，即。

{V（V）}_{单位 d日} = (\begin{matrix} σ_{单位 1}^{2} & ρ_{单位} σ_{单位 1} σ_{单位 2} \\ ρ_{单位} σ_{单位 1} σ_{单位 2} & σ_{单位 2}^{2} \end{matrix}) .

这个 $2 \times 2$ 协方差矩阵 ${V（V）}_{e（电子） d日 j}$ 取决于3个未知参数， $θ_{4} = σ_{e（电子） 1}^{2}$ , $θ_{5} = σ_{e（电子） 2}^{2}$ 和 $θ_{6} = ρ_{e（电子）}$ ，即。

{V（V）}_{e（电子） d日 j} = (\begin{matrix} σ_{e（电子） 1}^{2} & ρ_{e（电子）} σ_{e（电子） 1} σ_{e（电子） 2} \\ ρ_{e（电子）} σ_{e（电子） 1} σ_{e（电子） 2} & σ_{e（电子） 2}^{2} \end{matrix}) .

让 $我_{米}$ 成为 $米 \times 米$ 单位矩阵。我们定义 $2 {N个}_{d日} \times 1$ 向量 $年_{d日}$ 和 ${e（电子）}_{d日}$ ，的 $2 {N个}_{d日} \times 第页$ 矩阵 ${X（X）}_{d日}$ 和 $2 {N个}_{d日} \times 2$ 矩阵 ${Z轴}_{d日}$ ，即。

年_{d日} = \underset{1 \leq j \leq {N个}_{d日}}{科尔} (年_{d日 j}), {e（电子）}_{d日} = \underset{1 \leq j \leq {N个}_{d日}}{科尔} ({e（电子）}_{d日 j}), {X（X）}_{d日} = \underset{1 \leq j \leq {N个}_{d日}}{科尔} ({X（X）}_{d日 j}), {Z轴}_{d日} = \underset{1 \leq j \leq {N个}_{d日}}{科尔} (我_{2}) .

型号(4)可以以域级别的形式编写

年_{d日} = {X（X）}_{d日} β + {Z轴}_{d日} {单位}_{d日} + {e（电子）}_{d日}, d日 = 1, \dots, D类,

(5)

哪里 ${单位}_{d日} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ , ${e（电子）}_{d日} \sim {N个}_{2 {N个}_{d日}} (0, {V（V）}_{e（电子） d日})$ 是独立的，并且 ${V（V）}_{e（电子） d日} = {诊断}_{1 \leq j \leq {N个}_{d日}} ({V（V）}_{e（电子） d日 j})$ .矢量 $年_{d日}$ 独立于 $年_{d日} \sim {N个}_{2 {N个}_{d日}} (μ_{d日}, {V（V）}_{d日})$ , $μ_{d日} = {X（X）}_{d日} β$ 和 ${V（V）}_{d日} = {Z轴}_{d日} {V（V）}_{单位 d日} {Z轴}_{d日}^{'} + {V（V）}_{e（电子） d日}$ .

我们定义 $2 N个 \times 1$ 向量年和e（电子），的 $2 D类 \times 1$ 矢量单位，的 $2 N个 \times 第页$ 矩阵X（X）和 $2 N个 \times 2 D类$ 矩阵Z轴，即。

年 = \underset{1 \leq d日 \leq D类}{科尔} (年_{d日}), e（电子） = \underset{1 \leq d日 \leq D类}{科尔} ({e（电子）}_{d日}), 单位 = \underset{1 \leq d日 \leq D类}{科尔} ({单位}_{d日}), X（X） = \underset{1 \leq d日 \leq D类}{科尔} ({X（X）}_{d日}), Z轴 = \underset{1 \leq d日 \leq D类}{诊断} ({Z轴}_{d日}) .

型号(4)可以用线性混合模型形式书写

年 = X（X） β + Z轴 单位 + e（电子） .

(6)

哪里 $单位 \sim {N个}_{2 D类} (0, {V（V）}_{单位})$ , $e（电子） \sim {N个}_{2 N个} (0, {V（V）}_{e（电子） d日})$ 是独立的， ${V（V）}_{单位} = {诊断}_{1 \leq d日 \leq D类} ({V（V）}_{单位 d日})$ 和 ${V（V）}_{e（电子）} = {诊断}_{1 \leq d日 \leq D类} ({V（V）}_{e（电子） d日})$ .它认为 $年 \sim {N个}_{2 N个} (μ, V（V）)$ , $μ = X（X） β$ 和 $V（V） = Z轴 {V（V）}_{单位} {Z轴}^{'} + {V（V）}_{e（电子）}$ .

3.2. 示例模型

实际上，推理是基于样本进行的 $秒 = ⋃_{d日 = 1}^{D类} 秒_{d日}$ 的尺寸 $n个 = \sum_{d日 = 1}^{D类} {n个}_{d日}$ 从有限的人口中提取U型.我们写作 $U型 = 秒 \cup 第页$ 和 ${U型}_{d日} = 秒_{d日} \cup {第页}_{d日}$ 表示人口中抽样和非抽样部分。让 $年_{秒}$ 和 $年_{d日秒}$ 是的子向量年和 $年_{d日}$ 对应于样本元素和 $年_{第页}$ 和 $年_{d日第页}$ 的子向量年和 $年_{d日}$ 对应于样本外元素。在不缺乏通用性的情况下，我们可以对向量的组成部分进行排序年和 $年_{d日}$ 写 $年 = (年_{秒}^{'}, 年_{第页}^{'})^{'}$ 和 $年_{d日} = (年_{d日秒}^{'}, 年_{d日第页}^{'})^{'}$ .还定义了X（X）,Z轴, ${V（V）}_{e（电子）}$ ,V（V）和 ${X（X）}_{d日}$ , ${Z轴}_{d日}$ , ${V（V）}_{e（电子） d日}$ , ${V（V）}_{d日}$ 通过使用下标秒和第页本文假设在有限总体中进行推理的预测方法，如Valliant中所述等。[33]. 因此，我们假设样本索引是固定的，因此样本子向量 $年_{秒}$ 遵循从人口模型导出的模型(6). 也就是说，样本BNER模型是

年_{秒} = {X（X）}_{秒} β + {Z轴}_{秒} 单位 + {e（电子）}_{秒},

(7)

哪里 $单位 \sim {N个}_{2 D类} (0, {V（V）}_{单位})$ , ${e（电子）}_{秒} \sim {N个}_{2 n个} (0, {V（V）}_{e（电子）秒})$ 是独立的， ${V（V）}_{单位} = {诊断}_{1 \leq d日 \leq D类} ({V（V）}_{单位 d日})$ , ${V（V）}_{e（电子）秒} = {诊断}_{1 \leq d日 \leq D类} ({V（V）}_{e（电子） d日秒})$ 和 ${V（V）}_{e（电子） d日秒} = {诊断}_{1 \leq j \leq {n个}_{d日}} ({V（V）}_{e（电子） d日 j})$ .它认为 $年_{秒} \sim {N个}_{2 n个} (μ_{秒}, {V（V）}_{秒})$ , $μ_{秒} = {X（X）}_{秒} β$ 和 ${V（V）}_{秒} = {Z轴}_{秒} {V（V）}_{单位} {Z轴}_{秒}^{'} + {V（V）}_{e（电子）秒}$ 类似地，样本子向量 $年_{d日秒}$ 遵循衍生自的模型(5)，即。

年_{d日 秒} = {X（X）}_{d日 秒} β + {Z轴}_{d日 秒} {单位}_{d日} + {e（电子）}_{d日 秒}, d日 = 1, \dots, D类,

(8)

哪里 ${单位}_{d日} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ , ${e（电子）}_{d日秒} \sim {N个}_{2 {n个}_{d日}} (0, {V（V）}_{e（电子） d日秒})$ 都是独立的。向量 $年_{d日秒}$ 独立于 $年_{d日秒} \sim {N个}_{2 {n个}_{d日}} (μ_{d日秒}, {V（V）}_{d日秒})$ , $μ_{d日秒} = {X（X）}_{d日秒} β$ 和 ${V（V）}_{d日秒} = {Z轴}_{d日秒} {V（V）}_{单位 d日} {Z轴}_{d日秒}^{'} + {V（V）}_{e（电子） d日秒}$ .

在模型下(7)，的最佳线性无偏估计量（BLUE）β，以及的最佳线性无偏预测（BLUP）单位是

{\hat{β}}_{B类} = ({X（X）}_{秒}^{'} {V（V）}_{秒}^{- 1} {X（X）}_{秒})^{- 1} {X（X）}_{秒}^{'} {V（V）}_{秒}^{- 1} 年_{秒}, {\hat{单位}}_{B类} = {V（V）}_{单位} {Z轴}_{秒}^{'} {V（V）}_{秒}^{- 1} (年_{秒} - {X（X）}_{秒} {\hat{β}}_{B类}) .

(9)

而不是对 $2 {n个}_{d日} \times 2 {n个}_{d日}$ 矩阵 ${V（V）}_{d日秒} = {V（V）}_{e（电子） d日秒} + {Z轴}_{d日秒} {V（V）}_{单位 d日} {Z轴}_{d日秒}^{'}$ 当计算的蓝色β，应用公式计算效率更高

(A类 + B类 C类 D类)^{- 1} = {A类}^{- 1} - {A类}^{- 1} B类 ({C类}^{- 1} + D类 {A类}^{- 1} B类)^{- 1} D类 {A类}^{- 1},

(10)

具有 $A类 = {V（V）}_{e（电子） d日秒}$ , $B类 = {Z轴}_{d日秒}$ , $C类 = {V（V）}_{单位 d日}$ 和 $D类 = {Z轴}_{d日秒}^{'}$ .作为 ${Z轴}_{d日秒}^{'} {V（V）}_{e（电子） d日秒}^{- 1} {Z轴}_{d日秒} = \sum_{j = 1}^{{n个}_{d日}} {V（V）}_{e（电子） d日 j}^{- 1} = {n个}_{d日} {V（V）}_{e（电子） d日 j}^{- 1}$ 。我们获得

\begin{aligned} {V（V）}_{d日 秒}^{- 1} & = {V（V）}_{e（电子） d日 秒}^{- 1} - {V（V）}_{e（电子） d日 秒}^{- 1} {Z轴}_{d日 秒} ({V（V）}_{单位 d日}^{- 1} + {Z轴}_{d日 秒}^{'} {V（V）}_{e（电子） d日 秒}^{- 1} {Z轴}_{d日 秒})^{- 1} {Z轴}_{d日 秒}^{'} {V（V）}_{e（电子） d日 秒}^{- 1} \\ = {V（V）}_{e（电子） d日 秒}^{- 1} - {V（V）}_{e（电子） d日 秒}^{- 1} {Z轴}_{d日 秒} ({V（V）}_{单位 d日}^{- 1} + {n个}_{d日} {V（V）}_{e（电子） d日 j}^{- 1})^{- 1} {Z轴}_{d日 秒}^{'} {V（V）}_{e（电子） d日 秒}^{- 1} . \end{aligned}

哪里 ${V（V）}_{e（电子） d日秒}^{- 1} = {诊断}_{1 \leq j \leq {n个}_{d日}} ({V（V）}_{e（电子） d日 j}^{- 1})$ 新公式减少了计算负担，因为它只需要对 $2 \times 2$ 矩阵。

实际上，BLUP和BLUE不能作为向量计算θ模型参数未知。附录A给出了计算REML估计量的Fisher-scoring算法θ.让 $\hat{θ}$ 是…的估计量θ.通过堵塞 $\hat{θ}$ 在里面 ${V（V）}_{单位}$ 和 ${V（V）}_{e（电子）秒}$ ，我们得到 ${\hat{V（V）}}_{单位} = {V（V）}_{单位} (\hat{θ})$ , ${\hat{V（V）}}_{e（电子）秒} = {V（V）}_{e（电子）秒} (\hat{θ})$ 和 ${\hat{V（V）}}_{秒} = {Z轴}_{秒} {\hat{V（V）}}_{单位} {Z轴}_{秒}^{'} + {\hat{V（V）}}_{e（电子）秒}$ .通过替换 ${\hat{V（V）}}_{秒}$ 和 ${\hat{V（V）}}_{单位}$ 英寸(9)，我们得到了的经验BLUE（EBLUE）β以及单位，即。

\hat{β} = ({X（X）}_{秒}^{'} {\hat{V（V）}}_{秒}^{- 1} {X（X）}_{秒})^{- 1} {X（X）}_{秒}^{'} {\hat{V（V）}}_{秒}^{- 1} 年_{秒}, \hat{单位} = {\hat{V（V）}}_{单位} {Z轴}_{秒}^{'} {\hat{V（V）}}_{秒}^{- 1} (年_{秒} - {X（X）}_{秒} \hat{β}) .

(11)

替代公式为

\begin{aligned} \hat{β} & = {(\sum_{d日 = 1}^{D类} {X（X）}_{d日 秒}^{'} {\hat{V（V）}}_{d日 秒}^{- 1} {X（X）}_{d日 秒})}^{- 1} \sum_{d日 = 1}^{D类} {X（X）}_{d日 秒}^{'} {\hat{V（V）}}_{d日 秒}^{- 1} 年_{d日 秒}, \hat{单位} = \underset{1 \leq d日 \leq D类}{科尔} ({\hat{单位}}_{d日}), \\ {\hat{单位}}_{d日} & = {\hat{V（V）}}_{单位 d日} {Z轴}_{d日 秒}^{'} {\hat{V（V）}}_{d日 秒}^{- 1} (年_{d日 秒} - {X（X）}_{d日 秒} \hat{β}) . \end{aligned}

3.3. 领域平均值和比率的预测值

在BNER模型下(6)，此部分导出 $2 \times 1$ 平均向量 ${\bar{Y（Y）}}_{d日} = (1 / {N个}_{d日}) \sum_{j = 1}^{{N个}_{d日}} 年_{d日 j}$ 并介绍了域比率的插件预测程序 ${R（右）}_{d日} = {\bar{Y（Y）}}_{d日 1} / ({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})$ , $d日 = 1, \dots, D类$ .假设样本索引是固定的，则非样本子向量 $年_{d日第页}$ 遵循衍生自的模型(5)，即。

年_{d日 第页} = {X（X）}_{d日 第页} β + {Z轴}_{d日 第页} {单位}_{d日} + {e（电子）}_{d日 第页}, d日 = 1, \dots, D类,

哪里 ${单位}_{d日} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ , ${e（电子）}_{d日第页} \sim {N个}_{2 ({N个}_{d日} - {n个}_{d日})} (0, {V（V）}_{e（电子） d日第页})$ 是独立的，并且 ${V（V）}_{e（电子） d日第页} = {诊断}_{{n个}_{d日} + 1 \leq j \leq {N个}_{d日}} ({V（V）}_{e（电子） d日 j})$ .矢量 $年_{d日第页}$ 独立于 $年_{d日第页} \sim {N个}_{2 ({N个}_{d日} - {n个}_{d日})} (μ_{d日第页}, {V（V）}_{d日第页})$ , $μ_{d日第页} = {X（X）}_{d日第页} β$ , ${V（V）}_{d日第页} = {Z轴}_{d日第页} {V（V）}_{单位 d日} {Z轴}_{d日第页}^{'} + {V（V）}_{e（电子） d日第页}$ 此外 $年_{d日第页}$ 和 $年_{d日秒}$ 是

\begin{aligned} {V（V）}_{d日 第页 秒} & = 覆盖（cov） (年_{d日 第页}, 年_{d日 秒}) = 覆盖（cov） ({X（X）}_{d日 第页} β + {Z轴}_{d日 第页} {单位}_{d日} + {e（电子）}_{d日 第页}, {X（X）}_{d日 秒} β + {Z轴}_{d日 秒} {单位}_{d日} + {e（电子）}_{d日 秒}) \\ = {Z轴}_{d日 第页} 无功功率，无功功率 ({单位}_{d日}) {Z轴}_{d日 秒}^{'} = {Z轴}_{d日 第页} {V（V）}_{单位 d日} {Z轴}_{d日 秒}^{'} . \end{aligned}

的条件平均值 $年_{d日第页}$ ，给定样本数据 $年_{秒}$ ，是 $2 ({N个}_{d日} - {n个}_{d日}) \times 1$ 矢量

\begin{aligned} E类 [年_{d日 第页} | 年_{秒}] & = E类 [年_{d日 第页} | 年_{d日 秒}] = μ_{d日 第页} + {V（V）}_{d日 第页 秒} {V（V）}_{d日 秒}^{- 1} (年_{d日 秒} - μ_{d日 秒}) = {X（X）}_{d日 第页} β + {Z轴}_{d日 第页} {V（V）}_{单位 d日} {Z轴}_{d日 秒}^{'} {V（V）}_{d日 秒}^{- 1} (年_{d日 秒} - {X（X）}_{d日 秒} β) \\ = {X（X）}_{d日 第页} β + {Z轴}_{d日 第页} {V（V）}_{单位 d日} {Z轴}_{d日 秒}^{'} {{V（V）}_{e（电子） d日 秒}^{- 1} - {V（V）}_{e（电子） d日 秒}^{- 1} {Z轴}_{d日 秒} ({V（V）}_{单位 d日}^{- 1} + {n个}_{d日} {V（V）}_{e（电子） d日 j}^{- 1})^{- 1} {Z轴}_{d日 秒}^{'} {V（V）}_{e（电子） d日 秒}^{- 1}} (年_{d日 秒} - {X（X）}_{d日 秒} β) . \end{aligned}

对于以下计算，我们注意到

{Z轴}_{d日 秒}^{'} {V（V）}_{e（电子） d日 秒}^{- 1} (年_{d日 秒} - {X（X）}_{d日 秒} β) = \sum_{j = 1}^{{n个}_{d日}} {V（V）}_{e（电子） d日 j}^{- 1} (年_{d日 j} - {X（X）}_{d日 j} β) .

如果 ${n个}_{d日} > 0$ 和 $j \in {第页}_{d日}$ , $j > {n个}_{d日}$ ，然后是条件 $2 \times 1$ 平均向量为

\begin{aligned} E类 [年_{d日 j} | 年_{d日 秒}] & = {X（X）}_{d日 j} β + {V（V）}_{单位 d日} {Z轴}_{d日 秒}^{'} {{V（V）}_{e（电子） d日 秒}^{- 1} - {V（V）}_{e（电子） d日 秒}^{- 1} {Z轴}_{d日 秒} ({V（V）}_{单位 d日}^{- 1} + {n个}_{d日} {V（V）}_{e（电子） d日 j}^{- 1})^{- 1} {Z轴}_{d日 秒}^{'} {V（V）}_{e（电子） d日 秒}^{- 1}} (年_{d日 秒} - {X（X）}_{d日 秒} β) \\ = {X（X）}_{d日 j} β + {V（V）}_{单位 d日} {我_{2} - {n个}_{d日} {V（V）}_{e（电子） d日 j}^{- 1} ({V（V）}_{单位 d日}^{- 1} + {n个}_{d日} {V（V）}_{e（电子） d日 j}^{- 1})^{- 1}} \sum_{j = 1}^{{n个}_{d日}} {V（V）}_{e（电子） d日 j}^{- 1} (年_{d日 j} - {X（X）}_{d日 j} β) . \end{aligned}

我们有

{\hat{年}}_{d日 秒}^{e（电子） b条} = 年_{d日 秒}, {\hat{年}}_{d日 第页}^{e（电子） b条} = \hat{E类} [年_{d日 第页} | 年_{d日 秒}] = {X（X）}_{d日 第页} \hat{β} + {Z轴}_{d日 第页} {\hat{V（V）}}_{单位 d日} {Z轴}_{d日 秒}^{'} {\hat{V（V）}}_{d日 秒}^{- 1} (年_{d日 秒} - {X（X）}_{d日 秒} \hat{β}),

或同等标准， ${\hat{年}}_{d日 j}^{e（电子） b条} = 年_{d日 j}$ 如果 $j \in 秒_{d日}$ 和 ${\hat{年}}_{d日 j}^{e（电子） b条} = \hat{E类} [年_{d日 j} | 年_{d日秒}]$ 如果 $j \in {第页}_{d日}$ ，其中

\hat{E类} [年_{d日 j} | 年_{d日 秒}] = {X（X）}_{d日 j} \hat{β} + {\hat{V（V）}}_{单位 d日} {我_{2} - {n个}_{d日} {\hat{V（V）}}_{e（电子） d日 j}^{- 1} ({\hat{V（V）}}_{单位 d日}^{- 1} + {n个}_{d日} {\hat{V（V）}}_{e（电子） d日 j}^{- 1})^{- 1}} \sum_{j = 1}^{{n个}_{d日}} {\hat{V（V）}}_{e（电子） d日 j}^{- 1} (年_{d日 j} - {X（X）}_{d日 j} \hat{β}) .

的EBLUP ${\bar{Y（Y）}}_{d日}$ 是

\begin{aligned} {\hat{\bar{Y（Y）}}}_{d日}^{e（电子） b条} & = ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条})^{'} = \frac{1}{{N个}_{d日}} \sum_{j = 1}^{{N个}_{d日}} {\hat{年}}_{d日 j}^{e（电子） b条} = \frac{1}{{N个}_{d日}} \sum_{j = 1}^{{n个}_{d日}} 年_{d日 j} + \frac{1}{{N个}_{d日}} \sum_{j = {n个}_{d日} + 1}^{{N个}_{d日}} {{X（X）}_{d日 j} \hat{β} + {\hat{单位}}_{d日}} \\ = {（f）}_{d日} {\hat{\bar{Y（Y）}}}_{d日} + \frac{1}{{N个}_{d日}} \sum_{j = 1}^{{N个}_{d日}} {{X（X）}_{d日 j} \hat{β} + {\hat{单位}}_{d日}} - {（f）}_{d日} \frac{1}{{n个}_{d日}} \sum_{j = 1}^{{n个}_{d日}} {{X（X）}_{d日 j} \hat{β} + {\hat{单位}}_{d日}} \\ = (1 - {（f）}_{d日}) [{\bar{X（X）}}_{d日} \hat{β} + {\hat{单位}}_{d日}] + {（f）}_{d日} [{\hat{\bar{Y（Y）}}}_{d日} + ({\bar{X（X）}}_{d日} - {\hat{\bar{X（X）}}}_{d日}) \hat{β}] . \end{aligned}

(12)

哪里 ${\hat{\bar{Y（Y）}}}_{d日} = (1 / {n个}_{d日}) \sum_{j = 1}^{{n个}_{d日}} 年_{d日 j}$ , ${\hat{\bar{X（X）}}}_{d日} = (1 / {n个}_{d日}) \sum_{j = 1}^{{n个}_{d日}} {X（X）}_{d日 j}$ , ${（f）}_{d日} = {n个}_{d日} / {N个}_{d日}$ .比率的插件预测器 ${R（右）}_{d日} = {\bar{Y（Y）}}_{d日 1} / ({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})$ 是

{\hat{R（右）}}_{d日}^{我 n个} = \frac{{\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}}{{\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} + {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}} .

(13)

如果 ${n个}_{d日} = 0$ 和 $j \in {第页}_{d日}$ ，然后 ${第页}_{d日} = {U型}_{d日}$ 和条件 $2 \times 1$ 平均向量为 $E类 [年_{d日 j} | 年_{秒}] = {X（X）}_{d日 j} β$ 在这种情况下 ${\bar{Y（Y）}}_{d日}$ 是综合估计器 ${\bar{Y（Y）}}_{d日}^{秒年 n个} = {\bar{X（X）}}_{d日} \hat{β}$ ，使用 ${\bar{X（X）}}_{d日} = (1 / {N个}_{d日}) \sum_{j = 1}^{{N个}_{d日}} {x个}_{d日 j}$ .

4.MSE估计

普拉萨德和拉奥[28]给出了EBLUP的MSE近似值 ${X（X）}_{d日} β + {Z轴}_{d日} {单位}_{d日}$ 在单变量净入学率模型下，使用亨德森方法3估计方差分量参数。达塔和拉希里[10]扩展了Prasad和Rao的结果[28]一般纵向模型的情况。他们进一步考虑了方差分量的ML和REML估计。对于一般线性混合模型，Das等。[7]当采用REML或最大似然拟合方法时，导出了EBLUP的MSE。他们的证明包含Datta和Lahiri考虑的一般纵向模型[10]作为一种特殊情况。然而，这三篇论文都没有研究中定义的平均向量的EBLUP的均方交叉误差矩阵的近似(12). 尽管如此，BNER模型(6)可以用Das考虑的一般线性混合模型的形式编写等。[7]，该文不涉及均方交叉误差矩阵的近似。这就是为什么附录B给出了近似和估算MSE的数学推导 ${\hat{\bar{Y（Y）}}}_{d日}^{e（电子） b条}$ 和 ${\hat{R（右）}}_{d日}^{我 n个}$ 获得的MSE估计值如下所示。

4.1. 域平均EBLUP的MSE

让我们定义 ${T型}_{d日秒} = {V（V）}_{单位 d日} - {V（V）}_{单位 d日} {Z轴}_{d日秒}^{'} {V（V）}_{d日秒}^{- 1} {Z轴}_{d日秒} {V（V）}_{单位 d日}$ , $问_{秒} = ({X（X）}_{秒}^{'} {V（V）}_{秒}^{- 1} {X（X）}_{秒})^{- 1}$ 和

{\hat{\bar{X（X）}}}_{d日 秒} = \sum_{j = 1}^{{n个}_{d日}} {V（V）}_{e（电子） d日 j}^{- 1} {X（X）}_{d日 j}, {\bar{X（X）}}_{d日 第页} = 诊断 ({\bar{X（X）}}_{d日 1 第页}, {\bar{X（X）}}_{d日 2 第页}), {\bar{X（X）}}_{d日 k个 第页} = \frac{1}{{N个}_{d日} - {n个}_{d日}} \sum_{j = {n个}_{d日} + 1}^{{N个}_{d日}} {x个}_{d日 j k个}, k个 = 1, 2

预测时 ${\bar{Y（Y）}}_{d日}$ 具有 ${\hat{\bar{Y（Y）}}}_{d日}^{e（电子） b条}$ ，我们使用MSE矩阵估计器

米 秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日}^{e（电子） b条}) = (\begin{matrix} 米 秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}) & 米 秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}) \\ 米 秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}) & 米 秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}) \end{matrix}) = 克_{1} (\hat{θ}) + 克_{2} (\hat{θ}) + 2 克_{三} (\hat{θ}) + 克_{4} (\hat{θ}),

(14)

哪里

\begin{aligned} 克_{1} (θ) & = (1 - {（f）}_{d日})^{2} {{V（V）}_{单位 d日} - {n个}_{d日} {V（V）}_{单位 d日} {V（V）}_{e（电子） d日 j}^{- 1} {V（V）}_{单位 d日} + {n个}_{d日}^{2} {V（V）}_{单位 d日} {V（V）}_{e（电子） d日 j}^{- 1} {T型}_{d日 秒} {V（V）}_{e（电子） d日 j}^{- 1} {V（V）}_{单位 d日}}, \\ 克_{2} (θ) & = (1 - {（f）}_{d日})^{2} [{\bar{X（X）}}_{d日 第页} - {T型}_{d日 秒} {\hat{\bar{X（X）}}}_{d日 秒}] 问_{秒} [{\bar{X（X）}}_{d日 第页} - {T型}_{d日 秒} {\hat{\bar{X（X）}}}_{d日 秒}]^{'} . \\ 克_{三} (θ) & = (信托收据 {(\nabla {b条}_{{k个}_{1}}^{'}) {V（V）}_{秒} (\nabla {b条}_{{k个}_{2}}^{'})^{'} E类 [(\hat{θ} - θ) (\hat{θ} - θ)^{'}]})_{{k个}_{1}, {k个}_{2} = 1, 2}, (\nabla {b条}_{k个}^{'}) = \underset{1 \leq ℓ \leq 6}{科尔} {(\frac{\partial {b条}_{我}^{'}}{\partial θ_{ℓ}})}_{6 \times 2 n个} . \\ 克_{4} (θ) & = \frac{1 - {（f）}_{d日}}{{N个}_{d日}} {V（V）}_{e（电子） d日 j} . \end{aligned}

其中 $6 \times 6$ 矩阵 $E类 [(\hat{θ} - θ) (\hat{θ} - θ)^{'}]$ 可以通过输出近似 ${F类}^{- 1} (\hat{θ})$ 附录A中描述的REML-Fisher评分算法和 ${b条}^{'}$ 是

\frac{\partial {b条}^{'}}{\partial θ_{ℓ}} = (\begin{matrix} \frac{\partial {b条}_{1}^{'}}{\partial θ_{ℓ}} \\ \frac{\partial {b条}_{2}^{'}}{\partial θ_{ℓ}} \end{matrix}) = (1 - {（f）}_{d日}) {{V（V）}_{单位 d日 ℓ} {Z轴}_{d日 秒}^{'} {V（V）}_{d日 秒}^{- 1} - {V（V）}_{单位 d日} {Z轴}_{d日 秒}^{'} {V（V）}_{d日 秒}^{- 1} {Z轴}_{d日 秒} {V（V）}_{单位 d日 ℓ} {Z轴}_{d日 秒}^{'} {V（V）}_{d日 秒}^{- 1}}, ℓ = 1, 2, 三,

和

\frac{\partial {b条}^{'}}{\partial θ_{ℓ}} = (\begin{matrix} \frac{\partial {b条}_{1}^{'}}{\partial θ_{ℓ}} \\ \frac{\partial {b条}_{2}^{'}}{\partial θ_{ℓ}} \end{matrix}) = - (1 - {（f）}_{d日}) {V（V）}_{单位 d日} {Z轴}_{d日 秒}^{'} {V（V）}_{d日 秒}^{- 1} \underset{1 \leq j \leq {n个}_{d日}}{诊断} ({V（V）}_{e（电子） d日 j ℓ}) {V（V）}_{d日 秒}^{- 1}, ℓ = 4, 5, 6

矩阵的对角元素(14), $米秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条})$ 和 $米秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条})$ ，是的估算值 $M（M） S公司 E类 ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条})$ 和 $M（M） S公司 E类 ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条})$ 分别是。

4.2. 域比率插件预测器的MSE

比率的插件预测器 ${R（右）}_{d日} = {\bar{Y（Y）}}_{d日 1} / ({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})$ 是

{\hat{R（右）}}_{d日}^{我 n个} = \frac{{\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}}{{\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} + {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}} = （f） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}), （f） (年_{1}, 年_{2}) = \frac{年_{1}}{年_{1} + 年_{2}} .

MSE的近似值 ${\hat{R（右）}}_{d日}^{我 n个}$ 可以通过泰勒线性化得到。的一阶偏导数（f）是

\frac{\partial （f）}{\partial 年_{1}} = \frac{年_{2}}{(年_{1} + 年_{2})^{2}}, \frac{\partial （f）}{\partial 年_{2}} = \frac{- 年_{1}}{(年_{1} + 年_{2})^{2}},

的一阶泰勒展开 $（f） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条})$ 围绕 $({\bar{Y（Y）}}_{d日 1}, {\bar{Y（Y）}}_{d日 2})$ 是

\begin{aligned} {\hat{R（右）}}_{d日}^{我 n个} & = （f） ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}) \approx （f） ({\bar{Y（Y）}}_{d日 1}, {\bar{Y（Y）}}_{d日 2}) + \frac{\partial （f） ({\bar{Y（Y）}}_{d日 1}, {\bar{Y（Y）}}_{d日 2})}{\partial 年_{1}} ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 1}) \\ + \frac{\partial （f） ({\bar{Y（Y）}}_{d日 1}, {\bar{Y（Y）}}_{d日 2})}{\partial 年_{2}} ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 2}) \\ = {R（右）}_{d日} + \frac{{\bar{Y（Y）}}_{d日 2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{2}} ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 1}) - \frac{{\bar{Y（Y）}}_{d日 1}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{2}} ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 2}) . \end{aligned}

因此，我们得到了近似值

\begin{aligned} MSE公司 ({\hat{R（右）}}_{d日}^{我 n个}) & = E类 [({\hat{R（右）}}_{d日}^{我 n个} - {R（右）}_{d日})^{2}] \approx \frac{{\bar{Y（Y）}}_{d日 2}^{2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{4}} E类 [({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 1})^{2}] \\ + \frac{{\bar{Y（Y）}}_{d日 1}^{2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{4}} E类 [({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 2})^{2}] \\ - 2 \frac{{\bar{Y（Y）}}_{d日 1} {\bar{Y（Y）}}_{d日 2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{4}} E类 [({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 1}) ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条} - {\bar{Y（Y）}}_{d日 2})] \\ = \frac{{\bar{Y（Y）}}_{d日 2}^{2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{4}} MSE公司 ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}) + \frac{{\bar{Y（Y）}}_{d日 1}^{2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{4}} MSE公司 ({\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}) \\ - 2 \frac{{\bar{Y（Y）}}_{d日 1} {\bar{Y（Y）}}_{d日 2}}{({\bar{Y（Y）}}_{d日 1} + {\bar{Y（Y）}}_{d日 2})^{4}} M（M） S公司 E类 ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}), \end{aligned}

(15)

哪里 $M（M） S公司 E类 ({\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}, {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条})$ 是矩阵的非对角元素。

预测时 ${R（右）}_{d日}$ 具有 ${\hat{R（右）}}_{d日}^{我 n个}$ ，我们使用MSE估计器 $米秒 e（电子） ({\hat{R（右）}}_{d日}^{我 n个})$ 作为近似值的插件估计量获得(15). 也就是说，我们用矩阵的相应分量代替每个MSE $米秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日}^{e（电子） b条})$ 在中给出(14). 类似地，附录C给出了插入式预测器的MSE的估计量 ${\hat{问}}_{d日}^{我 n个} = {\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条} / {\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}$ 商数的 $问_{d日} = {\bar{Y（Y）}}_{d日 1} / {\bar{Y（Y）}}_{d日 2}$ .

5.模拟

5.1. 模拟1

仿真1的目标是检查REML算法在拟合BNER模型时的行为(8). 我们接受 ${第页}_{1} = {第页}_{2} = 2$ ,第页 = 4, $β_{1} = (β_{11}, β_{12})^{'} = (1, 1)^{'}$ , $β_{2} = (β_{21}, β_{22})^{'} = (1, 1)^{'}$ ，对于 $d日 = 1, \dots, D类$ , $j = 1, \dots, {n个}_{d日}$ ，生成 ${X（X）}_{d日 j} = 诊断 ({x个}_{d日 j 1}, {x个}_{d日 j 2})_{2 \times 4}$ ，其中 ${x个}_{d日 j 1} = ({x个}_{d日 j 11}, {x个}_{d日 j 12})$ , ${x个}_{d日 j 2} = ({x个}_{d日 j 21}, {x个}_{d日 j 22})$ , ${x个}_{d日 j 11} = {x个}_{d日 j 21} = 1$ , ${x个}_{d日 j 12} \sim U型 (2, 4)$ 和 ${x个}_{d日 j 22} \sim U型 (2, 5)$ .我们接受 $θ_{1} = 0.75$ , $θ_{2} = 1$ , $θ_{4} = 0.50$ , $θ_{5} = 0.75$ 和 $θ_{三} = - 0.8$ , $θ_{6} = 0.8$ 。对于 $d日 = 1, \dots, D类$ ，模拟 ${单位}_{d日} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ 和 ${e（电子）}_{d日 j} \sim {N个}_{2} (0, {V（V）}_{e（电子） d日 j})$ ，其中

{V（V）}_{单位 d日} = (\begin{matrix} θ_{1} & θ_{三} \sqrt{θ_{1}} \sqrt{θ_{2}} \\ θ_{三} \sqrt{θ_{1}} \sqrt{θ_{2}} & θ_{2} \end{matrix}), {V（V）}_{e（电子） d日} = (\begin{matrix} θ_{4} & θ_{6} \sqrt{θ_{4}} \sqrt{θ_{5}} \\ θ_{6} \sqrt{θ_{4}} \sqrt{θ_{5}} & θ_{5} \end{matrix}),

模拟1的步骤如下

生成 ${x个}_{d日 j k个}$ , $d日 = 1, \dots, D类$ , $j = 1, \dots, {n个}_{d日}$ ,k个 = 1, 2.
重复我=10三次(我=1,…,10三)
- （2.1）生成 ${单位}_{d日}^{(我)} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ , ${e（电子）}_{d日}^{(我)} \sim {N个}_{2 {n个}_{d日}} (0, {V（V）}_{e（电子） d日})$ , $年_{d日}^{(我)} = {X（X）}_{d日} β + {Z轴}_{d日} {单位}_{d日}^{(我)} + {e（电子）}_{d日}^{(我)}$ , $d日 = 1, \dots, D类$ .
- （2.2）对于每个 $η \in {β_{11}, β_{12}, β_{21}, β_{22}, θ_{1}, \dots, θ_{6}}$ ，计算REML估计值 ${\hat{η}}^{(我)} \in {{\hat{β}}_{11}^{(我)}, {\hat{β}}_{12}^{(我)}, {\hat{β}}_{21}^{(我)}, {\hat{β}}_{22}^{(我)}, {\hat{θ}}_{1}^{(我)}, \dots, {\hat{θ}}_{6}^{(我)}}$ .
输出：
$RMSE公司 (\hat{η}) = {(\frac{1}{我} \sum_{我 = 1}^{我} ({\hat{η}}^{(我)} - η)^{2})}^{1 / 2}, BIAS公司 (\hat{η}) = \frac{1}{我} \sum_{我 = 1}^{我} ({\hat{η}}^{(我)} - η),$

表格1和2给出了仿真结果。列标记为η包含真实模型参数的值。仿真1表明，REML-Fisher评分算法工作正常，因为BIAS和RMSE随着 ${n个}_{d日}$ 或D类增加。

表1。

$BIAS公司 (\hat{η})$ （左）和 $RMSE公司 (\hat{η})$ （右）带有 ${n个}_{d日} = 10$ .

	η	D类 = 25	D类 = 50	D类 = 100	D类 = 200	D类 = 25	D类 = 50	D类 = 100	D类 = 200
$β_{11}$	1	−0.0164	0.0145	0.0101	0.0036	0.2269	0.1585	0.1129	0.0795
$β_{12}$	1	−0.0015	0.0006	−0.0002	−0.0002	0.0486	0.0319	0.0221	0.0171
$β_{21}$	1	0.0330	−0.0042	−0.0106	−0.0006	0.2283	0.1744	0.1204	0.0886
$β_{22}$	1	0.0003	−0.0017	0.0011	−0.0007	0.0386	0.0290	0.0198	0.0137
$θ_{1}$	0.75	−0.0027	0.0161	−0.0123	0.0026	0.1965	0.1720	0.1062	0.0818
$θ_{2}$	1	−0.0289	0.0034	−0.0197	−0.0066	0.2935	0.2143	0.1345	0.1094
$θ_{4}$	0.5	−0.0008	−0.0019	−0.0009	−0.0013	0.0428	0.0339	0.0233	0.0153
$θ_{5}$	0.75	0.0031	0.0018	−0.0004	−0.0009	0.0670	0.0534	0.0341	0.0263
$θ_{三}$	−0.8	0.0075	0.0045	−0.0002	0.0030	0.0937	0.0770	0.0498	0.0308
$θ_{6}$	0.8	−0.0019	−0.0004	0	0	0.0254	0.0179	0.0124	0.0084

在单独的窗口中打开

表2。

$BIAS公司 (\hat{η})$ （左）和 $RMSE公司 (\hat{η})$ （右）带有D类 = 25

	η	${n个}_{d日} = 10$	${n个}_{d日} = 25$	${n个}_{d日} = 50$	${n个}_{d日} = 100$	${n个}_{d日} = 10$	${n个}_{d日} = 25$	${n个}_{d日} = 50$	${n个}_{d日} = 100$
$β_{11}$	1	−0.0164	0.0051	−0.0266	0.0097	0.2269	0.1882	0.1887	0.1755
$β_{12}$	1	−0.0015	−0.0007	0.0018	−0.0012	0.0486	0.0294	0.0191	0.0141
$β_{21}$	1	0.0330	0.0108	0.0303	0.0030	0.2283	0.2351	0.2133	0.1987
$β_{22}$	1	0.0003	−0.0006	−0.0008	−0.0010	0.0386	0.0249	0.0175	0.0119
$θ_{1}$	0.75	−0.0027	0.0047	−0.0048	0.0305	0.1965	0.2267	0.2235	0.2172
$θ_{2}$	1	−0.0289	0.0269	0.0058	0.0276	0.2935	0.3193	0.2797	0.2774
$θ_{4}$	0.5	−0.0008	−0.0003	−0.0012	−0.0010	0.0428	0.0291	0.0195	0.0136
$θ_{5}$	0.75	0.0031	−0.0020	−0.0006	0.0001	0.0670	0.0422	0.0293	0.0214
$θ_{三}$	−0.8	0.0075	0.0063	−0.0060	−0.0023	0.0937	0.0899	0.0816	0.0876
$θ_{6}$	0.8	−0.0019	−0.0005	−0.0002	0.0002	0.0254	0.0149	0.0108	0.0066

在单独的窗口中打开

如果域样本大小都等于10，并且域的数量从25增加到200，表1表明所有估计器的RMSE均减小。如果域数为D类 = 25，实际值很小，表2表明 ${n个}_{d日}$ 有助于估计矢量方差分量的参数 ${e（电子）}_{d日}$ 随机误差，但不是矢量的相应参数 ${单位}_{d日}$ 随机效应。

5.2. 模拟2

仿真2的目标是研究BNER模型下域预测因子的行为(5). 为了产生人口，我们采取 ${N个}_{d日} = 200$ , $d日 = 1, \dots, D类$ ，所以N个 = 200D类所有单位（人口）和选定单位（样本）的集合为

U型 = {{单位}_{d日 j} : d日 = 1, \dots, D类, j = 1, \dots, {N个}_{d日}}, 秒 = {{单位}_{d日 j} : d日 = 1, \dots, D类, j = 1, \dots, {n个}_{d日}} \subset U型 .

对于每个 ${单位}_{d日 j} \in U型$ ，我们以与模拟1中相同的方式生成辅助变量。模拟2的步骤如下

生成 ${x个}_{d日 j k个}$ , $d日 = 1, \dots, D类$ , $j = 1, \dots, {N个}_{d日}$ ,k个 = 1, 2. 构建人口矩阵 ${X（X）}_{d日}$ 和 ${Z轴}_{d日}$ 尺寸的 $2 {N个}_{d日} \times 第页$ 和 $2 {N个}_{d日} \times 2$ 分别是。
重复我=104次(我=1,…,104)
- （2.1）生成种群随机向量 ${单位}_{d日}^{(我)} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ , ${e（电子）}_{d日 j}^{(我)} \sim {N个}_{2} (0, {V（V）}_{e（电子） d日 j})$ 和 $年_{d日 j}^{(我)} = {X（X）}_{d日 j} β + {单位}_{d日}^{(我)} + {e（电子）}_{d日 j}^{(我)}$ , $d日 = 1, \dots, D类$ $j = 1, \dots, {N个}_{d日}$ .
- （2.2）计算域平均值和比率，即。
  $η_{d日 k个}^{(我)} = {\bar{Y（Y）}}_{d日 k个}^{(我)} = \frac{1}{{N个}_{d日}} \sum_{j = 1}^{{N个}_{d日}} 年_{d日 j k个}^{(我)}, η_{d日三}^{(我)} = {R（右）}_{d日}^{(我)} = \frac{{\bar{Y（Y）}}_{d日 1}^{(我)}}{{\bar{Y（Y）}}_{d日 1}^{(我)} + {\bar{Y（Y）}}_{d日 2}^{(我)}}, d日 = 1, \dots, D类, k个 = 1, 2$
- （2.3）提取样品 $(年_{d日 j}, {X（X）}_{d日 j})$ , $d日 = 1, \dots, D类$ , $j = 1, \dots, {n个}_{d日}$ .
- （2.4）计算REML估计量 ${\hat{β}}_{11}^{(我)}, {\hat{β}}_{12}^{(我)}, {\hat{β}}_{21}^{(我)}, {\hat{β}}_{22}^{(我)}, {\hat{θ}}_{1}^{(我)}, \dots, {\hat{θ}}_{6}^{(我)}$ .
- （2.5）计算 ${\bar{Y（Y）}}_{d日 k个}^{(我)}$ 和插件比率预测器 ${R（右）}_{d日}^{(我)}$ ，即。
  ${\hat{η}}_{d日 k个}^{(我)} = {\hat{\bar{Y（Y）}}}_{d日 k个}^{e（电子） b条 (我)}, {\hat{η}}_{d日三}^{(我)} = {\hat{R（右）}}_{d日}^{我 n个 (我)}, d日 = 1, \dots, D类, k个 = 1, 2$
对于 $d日 = 1, \dots, D类$ 和k个 = 1、2、3，计算绝对绩效指标
$R（右） {E类}_{d日 k个} = {(\frac{1}{我} \sum_{我 = 1}^{我} ({\hat{η}}_{d日 k个}^{(我)} - η_{d日 k个}^{(我)})^{2})}^{1 / 2}, {B类}_{d日 k个} = \frac{1}{我} \sum_{我 = 1}^{我} ({\hat{η}}_{d日 k个}^{(我)} - η_{d日 k个}^{(我)}), {M（M）}_{d日 k个} = \frac{1}{我} \sum_{我 = 1}^{我} {\hat{η}}_{d日 k个}^{(我)},$
对于 $d日 = 1, \dots, D类$ ,k个 = 1、2、3，计算相关绩效指标
$\begin{aligned} R（右） R（右） {E类}_{d日 k个} & = \frac{R（右） {E类}_{d日 k个}}{{M（M）}_{d日 k个}} 100, R（右） {B类}_{d日 k个} = \frac{{B类}_{d日 k个}}{{M（M）}_{d日 k个}} 100, \\ R（右） R（右） {E类}_{k个} & = \frac{1}{D类} \sum_{d日 = 1}^{D类} R（右） R（右） {E类}_{d日 k个}, A类 R（右） {B类}_{k个} = \frac{1}{D类} \sum_{d日 = 1}^{D类} | R（右） {B类}_{d日 k个} | . \end{aligned}$

表三显示以下对象的仿真结果 ${\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}$ (k个 = 1), ${\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}$ (k个 = 2）和 ${\hat{R（右）}}_{d日}^{我 n个}$ (k个 = 3). 正如预期的那样，绩效指标随着样本量的增加而减少 ${n个}_{d日}$ 增加。但是，如果样本大小保持不变，并且域数保持不变D类偏倚增大，MSE减小较小。这是因为当D类增加。

表3。

$A类 R（右） {B类}_{k个}$ （左）和 $R（右） R（右） {E类}_{k个}$ （右）， $ρ_{单位} = - 0.8$ , $ρ_{e（电子）} = 0.8$ .

D类	k个	${n个}_{d日} = 10$	${n个}_{d日} = 25$	${n个}_{d日} = 50$	${n个}_{d日} = 100$	${n个}_{d日} = 10$	${n个}_{d日} = 25$	${n个}_{d日} = 50$	${n个}_{d日} = 100$
25	1	0.0343	0.0260	0.0161	0.0081	4.6486	3.0845	2.0983	1.2370
	2	0.0394	0.0254	0.0173	0.0110	5.0017	3.3268	2.2643	1.3389
	三	0.0221	0.0120	0.0076	0.0035	2.1821	1.3585	0.8987	0.5243
50	1	0.0331	0.0236	0.0179	0.0073	4.5547	3.0608	2.0938	1.2360
	2	0.0425	0.0265	0.0189	0.0093	4.9271	3.3193	2.2674	1.3411
	三	0.0192	0.0118	0.0071	0.0041	2.1727	1.3563	0.9019	0.5239
100	1	0.0358	0.0253	0.0179	0.0102	4.4957	3.0426	2.0841	1.2337
	2	0.0371	0.0263	0.0182	0.0112	4.8706	3.3010	2.2643	1.3392
	三	0.0186	0.0107	0.0073	0.0040	2.1592	1.3549	0.8997	0.5236
200	1	0.0350	0.0228	0.0156	0.0305	4.4750	3.0357	2.0810	1.2350
	2	0.0388	0.0263	0.0187	0.0316	4.8511	3.2984	2.2634	1.3419
	三	0.0215	0.0125	0.0076	0.0122	2.1552	1.3516	0.8980	0.5240

在单独的窗口中打开

数字5和6展示偏差箱线图 ${B类}_{d日 k个}$ 和root-MSE ${E类}_{d日 k个}$ 分别是。数据表明，这三个预测因子基本上是无偏的，并且根质谱随着样本量的增加而减少。此外，方差（而非偏差）是root-MSE的主要贡献因素。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0005_OB.jpg

在单独的窗口中打开

图5。

偏见 ${B类}_{d日 k个}$ , $d日 = 1, \dots, D类$ ,k个 = 1、2、3，带D类 = 25, $ρ_{单位} = - 0.8$ , $ρ_{e（电子）} = 0.8$ .

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0006_OB.jpg

在单独的窗口中打开

图6。

$R（右） {E类}_{d日 k个}$ , $d日 = 1, \dots, D类$ ,k个 = 1、2、3，带D类 = 25, $ρ_{单位} = - 0.8$ , $ρ_{e（电子）} = 0.8$ .

我们运行了新的模拟，以比较基于BNER模型的EBLUP和基于两个独立NER模型的EBluP。除以下情况外，所有模拟设置都保持不变 $θ_{三} = ρ_{单位}$ 和 $θ_{6} = ρ_{e（电子）}$ .在这种情况下 $ρ_{单位} = ρ_{e（电子）} = 0$ ，独立的净入学率模型生成数据。在所有剩余的情况下，BNER模型生成数据。我们运行Fisher评分算法来计算NER和BNER模型参数的REML估计量。表4给出了Fisher-scoring算法用于计算所有迭代中模型参数的REML估计量的模拟结果和计算时间的中位数（以秒为单位的c.time）。“预测值”列指示预测值所基于的模型（NER或BNER）。我们观察到，如果相关性 $ρ_{单位}$ 和 $ρ_{e（电子）}$ 具有不同的符号。在其余情况下，这两个过程的行为类似。另一方面，拟合两个独立的NER模型具有更低的计算成本。

表4。

的模拟结果D类 = 25和 ${n个}_{d日} = 50$ .

			$A类 R（右） {B类}_{k个}$			$R（右） R（右） {E类}_{k个}$
预测器	$ρ_{单位}$	$ρ_{e（电子）}$	k个 = 1	k个 = 2	k个 = 三	k个 = 1	k个 = 2	k个 = 三	c.时间（s）
净入学率	0	0	0.1363	0.1246	0.1278	2.1921	2.3107	1.7847	0.035
BNER公司			0.1372	0.1235	0.1273	2.1930	2.3117	1.7857	12.446
净入学率	−0.8	−0.8	0.1367	0.1441	0.1536	2.1805	2.3161	2.2886	0.035
BNER公司			0.1364	0.1456	0.1534	2.1839	2.3192	2.2914	12.418
净入学率	0.8	0.8	0.1203	0.1121	0.0636	2.1817	2.3228	0.8477	0.035
BNER公司			0.1206	0.1135	0.0620	2.1829	2.3265	0.8473	12.452
净入学率	0.8	−0.8	0.1329	0.1453	0.1762	2.1829	2.3123	2.4353	0.035
BNER公司			0.1372	0.1310	0.1623	2.1112	2.2586	2.3844	12.467
净入学率	−0.8	0.8	0.1246	0.1125	0.0676	2.1835	2.3224	0.9362	0.035
BNER公司			0.1096	0.1058	0.0627	2.1323	2.2509	0.9011	12.499

在单独的窗口中打开

5.3. 模拟3

模拟3的目标是研究BNER模型下EBLUP的MSE估计量的行为(5). 总体和样本数据以与模拟2中相同的方式生成。模拟3的步骤是

生成 ${x个}_{d日 j k个}$ , $d日 = 1, \dots, D类$ , $j = 1, \dots, {N个}_{d日}$ ,k个 = 1, 2. 构建人口矩阵 ${X（X）}_{d日 j}$ 尺寸的 $2 \times 第页$ .
采取 ${MSE公司}_{d日 k个} = (R（右） {E类}_{d日 k个})^{2}$ , $d日 = 1, \dots, D类$ ,k个 = 1、2、3，来自模拟2的输出。
重复我 = 200次(我=1,…,200)
- （3.1）生成种群随机向量 ${单位}_{d日}^{(我)} \sim {N个}_{2} (0, {V（V）}_{单位 d日})$ , ${e（电子）}_{d日 j}^{(我)} \sim {N个}_{2} (0, {V（V）}_{e（电子） d日 j})$ 和 $年_{d日 j}^{(我)} = {X（X）}_{d日 j} β + {单位}_{d日}^{(我)} + {e（电子）}_{d日 j}^{(我)}$ , $d日 = 1, \dots, D类$ $j = 1, \dots, {N个}_{d日}$ .
- （3.2）提取样品 $(年_{d日 j}, {X（X）}_{d日 j})$ , $d日 = 1, \dots, D类$ , $j = 1, \dots, {n个}_{d日}$ .
- （3.3）计算REML估计值 ${\hat{β}}_{11}^{(我)}, {\hat{β}}_{12}^{(我)}, {\hat{β}}_{21}^{(我)}, {\hat{β}}_{22}^{(我)}, {\hat{θ}}_{1}^{(我)}, \dots, {\hat{θ}}_{6}^{(我)}$ .
- （3.4）计算 $米秒 {e（电子）}_{d日 k个}^{(我)} = 米秒 e（电子） ({\hat{\bar{Y（Y）}}}_{d日 k个}^{e（电子） b条 (我)})$ ,k个 = 1、2和 $米秒 {e（电子）}_{d日三}^{(我)} = 米秒 e（电子） ({\hat{R（右）}}_{d日}^{我 n个 (我)})$ .
对于 $d日 = 1, \dots, D类$ ,k个 = 1、2、3，计算绝对绩效指标
$R（右） {E类}_{d日 k个} = {(\frac{1}{我} \sum_{我 = 1}^{我} (米秒 {e（电子）}_{d日 k个}^{(我)} - {MSE公司}_{d日 k个})^{2})}^{1 / 2}, {B类}_{d日 k个} = \frac{1}{我} \sum_{我 = 1}^{我} (米秒 {e（电子）}_{d日 k个}^{(我)} - {MSE公司}_{d日 k个}),$
对于 $d日 = 1, \dots, D类$ ,k个 = 1、2、3，计算相关绩效指标
$\begin{aligned} R（右） R（右） {E类}_{d日 k个} & = \frac{100 R（右） {E类}_{d日 k个}}{{MSE公司}_{d日 k个}}, R（右） {B类}_{d日 k个} = \frac{100 {B类}_{d日 k个}}{{MSE公司}_{d日 k个}}, \end{aligned}$
(16)

$\begin{aligned} R（右） R（右） {E类}_{k个} & = \frac{1}{D类} \sum_{d日 = 1}^{D类} R（右） R（右） {E类}_{d日 k个}, A类 R（右） {B类}_{k个} = \frac{1}{D类} \sum_{d日 = 1}^{D类} | R（右） {B类}_{d日 k个} | . \end{aligned}$
(17)

表5显示以下对象的仿真结果 ${\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}$ (k个 = 1), ${\hat{\bar{Y（Y）}}}_{d日 2}^{e（电子） b条}$ (k个 = 2）和 ${\hat{R（右）}}_{d日}^{我 n个}$ (k个 = 3). 我们获得了与模拟2中类似的结果。性能指标随着样本量的增加而减少 ${n个}_{d日}$ 增加。如果样本大小保持不变，并且域的数量D类偏倚增大，MSE减小较小。

表5。

$A类 R（右） {B类}_{k个}$ （左）和 $R（右） R（右） {E类}_{k个}$ （右）， $ρ_{单位} = - 0.8$ , $ρ_{e（电子）} = 0.8$ .

D类	k个	${n个}_{d日} = 10$	${n个}_{d日} = 25$	${n个}_{d日} = 50$	${n个}_{d日} = 100$	${n个}_{d日} = 10$	${n个}_{d日} = 25$	${n个}_{d日} = 50$	${n个}_{d日} = 100$
25	1	330.97	126.43	54.98	18.42	362.03	141.03	61.71	20.55
	2	337.20	128.91	56.14	18.35	369.30	143.86	62.93	20.53
	三	100.90	41.85	19.07	6.17	220.53	118.66	79.71	58.99
50	1	327.05	120.63	52.82	18.04	343.49	127.95	56.04	19.15
	2	333.46	122.57	54.24	18.36	350.65	130.10	57.55	19.51
	三	98.43	40.45	18.37	6.80	214.56	118.19	81.23	61.94
100	1	306.09	117.29	49.98	16.74	312.07	120.15	51.43	17.22
	2	311.92	119.28	50.62	17.16	317.90	122.19	52.08	17.64
	三	89.25	37.01	16.21	5.70	187.73	106.81	74.64	58.51
200	1	319.79	117.42	50.53	16.88	324.21	119.12	51.31	17.17
	2	327.10	119.47	51.24	17.21	331.55	121.22	52.03	17.49
	三	93.18	38.18	17.29	7.26	193.19	108.73	76.48	60.19

在单独的窗口中打开

作为表格5包含聚合信息，我们提供关于域级非相对性能度量（偏差和MSE）的信息。数字7和和88显示偏差的箱线图 ${B类}_{d日 k个}$ 和root-MSE ${E类}_{d日 k个}$ MSE估计值。数据表明，这三个预测因子具有正偏差，随着样本量的增加而减小。此外，偏差（而不是方差）给出了对MSE估计器的根MSE的主要贡献。坏消息是，引入的分析MSE估计器在样本量非常小的领域（例如。 ${n个}_{d日} \leq 25$ ). 这一事实为基于重采样程序的MSE估计值的研究打开了大门；例如，通过调整González-Manteiga的引导程序等。[14]多变量情况。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0007_OB.jpg

在单独的窗口中打开

图7。

偏见 ${B类}_{d日 k个}$ , $d日 = 1, \dots, D类$ ,k个 = 1、2、3，带D类 = 25, $ρ_{单位} = - 0.8$ , $ρ_{e（电子）} = 0.8$ .

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0008_OB.jpg

在单独的窗口中打开

图8。

$R（右） {E类}_{d日 k个}$ , $d日 = 1, \dots, D类$ ,k个 = 1、2、3，带D类 = 25, $ρ_{单位} = - 0.8$ , $ρ_{e（电子）} = 0.8$ .

6.西班牙家庭预算调查数据的应用

本节将开发的SAE方法应用于2016年SHBS的数据。第一步是将BNER模型拟合到目标向量 $(年_{d日 j 1}, 年_{d日 j 2})$ 包含家庭食品和非食品年度支出及辅助变量 ${x个}_{d日 j k个}$ , $d日 = 1, \dots, D类$ , $j = 1, \dots, {n个}_{d日}$ ,k个 = 1、2，见第节2变量收入和NCU被视为协变量，变量FC和农村被视为参考类别FC4和R0的因素。对于每个目标变量，表6给出了回归参数及其标准误差的估计。它还显示了渐近第页-检验假设的值 ${H（H）}_{0} : β_{k个第页} = 0$ .表7给出了方差和相关参数的估计及其 $95 %$ 渐近置信区间。该表显示，所有估计参数均显著大于零。我们注意到相关性 $ρ_{单位}$ 和 $ρ_{e（电子）}$ 显著大于零，因此 $年_{1}$ 和 $年_{2}$ 不合适。

表6。

拟合BNER模型的回归参数。

支出	变量	估算	z（z）-价值	标准误差	第页-价值
食物	拦截	0.02	1.54	0.01	0.12
	收入	0.53	38.17	0.01	0
	国立大学	0.02	38.91	0	0
	燃料电池1	0.05	9.29	0.01	0
	燃料电池2	−0.02	2.60	0.01	0.01
	燃料电池3	−0.03	7.71	0	0
非足部	拦截	0.31	8.74	0.04	0
	收入	6.89	105.94	0.07	0
	国立大学	0.04	27.01	0	0
	R1级	0.04	2.41	0.02	0.02

在单独的窗口中打开

表7。

方差和相关参数。

	估算	下限lim	上方.lim
$σ_{单位 1}^{2}$	0.002	0.001	0.003
$σ_{单位 2}^{2}$	0.025	0.014	0.037
$ρ_{单位}$	0.552	0.324	0.781
$σ_{e（电子） 1}^{2}$	0.057	0.056	0.058
$σ_{e（电子） 2}^{2}$	1.261	1.237	1.285
$ρ_{e（电子）}$	0.201	0.188	0.214

在单独的窗口中打开

图9（左）绘制了西班牙各省家庭年度食品支出的平均值。图9（右）绘制了估算的相对根质谱（RRMSE），单位为%。这一数字表明，自治区内的食品支出变化很大。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0009_OC.jpg

在单独的窗口中打开

图9。

手段 ${\hat{\bar{Y（Y）}}}_{d日 1}^{e（电子） b条}$ （左）及其相对根MS在西班牙各省家庭年度食品支出中所占百分比（右）。

图10（左）绘制了西班牙各省的家庭食品支出比例（%）。图10（右）以%为单位绘制相应的RRMSE。这里观察到的一个有趣的特点是，在一些自治区内，食品支出的百分比可能会有很大的变化。这主要发生在安达卢西亚自治区、阿拉贡自治区、卡斯蒂利亚·莱昂自治区或加利西亚自治区，那里有许多省份，其中一些省份的贫困程度高于其他省份。相比之下，还有其他地区，如加泰罗尼亚和巴斯克国家，估计比率的变异性较小。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0010_OC.jpg

在单独的窗口中打开

图10。

比率 ${\hat{R（右）}}_{d日}^{我 n个}$ 西班牙各省家庭年度食品支出的%（左）及其相对根-MSEs（右）。

为了便于比较，两个独立的净入学率模型均采用表中所示的相同辅助变量进行拟合6两个NER模型是错误的模型，因为我们假设拟合的BNER模型是真实模型。因此，在NER模型下使用EBLUP计算公式获得的预测值不是EBLUP，称为INDEP。

图11绘制直接、INDEP和EBLUP估计值 ${\bar{Y（Y）}}_{1}$ （左）和 ${\bar{Y（Y）}}_{2}$ （右）。域按样本大小排序，样本大小打印在OX轴上。该图显示，三个估计值遵循相同的模式，并且随着样本大小的增加而越来越接近，但INDEP和EBLUP的行为更平滑。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0011_OC.jpg

在单独的窗口中打开

图11。

直接和EBLUP估算。

图12绘制直接估计值的估计RRMSE和INDEP和EBLUP预测值 ${\bar{Y（Y）}}_{1}$ （左）和 ${\bar{Y（Y）}}_{2}$ （右）。和以前一样，域是按样本大小排序的。对于INDEP预测器的MSE的估计，我们使用估计器 $米秒 {e（电子）}_{k个}^{印度}$ ,k个 = 函数的1、2公式 $克_{1} - 克_{4}$ 例如，在《拉奥和莫利纳》第7章中有描述[29]. 我们记得，这些公式在这里是不正确的，因为假定的真实模型是BNER，而不是两个独立的边际NER模型。我们注意到，BLUP是线性参数的预测器，它在无偏预测器类中最小化了MSE，而EBLUP和REML估计量渐近地继承了这一性质。因此，EBLUP的MSE应小于BNER模型下INDEP预测因子的MSE。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0012_OC.jpg

在单独的窗口中打开

图12。

直接和EBLUP估算的RRMSE。

图12结果表明，EBLUP的RRMSE低于直接估计值，并且随着样本量的增加，RRMSE越来越接近。此外，它还表明 $米秒 {e（电子）}_{k个}^{印度}$ 低估了INDEP预测因子的MSE ${\bar{Y（Y）}}_{1}$ 和 ${\bar{Y（Y）}}_{2}$ 。这对从业者来说很有趣。如果我们不考虑这两个目标变量之间的相关性，我们可以很好地估计域数量，但我们无法估计MSE。

图13（左）绘制了食品支出比率的直接估计值、独立估计值和插件估计值，单位为%。图13（右）绘制直接估计器和插件预测器的估计RRMSE。比率直接估计量的最小均方误差是通过插入基于设计的协方差估计量来估计的(2)在公式中(15). 对于INDEP预测器，我们无法计算MSE，因为无法估计所需的协方差项（参见公式(15)). 该图表明，基于模型的插件估计器的RRMSE低于直接估计器，并且随着样本量的增加，RRMSE越来越接近。

保存图片、插图等的外部文件。对象名称为CJAS_A_1803809_F0013_OC.jpg

在单独的窗口中打开

图13。

比率的直接和插入式估计（左）及其估计的RRMSE（左）。

表格8和9给出了一些简明的数值结果。表格分两步构建。域按样本大小排序，从样本大小最小的域开始。从52个域中选择14个域 $1, 5, 9, \dots, 52$ 省的名称和代码用Prov和d日和样本大小n个.

表8。

估计 ${\bar{Y（Y）}}_{d日 1}$ , ${\bar{Y（Y）}}_{d日 2}$ 和 ${R（右）}_{d日}$ 和CI ${R（右）}_{d日}$ （单位：%）。

Prov（保护）	d日	n个	目录1	电子束1	目录2	电子束2	雷迪尔	Rin公司	Rin公司 $^{-}$	Rin公司 $^{+}$
瓜达拉哈拉	19	102	3999	4229	25591	25686	13.52	14.14	12.69	15.59
帕伦西亚	34	118	4357	4396	17893	19671	19.58	18.26	16.07	20.46
昆卡	16	123	3099	3480	19123	19505	13.95	15.14	13.13	17.15
欧伦塞	32	169	2926	3064	14691	16354	16.61	15.78	13.40	18.16
布尔戈斯	9	187	4666	4651	23492	23255	16.57	16.67	15.25	18.09
格拉纳达	18	198	3729	3841	21833	21545	14.59	15.13	13.62	16.64
阿尔巴塞特	2	249	3858	4075	21039	21250	15.49	16.09	14.63	17.55
皇城	13	355	3858	4018	20714	21085	15.70	16.01	14.64	17.37
蓬特韦德拉	36	463	4469	4451	23593	23197	15.93	16.10	14.95	17.25
科鲁尼亚，a	15	536	4145	4306	23429	23464	15.03	15.51	14.42	16.59
萨拉戈萨	50	678	4228	4410	23889	23436	15.04	15.84	14.82	16.86
坎塔布里亚	39	761	4014	4173	23536	23602	14.57	15.02	14.03	16.02
穆尔西亚	30	913	4347	4557	23379	23310	15.68	16.35	15.38	17.33
马德里	28	1653	4006	4094	28676	28021	12.26	12.75	12.04	13.46

在单独的窗口中打开

表9。

估计值的RRMSE ${\bar{Y（Y）}}_{d日 1}$ , ${\bar{Y（Y）}}_{d日 2}$ 和 ${R（右）}_{d日}$ （全部以%表示）。

Prov（保护）	d日	n个	目录1	电子束1	目录2	电子束2	雷迪尔	Rin公司
瓜达拉哈拉	19	102	11.13	6	11.42	4.89	12.51	5.22
巴伦西亚	34	118	10.48	5.55	10.83	6.21	11.49	6.12
昆卡	16	123	11.11	6.94	11.64	6.23	12.56	6.76
欧伦塞	32	169	9.12	7.31	9.65	7.01	10.56	7.67
布尔戈斯	9	187	9.86	4.68	8.66	4.83	10.19	4.34
格拉纳达	18	198	8.30	5.61	8.17	5.17	9.35	5.08
阿尔巴塞特	2	249	7.32	5	7.93	5.03	8.47	4.61
皇城	13	355	6.25	4.72	6.48	4.83	6.91	4.33
蓬特韦德拉	36	463	5.81	4.06	5.84	4.22	6.34	3.63
科鲁尼亚，a	15	536	5.35	4.10	5.50	4.10	5.95	3.56
萨拉戈萨	50	678	4.62	3.87	5.22	4.02	5.11	3.28
坎塔布里亚	39	761	4.28	4.03	4.32	3.93	4.93	3.38
穆尔西亚	30	913	4	3.61	4.19	3.92	4.62	3.02
马德里	28	1653	2.95	3.82	2.93	3.17	3.37	2.82

在单独的窗口中打开

表8介绍了对粮食和非粮食家庭平均支出的直接和基于模型的估计，以及各省粮食支出的相应比率。估计量由dir1、eb1、dir2、eb2、Rdir和Rin表示 ${R（右）}_{d日}$ （%）在Rin标记的列中 $^{-}$ 和Rin $^{+}$ 分别是。我们通过将标准正态性公式应用于插件估计值Rin及其RMSE来计算CI。该表显示，基于模型的估计遵循直接估计的模式，当样本量较大时，两种估计更接近。

表9给出了直接和基于模型的估计值的RRMSE ${\bar{Y（Y）}}_{d日 1}$ , ${\bar{Y（Y）}}_{d日 2}$ 和 ${R（右）}_{d日}$ RRMSE由dir1、eb1、dir2、eb2、Rdir和Rin标记。通过观察RRMSE的列，我们得出结论，基于模型的预测因子优于直接估计因子。

7.结论

本文介绍了基于BNER模型的支出方式和比率的小面积预测因子(4). 对于给定的域，基于BNER模型的线性域参数的EBLUP从辅助数据、其他域的数据和目标变量之间的相关性中借用强度。通过使用该模型，应用统计学家可以获得跨域和目标参数以平滑稳定形式表现的域参数估计。这通常被视为官方统计的良好属性。本文还对EBLUP的最小均方误差矩阵进行了近似，并引入了显式形式估计。

双变量单位级模型是根据两个目标变量推导指标小面积预测值的最合适模型。总和或平均数的比率是此类参数的典型示例。这些参数可以通过将单变量模型拟合到每个响应变量来估计。这种方法的缺点是没有考虑响应变量之间的相关性和领域平均值的EBLUP之间的相关性。

如果目标域参数是总计或平均值，那么基于“不正确”的单独NER模型的INDEP预测因子相对于基于“真实”BNER模型的EBLUP产生效率损失，主要是当随机效应和误差的相关性具有不同的符号时。否则，效率损失相当小。主要问题不是INDEP预测本身，而是基于错误模型的相应MSE估计。这些估计值表现得相当糟糕。当目标变量正相关时，它们往往会低估最小均方误差，就像实际数据应用中发生的那样。这是一个严重错误。

在目标域参数是比率的情况下，也可以使用INDEP比率估值器。然而，在独立的单变量模型下，无法构建比率估计器MSE的适当估计器。这个问题可以通过基于BNER模型EBLUP的插入式比率预测器来处理和解决。

进行了三个仿真实验，以实证研究和检查拟合算法、预测因子（EBLUP和插件）和MSE估计量的行为。仿真1研究了REML拟合算法的行为，并实证显示了模型参数的REML估计量的一致性。模拟2研究了当使用双变量模型而不是单变量模型时，EBLUP和插件预测因子的效率增益。结论是，基于BNER模型的预测因子(4)当随机效应和随机误差的相关性具有不同的符号时，优于基于两个独立NER模型的相应估计。仿真3实证表明，引入的MSE矩阵估计量的偏差和MSE随着样本量的增加而减小。

新的小面积估算方法应用于2016年SHBS的数据。目标是估计西班牙各省的粮食和非粮食家庭年度支出的平均数以及家庭年度支出比例。估计过程考虑了两个目标变量之间的相关性。本文还将基于模型的估计与应用直接Hajéck型估计得到的相应估计进行了比较，结果表明，引入的估计比直接估计具有更低的MSE。

就西班牙各省的支出结果而言，我们可以说，家庭年度食品支出平均值最高的省份主要位于西班牙北部。此外，我们可以得出结论，一些自治区内各省的食品支出比例不同，这有助于地区当局在各省实施不同的政策。

补充材料

Suppemental Material.pdf：

单击此处查看其他数据文件。^{（137K，pdf）}

资金筹措表

由经济与竞争部（MINECO）的拨款MTM2017-82724-R和PGC2018-096840-B-I00以及加利西亚咨询公司（Grupos de Referencia Competitiva ED431C-2016-015和Centro Singular de Investigación de Galicia ED431G/01）支持，所有这些都是通过ERDF提供的。

披露声明

提交人没有报告潜在的利益冲突。

工具书类

1Arima S.、Bell W.R.、Datta G.S.、Franco C.和Liseo B。，函数测量误差下小面积均值的多元Fay-Herriot Bayes估计,J.R.Stat.Soc.A公司 180（2017），第1191-1209页。doi:10.1111/rssa.12321[交叉参考][谷歌学者]

2Benavent R.和Morales D。，小面积估计的多元Fay-Herriot模型,计算。统计数据分析。 94（2016），第372-390页。doi:10.1016/j.csda.2015.07.013[交叉参考][谷歌学者]

三。Boubeta M、Lombardía M.J.和Morales D。，区域Poisson混合模型下的经验最佳预测,测试 25（2016），第548–569页。doi:10.1007/s11749-015-0469-8[交叉参考][谷歌学者]

4.Boubeta M、Lombardía M.J.和Morales D。，小区域贫困研究的泊松混合模型,计算。统计数据分析。 107（2017），第32-47页。doi:10.1016/j.csda.2016.10.014[交叉参考][谷歌学者]

5Chambers R.、Salvati N.和Tzavidis N。，二元结果的半参数小面积估计及其在英国地方当局失业估计中的应用,J.R.Stat.Soc.A公司 179（2016），第453-479页。doi:10.1111/rssa.12123[交叉参考][谷歌学者]

6Chandra H.、Salvati N.、Chambers R.和Tzavidis N。，空间非平稳条件下的小面积估计,计算。统计数据分析。 56（2012），第2875–2888页。doi:10.1016/j.csda.2012.02.006[交叉参考][谷歌学者]

7Das K.、Jiang J.和Rao J.N.K。，经验预测值的均方误差,Ann.统计。 32（2004），第818–840页。doi:10.1214/0090536040000002001[交叉参考][谷歌学者]

8Datta G.S.，第二天和Basawa I。，多元小面积估计中的经验最佳线性无偏和经验Bayes预测,J.统计。计划。推断 75（1999），第269-279页。doi:10.1016/S0378-3758（98）00147-5[交叉参考][谷歌学者]

9Datta G.S.、Fay R.E.和Ghosh M。，小面积估计中的层次和经验Bayes多元分析《人口普查局1991年年度研究会议记录》，美国人口普查局，华盛顿特区，1991年，第63-79页。

10Datta G.S.和Lahiri P。，小面积估计问题中估计的最佳线性无偏预报器不确定性的统一度量,统计师。西尼卡 10（2000），第613–627页。[谷歌学者]

11Esteban M.D.、Lombardía M.J.、López-Vizcaíno E.、Morales D.和Pérez a。，区域级成分混合模型下的比例小面积估计,测试(2020). doi:10.1007/s11749-019-00688-w[交叉参考][谷歌学者]

12Fay R.E。，多元回归在小域估计中的应用，英寸小区域统计R.Platek、J.N.K.Rao、C.E.Särndal和M.P.Singh编辑，John Wiley，纽约，1987年，第91–102页。

13.González-Manteiga W.、Lombardía M.J.、Molina I.、Morales D.和Santamaria L。，多元Fay-Herriot模型下预测误差的解析和自举近似,计算。统计数据分析。 52（2008），第5242–5252页。doi:10.1016/j.csda.2008.04.031[交叉参考][谷歌学者]

14González-Manteiga W.、Lombardía M.J.、Molina I.、Morales D.和Santamaria L。，小面积EBLUP的Bootstrap均方误差,J.统计计算。模拟。 78（2008），第443-462页。doi:10.1080/009496506011411[交叉参考][谷歌学者]

15.霍布扎·T·和莫拉莱斯·D·。，随机回归系数模型下的小面积估计,J.统计计算。模拟。 83（2013），第2160–2177页。doi:10.1080/00949655.2012.684094[交叉参考][谷歌学者]

16Hobza T.和Morales D。，单位水平logit混合模型下的经验最佳预测,J.关闭状态。 32（2016），第661-692页。doi:10.1515/jos-2016-0034[交叉参考][谷歌学者]

17Hobza T.、Morales D.和Santamaría L。，单位时间二项式混合模型下贫困比例的小面积估计,测试 27（2018），第270-294页。doi:10.1007/s11749-017-0545-3[交叉参考][谷歌学者]

18伊藤T.和久保川T。，多元嵌套误差回归模型中的经验最佳线性无偏预测因子,Commun公司。统计理论方法(2018). doi:10.1080/03610926.2019.1662048[交叉参考][谷歌学者]

19López-Vizcaíno E.、Lombardía M.J.和Morales D。，基于多项式的劳动力指标小面积估算,统计模型。 13（2013），第153-178页。doi:10.1177/1471082X13478873[交叉参考][谷歌学者]

20López-Vizcaíno E.、Lombardía M.J.和Morales D。，具有相关时间和面积效应的多项式模型下劳动力指标的小面积估计,J.R.统计协会A 178（2015），第535-565页。doi:10.1111/rssa.12085[交叉参考][谷歌学者]

21Marchetti S.和Secondi L。，使用小面积估算方法估算意大利省级家庭消费支出：使用购买力平价进行“实际”比较,社会指标。物件。 131（2017），第215-234页。doi:10.1007/s11205-016-1230-8[交叉参考][谷歌学者]

22莫利纳一世。，带对数变换的多元嵌套误差回归模型下的不确定性,J.多变量。分析。 100（2009），第963-980页。doi:10.1016/j.jmva.2008.09.007[交叉参考][谷歌学者]

23Molina I.、Saei A.和LombardíA M.J，多项式logit混合模型下劳动力参与的小面积估计,J.R.Stat.Soc.A公司 170（2007），第975-1000页。doi:10.1111/j.1467-985X.2007.00493.x[交叉参考][谷歌学者]

24莫拉莱斯·D·和桑塔马利亚·L·。，单元级时间线性混合模型下的小区域估计,J.Stat.计算。模拟。 89（2019年），第1592-1620页。doi:10.1080/00949655.2019.1590578[交叉参考][谷歌学者]

25Morales M.、Pagliarella M.C.和Salvatore R。，分区区域时间模型下贫困指标的小面积估算,统计操作。Res.事务处理。 39（2015），第19-34页。[谷歌学者]

26Ngaruye I.、Nzabanita J.、von Rosen D.和Singull M。，多变量线性模型下重复测量数据的小面积估计,Commun公司。统计理论方法 46)2017），第10835-10850页。doi:10.1080/03610926.2016.1248784[交叉参考][谷歌学者]

27.Porter A.T.、Wikle C.K.和Holan S.H。，基于潜在空间相关性的多元Fay-Herriot模型的小面积估计,澳大利亚。N.Z.J.统计。 57（2015），第15-29页。doi:10.1111/anzs.12101[交叉参考][谷歌学者]

28Prasad N.G.N.和Rao J.N.K。，小面积估计量均方误差的估计,J.Amer。统计师。协会。 85（1990年），第163-171页。doi:10.1080/01621459.1990.10475320[交叉参考][谷歌学者]

29Rao J.N.K.和Molina I。，小面积估算第二版，约翰·威利，霍博肯，纽约，2015[谷歌学者]

30Särndal C.E.、Swensson B.和Wretman J。，模型辅助调查抽样1992年，纽约施普林格。[谷歌学者]

31Tzavidis N.、Salvati N.、Pratesi M.和Chambers R。，M-分位数模型及其在贫困制图中的应用,统计方法应用。 17（2008），第393-411页。doi:10.1007/s10260-007-0070-8[交叉参考][谷歌学者]

32Ubaidillah A.、Notodiputro K.A.、Kurnia A.和Wayan I。，小面积估算的多元Fay-Herriot模型及其在印尼家庭人均消费支出中的应用,J.应用。斯达。 46（2019年），第2845-2861页。doi:10.1080/02664763.2019.1615420[交叉参考][谷歌学者]

33Valliant R.、Dorfman A.H.和Royall R.M。，有限总体抽样和推理。一种预测方法约翰·威利，纽约，2000年。[谷歌学者]

文章来自应用统计学杂志由提供泰勒和弗朗西斯