Unit-Lindley mixed-effect model for proportion data

Hatice Tul Kubra Akdur

doi:10.1080/02664763.2020.1823946

J应用统计。2021; 48(13-15): 2389–2405.

2020年9月24日在线发布。数字对象标识：10.1080/02664763.2020.1823946

预防性维修识别码：PMC9042183

PMID：35707078

比例数据的Unit-Lindley混合效应模型

Hatice Tul Kubra Akdur公司

作者信息版权和许可信息 PMC免责声明

摘要

最近，单位林德利分布及其相关回归模型被开发出来，作为贝塔回归模型的替代品，其单位区间内的结果是连续的 $(0, 1)$ 比例数据通常出现在具有层次结构的临床试验、经济学和社会研究中。在本研究中，提出了单位-林德利混合效应模型，并研究了用于参数估计的适当似然分析方法。对于混合效应模型中的聚类或纵向比例数据，全似然函数不具有闭合形式。本研究使用拉普拉斯和自适应高斯求积逼近方法获得了单位-林德利混合效应模型的参数估计。我们使用单位Lindley混合效应模型分析了巴西城市供水和污水不足家庭比例的数据集，该模型包括作为巴西联邦州的随机截距。分析结果表明，所提出的单位-林德利混合效应模型比单位-林德利回归模型和贝塔混合模型具有更好的拟合效果。此外，在模拟研究中，通过蒙特卡罗模拟研究，从偏差和均方误差方面评估和比较了近似方法估计的准确性。

关键词：比例数据、混合效应模型、似然近似、质量较差的家庭、单位林德利分布

1.简介

在医学、金融、社会和教育研究以及工程等许多研究领域，结果测量可以是以单位区间为界的比例、比率、分数或百分比 $(0, 1)$ 最近，单位林德利分布及其回归模型被提出作为贝塔回归模型的替代方案，贝塔回归是建模单位有界数据集的最常用方法[4,6]. 众所周知的回归模型，如高斯、logistic或泊松，可能不适合于这种比例数据。比例数据可能在受试者/实验单位的方差和依赖结构中表现出异质性，或者不满足正态假设。当数据违反标准线性回归模型的正态性假设时，通常建议进行转换，但这种做法可能会扭曲结果变量的概率属性。单位林德利分布是指数族。然而，它不属于自然指数族。根据文献研究，广义线性混合模型（GLMMs）或广义线性模型（GLMs）的分布通常为自然指数族，如logistic、poisson混合模型。在GLM和GLMM的背景下，单纯形分布是在最近的文献中发展起来的，但已知单纯形分布属于离散族，但不属于自然指数族[9]. 同时，基于非自然指数族的贝塔分布，为单位区间的层次数据提供了一类具有统计推断方法的贝塔混合模型 $(0, 1)$ [1]. 相关性结构通常出现在重复测量设计、纵向研究或任何其他形式的聚类抽样设计中。具有特定主题参数的模型能够处理同一主题内测量值之间的相关性，因此总可变性在主题内或主题群之间进行分解。GLMM既包括聚类/受试者的随机效应，也包括协变量对结果的固定效应，可用于对此类层次数据进行建模。因此，混合效应模型与固定效应模型的区别在于包含了特定于主题或集群的参数。在本研究中，主要重点是为响应变量开发一个混合效应模型，这些响应变量可以是集群或纵向抽样设计中有界单位区间（0，1）中的比例、分数或比率。本文旨在通过建立单位-林德利混合模型，采用基于似然的统计推断方法，并应用实际数据集，对单位区间内的响应变量进行建模。对于单位-林德利混合效应模型，通过近似边缘似然函数获得了模型参数的似然估计。GLMM的边缘似然函数通常包含难以处理的积分，而这种积分需要数值方法。为此，在积分随机效应以评估边缘似然函数时，采用拉普拉斯和自适应高斯求积（AGQ）近似方法。Mazucheli等人。[6]使用单位-林德利回归模型分析了巴西城市供水和污水不足的家庭比例与一些社会人口变量之间的关系，指出单位-林德利回归模型比贝塔回归模型更适合[6]. 作为自变量，分析中考虑了地区、预期寿命、人均收入和城市的人类发展指数[6]. 在本研究中，我们倾向于使用单位-林德利混合效应模型分析包含联邦各州随机截获的数据集。在蒙特卡罗模拟研究中，根据模型参数估计的偏差和均方误差，比较了拉普拉斯法和AGQ法近似单位-林德利混合效应模型的边际似然。

单位-林德利混合效应模型和边际似然推断的实现近似方法在第节中提供2第节演示了实际数据集的应用三通过考虑单位-林德利回归模型中忽略的层次数据结构，实现单位-林德利混合效应模型。第节提供了近似方法与各种单位-林德利混合效应模型比较的蒙特卡罗模拟结果4研究的结论见第节5.

2.单位-林德利混合效应模型

假设 $Y（Y） \sim U型 L（左） (μ)$ 表示单位林德利分布随机变量，其概率密度函数为平均值，

（f） (年 | μ) = \frac{{(1 - μ)}^{2}}{μ {(1 - 年)}^{三}} 经验 (- \frac{年 (1 - μ)}{μ (1 - 年)})

(1)

其中0<年<1, $0 < μ < 1$ .让 ${Y（Y）}_{1}, \dots, {Y（Y）}_{n个}$ 是独立的随机变量，其中 ${Y（Y）}_{我} \sim U型 L（左） (μ_{我})$ , $我 = 1, \dots, n个$ 单位Lindley回归模型利用线性预测器， $克 (μ_{我}) = {x个}_{我}^{'} β$ 哪里 $β = {(β_{1}, \dots, β_{第页})}^{'}$ 表示第页-回归系数的维数向量 $(第页 < n个)$ 和 ${x个}_{我} = {({x个}_{我 1}, \dots, {x个}_{我第页})}^{'}$ 协变量向量。任何链接函数的主要目的都是连接线性预测器和分布函数的平均值。如果分布在自然指数族中，则存在从响应变量的密度分布导出的定义明确的规范连接函数。例如，logit链接是逻辑（混合）模型的标准链接函数。然而，在某些情况下，为了将链接函数的域与分布函数的平均值范围耦合，非标准链接函数可用于算法必要性，例如单纯形模型和贝塔模型[4,9]. 贝塔回归和贝塔混合模型基于贝塔分布，而非单位林德利分布中的自然指数族。Beta模型还利用了logit链接功能，因为它们还为单位间隔响应建模[1,4]. 因此，对于平均链接函数 $克 (.) : (0, 1) \to ℜ$ ，logit链接 $克 (μ_{我}) = 日志 (\frac{μ_{我}}{1 - μ_{我}})$ 用于确保预测的平均值位于单位区间内 $(0, 1)$ [6]. 单位-林德利回归模型没有考虑同一组或实验单位随时间或治疗的观察结果之间的相关性。当数据集是分层收集的，包括对单位的随机影响时，林德利回归模型为分组数据集提供了简约模型。单位-林德利混合效应模型建议如下。假设 ${Y（Y）}_{我 j个}$ 表示单位Lindley响应 ${j个}^{第个}$ 受试者（或集群）的测量结果我, $我 = 1, \dots, N个$ , $j个 = 1, \dots, {n个}_{我}$ 和 ${Y（Y）}_{我}$ 是 ${n个}_{我}$ 受试者所有测量的维向量我让我们假设一下 ${b条}_{我}$ 是随机主体效果q个-假定标注独立于 $N个 (0, D类)$ . ${Y（Y）}_{我 j个}$ 通过其条件平均值与固定效应和随机效应相关 $η_{我 j个}$ 属于 $μ_{我 j个}$ , $μ_{我 j个} = E类 ({Y（Y）}_{我 j个} | {b条}_{我})$ ,

η_{我 j个} = 克 (μ_{我 j个}) = {x个}_{我 j个}^{'} β + {z（z）}_{我 j个}^{'} {b条}_{我},

(2)

哪里 ${x个}_{我 j个}$ 是 $第页 x个 1$ 已知协变量向量和 ${z（z）}_{我 j个}$ 是 $q个 x个 1$ 随机效应的已知设计向量。β是 $第页 x个 1$ 未知固定回归系数向量和 ${b条}_{我}$ 是一个q个-主题特定参数的维向量。在单位Lindley混合效应模型中 $年_{我}$ 鉴于 ${b条}_{我}$ 由提供

{（f）}_{年_{我} | {b条}_{我}} (年_{我} | {b条}_{我}) = \prod_{j个 = 1}^{{n个}_{我}} \frac{{(1 - μ_{我 j个})}^{2}}{μ_{我 j个} {(1 - 年_{我 j个})}^{三}} 经验 (- \frac{年_{我 j个} (1 - μ_{我 j个})}{μ_{我 j个} (1 - 年_{我 j个})}),

(3)

其中条件平均值 $μ_{我 j个} = E类 ({Y（Y）}_{我 j个} | {b条}_{我})$ 通过logit链接与固定和随机效果相关 $η_{我 j个} = 日志 (\frac{μ_{我 j个}}{1 - μ_{我 j个}})$ 注意，使用logit链接作为条件平均值， $μ_{我 j个} = \frac{1}{1 + 经验 (- η_{我 j个})} = \frac{1}{1 + 经验 [- ({x个}_{我 j个}^{'} β + {z（z）}_{我 j个}^{'} {b条}_{我})]}$ .在矩阵形式下，（2）中的模型可以表示为：，

η_{我} = {X（X）}_{我} β + {Z轴}_{我} {b条}_{我},

(4)

$年_{我} = (年_{我 1}, 年_{我 2}, \dots, 年_{我 {n个}_{我}})^{'}$ 是响应向量 ${n个}_{我}$ 受试者内的测量我.

3.单位-林德利混合效应模型的参数估计

知道随机效应 ${b条}_{我}$ 作为未观测到的随机变量，边际或综合似然通过对随机效应的分布进行平均来获得固定效应估计。主体或集群的可能性贡献我, $我 = 1, \dots, N个$ 如下所示

\begin{aligned} {（f）}_{年_{我}} (年_{我} | β, D类) & = \int_{- \infty}^{\infty} {（f）}_{年_{我} | {b条}_{我}} (年_{我} | {b条}_{我}) 克 ({b条}_{我} | D类) d日 {b条}_{我} \\ = {(2 π)}^{\frac{- q个}{2}} {| D类 |}^{- \frac{1}{2}} \int_{- \infty}^{\infty} {（f）}_{年_{我} | {b条}_{我}} (年_{我} | {b条}_{我}) 经验 [- \frac{1}{2} {b条}_{我}^{'} {D类}^{- 1} {b条}_{我}] d日 {b条}_{我} . \end{aligned}

(5)

的边际可能性β和D类已提供

L（左） (β, D类; 年) = \prod_{我 = 1}^{N个} {（f）}_{年_{我}} (年_{我} | β, D类) = \prod_{我 = 1}^{N个} \int \prod_{j个 = 1}^{{n个}_{我}} {（f）}_{年_{我 j个}} (年_{我 j个} | {b条}_{我}, β) 克 ({b条}_{我} | D类) d日 {b条}_{我} .

(6)

主要问题是最大化方程式中的可能性(6)在N个上的积分q个-维度随机效应， ${b条}_{我}$ 。由于计算了(6)由于涉及积分，文献中提出了各种数值似然逼近方法[2,7,12]. 在本研究中，拉普拉斯和AGQ方法被用作数值积分方法，用于逼近边际似然函数来估计模型参数。

3.1. 拉普拉斯近似

采用拉普拉斯方法近似积分，如（5）。积分(5)可以表述为 $经验 [小时 ({b条}_{我})]$ 哪里 $小时 ({b条}_{我}) = 日志 {（f）}_{年_{我} | {b条}_{我}} (年_{我} | {b条}_{我}) - \frac{1}{2} {b条}_{我}^{'} {D类}^{- 1} {b条}_{我}$ 对于单位-林德利响应混合效应模型，

小时 ({b条}_{我}) = \sum_{j个 = 1}^{{n个}_{我}} [- η_{我 j个} - 三 日志 (1 - 年_{我 j个}) + 日志 (1 - μ_{我 j个}) - \frac{年_{我 j个} (1 - μ_{我 j个})}{μ_{我 j个} (1 - 年_{我 j个})}] - \frac{1}{2} {b条}_{我}^{'} {D类}^{- 1} {b条}_{我} .

(7)

假设 ${\hat{b条}}_{我} = {\hat{b条}}_{我} (β, D类, 年_{我})$ 是的值 ${b条}_{我}$ 最大化 $小时 ({b条}_{我})$ 。对于 ${\hat{b条}}_{我}$ ，经验贝叶斯估计用于 $[小时 ({\hat{b条}}_{我})]$ 功能[11]. 中的积分(5)可以作为[10]

\begin{aligned} \int_{- \infty}^{\infty} 经验 [小时 ({b条}_{我})] d日 {b条}_{我} = 经验 [小时 ({\hat{b条}}_{我})] \int_{- \infty}^{\infty} 经验 [- \frac{1}{2} {({b条}_{我} - {\hat{b条}}_{我})}^{'} {V（V）}_{我}^{- 1} ({b条}_{我} - {\hat{b条}}_{我})] 经验 (S公司) d日 {b条}_{我} \\ = {(2 π)}^{q个 / 2} {| {V（V）}_{我} |}^{1 / 2} 经验 [小时 ({\hat{b条}}_{我})] E类 (经验 [S公司]) . \end{aligned}

(8)

哪里 ${V（V）}_{我} = - {[{小时}^{''} ({\hat{b条}}_{我})]}^{- 1} = - {[\frac{\partial^{2} 小时 ({b条}_{我})}{\partial {b条}_{我} \partial {b条}^{'}_{我}} |_{{b条}_{我} = {\hat{b条}}_{我}}]}^{- 1},$ ${小时}^{'} ({\hat{b条}}_{我})$ 消失和 $S公司 = \sum_{k个 = 三}^{\infty} {T型}_{k个 j个}, {T型}_{k个 j个} = \frac{1}{k个!} [\overset{k个 - 1}{\otimes} {({b条}_{我} - {\hat{b条}}_{我})}^{'}] {小时}^{(k个)} ({\hat{b条}}_{\hat{我}}) ({b条}_{我} - {\hat{b条}}_{我})$ [10]. 在单位Lindley混合模型的Laplace近似和AGQ方法中，我们需要获得 $小时 ({b条}_{我})$ 关于 ${b条}_{我}$ ,

\begin{aligned} {小时}^{'} ({b条}_{我}) & = \frac{d日 小时 ({b条}_{我})}{d日 {b条}_{我}} = \sum_{j个 = 1}^{{n个}_{我}} [- (1 + μ_{我 j个}) {z（z）}_{我 j个} - \frac{年_{我 j个}}{(1 - 年_{我 j个})} [(\frac{μ_{我 j个} - 1}{μ_{我 j个}}) {z（z）}_{我 j个}]] - {D类}^{- 1} {b条}_{我}, \end{aligned}

(9)

\begin{aligned} {小时}^{''} ({b条}_{我}) & = \sum_{j个 = 1}^{{n个}_{我}} [(- μ_{我 j个} (1 - μ_{我 j个}) {z（z）}_{我 j个} {z（z）}_{我 j个}^{'}) - \frac{年_{我 j个}}{(1 - 年_{我 j个})} (\frac{1 - μ_{我 j个}}{μ_{我 j个}}) {z（z）}_{我 j个} {z（z）}_{我 j个}^{'}] - {D类}^{- 1} . \end{aligned}

(10)

${小时}^{''} ({b条}_{我}) = - ({Z轴}_{我}^{'} {W公司}_{我} {Z轴}_{我} + {D类}^{- 1})$ 哪里 ${W公司}_{我}$ 是 ${n个}_{我} x个 {n个}_{我}$ 带元素的对角矩阵 ${w个}_{我 j个} = ((\frac{1 - μ_{我 j个}}{μ_{我 j个}}) (μ_{我 j个}^{2} + (\frac{年_{我 j个}}{1 - 年_{我 j个}})))$ 在对角线上。在标准拉普拉斯近似中，被积函数的对数 $小时 ({b条}_{我})$ 使用周围的二阶泰勒级数展开 ${\hat{b条}}_{我}$ 并使用高斯分布进行计算，以完成方程中的积分(8)，近似值 $E类 ({e（电子）}^{秒}) \approx 1$ 因此，方程中积分的拉普拉斯近似(5)是 ${(2 π)}^{q个 / 2} {| {V（V）}_{我} |}^{1 / 2} 经验 (小时 ({\hat{b条}}_{我}))$ 边际似然近似为

L（左） \approx {| D类 |}^{- N个 / 2} \prod_{我 = 1}^{N个} {| {V（V）}_{我} |}^{1 / 2} 经验 [小时 ({\hat{b条}}_{我})]

(11)

和log-likelihood一样

日志 (L（左）) \approx - \frac{N个}{2} 日志 | D类 | + \frac{1}{2} \sum_{我 = 1}^{N个} 日志 | {V（V）}_{我} | + \sum_{我 = 1}^{N个} 小时 ({\hat{b条}}_{我}) .

(12)

3.2. 自适应高斯-厄米积分近似

为了根据概率密度函数计算积分，当积分在被积函数达到最大值的点附近近似时，AGQ方法提供了更好的精度，并且对于正态分布的随机效应很有用[三,8]. 在AGQ方法中，根据对数似然函数的形状重新缩放求积点。假设 ${\hat{b条}}_{我}$ 是的最大点 $小时 ({b条}_{我})$ 和近似值 $小时 ({b条}_{我})$ 二阶Taylor展开式 $小时 ({b条}_{我})$ 围绕 ${\hat{b条}}_{我}$ 如下所示：

小时 ({b条}_{我}) \approx 小时 ({\hat{b条}}_{我}) + \frac{1}{2} {({b条}_{我} - {\hat{b条}}_{我})}^{'} {小时}^{''} ({\hat{b条}}_{我}) ({b条}_{我} - {\hat{b条}}_{我}) .

(13)

的二阶泰勒展开 $小时 ({b条}_{我})$ 替换为方程式左侧的积分(8). ${b条}_{我}$ 可以认为是正态分布 ${N个}_{q个} ({\hat{b条}}_{我}, - {[{小时}^{''} ({\hat{b条}}_{我})]}^{- 1})$ .设AGQ方法的核函数为 $z（z） \sim {N个}_{q个} (0, 我)$ 和 ${b条}_{我} = μ_{{b条}_{我}} + \sum_{{b条}_{我}} z（z） = {\hat{b条}}_{我} + {[{小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} z（z）$ .然后，

| \frac{\partial {b条}_{我}}{d日 {z（z）}^{'}} | = {[{小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} .

(14)

据皮涅罗和贝茨介绍[7]，方程式中的左侧积分(8)可以写为

\begin{aligned} \int_{- \infty}^{+ \infty} {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} 经验 {小时 ({\hat{b条}}_{我} + {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} z（z）) + \frac{{z（z）}^{'} z（z）}{2}} 经验 [- \frac{{z（z）}^{'} z（z）}{2}] d日 z（z） \\ = \sqrt{2} {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} \int_{- \infty}^{+ \infty} 经验 {小时 ({\hat{b条}}_{我} + \sqrt{2} {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} {u个}_{我}) + {u个}_{我}^{'} {u个}_{我}} \\ \times 经验 [- {u个}_{我}^{'} {u个}_{我}] d日 {u个}_{我} \end{aligned}

(15)

哪里 ${u个}_{我} = z（z） / \sqrt{2}$ .让

EXPH（出口） = 经验 {小时 {{\hat{b条}}_{我} + \sqrt{2} {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} (\begin{matrix} {u个}_{我 克_{1}} \\ \dots \\ {u个}_{我 克_{q个}} \end{matrix})} + (\begin{matrix} {u个}_{我 克_{1}}, \dots, {u个}_{我 克_{q个}} \end{matrix}) (\begin{matrix} {u个}_{我 克_{1}} \\ \dots \\ {u个}_{我 克_{q个}} \end{matrix})}

最后一个积分通过使用G点高斯-厄米特公式进行近似，如下所示：

\sqrt{2} {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} \sum_{克_{1} = 1}^{G公司} \sum_{克_{2} = 1}^{G公司} \dots \sum_{克_{q个} = 1}^{G公司} ({w个}_{克_{1}} {w个}_{克_{2}} \dots {w个}_{克_{q个}}) x个 E类 X（X） P（P） H（H）,

(16)

哪里G公司表示正交点的数量， ${w个}_{克_{k个}}$ , $k个 = 1, \dots, q个$ , $克_{k个} = 1, \dots, G公司$ ，是正交权重。最后给出了AGQ方法的对数似然近似如下：

\begin{aligned} 日志 ({L（左）}_{AGQ公司}) & \approx - \frac{N个}{2} 日志 | D类 | + \frac{1}{2} \sum_{我 = 1}^{N个} 日志 | {V（V）}_{我} | \\ + \sum_{我 = 1}^{N个} 日志 [\sqrt{2} {[- {小时}^{''} ({\hat{b条}}_{我})]}^{- 1 / 2} \sum_{克_{1} = 1}^{G公司} \sum_{克_{2} = 1}^{G公司} \dots \sum_{克_{q个} = 1}^{G公司} ({w个}_{克_{1}} {w个}_{克_{2}} \dots {w个}_{克_{q个}}) x个 EXPH（出口）] \end{aligned}

(17)

请注意 $小时 ({b条}_{我})$ 最大值必须为负数，并且 $小时 ({b条}_{我})$ 在AGQ和拉普拉斯近似方法中是单峰的。在AGQ方法中，参数估计对正交点的数量很敏感。模拟中还测试了15个和21个正交点。由于在参数估计的偏差和均方误差中未观察到显著变化，因此有11个正交点的AGQ被认为足以避免减缓模拟速度。

4.应用

2010年巴西人口普查期间收集的这项研究的数据集包括3197个城市和相关的社会人口变量[6]. Mazucheli等人。利用带有logit链接函数的unit-Lindley回归模型，分析了缺水和污水比例作为响应变量在单位区间内与区域、人类发展指数、城市收入和预期寿命等社会人口变量的关系。据报道，unit-Lindley回归模型比beta回归模型更适合该数据集[6].

由于巴西的城市预计会受到联邦各州的地方政策、经济状况或政治状况的影响，我们考虑将该数据集中城市所属的巴西联邦各州纳入单位-林德利回归模型，作为各州的随机截距。该假设得到支持，即巴西联邦各州供水和污水不足（PHI）的家庭比例存在异质性，如图1.

	模型1		模型2		模型3
	Log-Lik公司	AIC公司	Log-Lik公司	AIC公司	Log-Lik公司	AIC公司
单位-林德利混合	5822.5	$-$ 11633	5871	$-$ 11731.16	5841.3	$-$ 11674.59
Beta混合	5745	$-$ 11476	$-$ 11562	5787.9	5785.51	$-$ 11559
衬里混合	3276.4	$-$ 6538.7	3299.9	$-$ 6585.8	3298.5	$-$ 6585
单位-林德利注册。	5740.3	$-$ 11470

变量	估计	标准错误	%95置信区间
拦截	0.8710	0.5407	( $- 0188$ ; 1.930)
人类发展指数	$-$ 6.2087	0.8004	( $- 7.777$ ; $- 4.640$ )
区域1	0.8247	0.1915	(0.449; 1.200)
原木收入	$-$ 1.0535	0.1116	( $- 1.272$ ; $- 0.834$ )
差异组件	0.0857

参数	拉普拉斯	AGQ-5型	AGQ-11号	拉普拉斯	AGQ-5型	AGQ-11号
设置	偏见	偏见	偏见	MSE公司	MSE公司	MSE公司
$β_{0} = - 0.3$	$-$ 0.28858	$-$ 0.01407	$-$ 0.01504	0.100469	0.06105	0.061075
$β_{1} = - 0.6$	0.075681	$-$ 0.00244	$-$ 0.00244	0.026588	0.022774	0.022774
$β_{2} = 0.7$	$-$ 0.0925	$-$ 0.00287	$-$ 0.00287	0.015728	0.007467	0.007467
$β_{三} = 0.1$	$-$ 0.01388	$-$ 0.00154	$-$ 0.00154	0.006968	0.007516	0.007516
$β_{4} = 0.2$	$-$ 0.02977	$-$ 0.0033	$-$ 0.0033	0.019772	0.021143	0.021143
$σ_{{b条}_{1}}^{2} = 0.5$	0.2004	$-$ 0.067	$-$ 0.06679	0.131612	0.060011	0.060116

参数	拉普拉斯	拉普拉斯	AGQ-5型	AGQ-5型	AGQ-11型	AGQ-11号
设置	平均。美国东部时间。	偏见	平均。美国东部时间。	偏见	平均值。美国东部时间。	偏见
$β_{0} = - 0.7$	$-$ 0.43931	0.260691	$-$ 0.70682	$-$ 0.00682	$-$ 0.70779	$-$ 0.00779
$β_{1} = - 1$	$-$ 0.90761	0.092394	$-$ 1.00053	$-$ 0.00053	$-$ 1.00053	$-$ 0.00053
$β_{2} = 0.3$	0.024766	$-$ 0.27523	0.296028	$-$ 0.00397	0.2958	$-$ 0.0042
$σ_{{b条}_{1}}^{2} = 0.75$	0.679091	0.109674	0.679091	$-$ 0.07091	0.679085	$-$ 0.07092
$σ_{{b条}_{2}}^{2} = 0.5$	0.436321	0.232653	0.436321	$-$ 0.06368	0.436327	$-$ 0.06367
$σ_{{b条}_{1, 2}} = 0.2$	0.180691	$-$ 0.08397	0.180691	$-$ 0.01931	0.18069	$-$ 0.01931

参数	MSE公司	MSE公司	MSE公司
设置	拉普拉斯	AGQ-5型	AGQ-11号
$β_{0} = - 0.7$	0.095757	0.009741	0.009642
$β_{1} = - 1$	0.025585	0.003984	0.003984
$β_{2} = 0.3$	0.071266	0.006454	0.006439
$σ_{{b条}_{1}}^{2} = 0.75$	0.038174	0.014535	0.014534
$σ_{{b条}_{2}}^{2} = 0.5$	0.090969	0.008277	0.008277
$σ_{{b条}_{1, 2}} = 0.2$	0.017601	0.005234	0.005235

参数	拉普拉斯	AGQ-5型	AGQ-11号	拉普拉斯	AGQ-5型	AGQ-11号
设置	偏见	偏见	偏见	MSE公司	MSE公司	MSE公司
$β_{0} = - 0.3$	$-$ 0.38877	$-$ 0.0001	0.000112	0.157673	0.054967	0.055514
$β_{1} = - 0.6$	0.025882	$-$ 0.00161	$-$ 0.00161	0.007193	0.00637	0.00637
$β_{2} = 0.7$	$-$ 0.03055	0.001829	0.00183	0.003197	0.002211	0.00221
$β_{三} = 0.1$	$-$ 0.00342	0.002018	0.002021	0.002096	0.002111	0.002111
$β_{4} = 0.2$	$-$ 0.00827	0.001263	0.001265	0.006329	0.006361	0.006361
$σ_{{b条}_{1}}^{2} = 0.5$	0.199657	$-$ 0.05091	$-$ 0.05068	0.130151	0.051902	0.051948

参数	拉普拉斯	AGQ-5型	AGQ-11号	拉普拉斯	AGQ-5型	AGQ-11号
设置	偏见	偏见	偏见	MSE公司	MSE公司	MSE公司
$β_{0} = - 0.3$	$-$ 0.17862	$-$ 0.01581	$-$ 0.01725	0.044332	0.036597	0.036653
$β_{1} = - 0.6$	0.146481	0.001406	0.001411	0.04111	0.024546	0.024545
$β_{2} = 0.7$	$-$ 0.16852	0.005172	0.005166	0.035629	0.008589	0.008589
$β_{三} = 0.1$	$-$ 0.02167	0.0019	0.001898	0.006722	0.008227	0.008227
$β_{4} = 0.2$	$-$ 0.04916	0.001065	0.001063	0.021058	0.025086	0.025085
$σ_{{b条}_{1}}^{2} = 0.5$	0.225344	$-$ 0.04318	$-$ 0.04317	0.100164	0.03864	0.038651

比例数据的Unit-Lindley混合效应模型

Hatice Tul Kubra Akdur公司

摘要

1.简介

2.单位-林德利混合效应模型

3.单位-林德利混合效应模型的参数估计

3.1. 拉普拉斯近似

3.2. 自适应高斯-厄米积分近似

4.应用

表1。

表2。

5.仿真研究

表3。

表4。

表5。

表6。

表8。

表9。

表7。

表11。

表12。

表13。

表10。

表14。

6.讨论

致谢

附录。

资金筹措表

披露声明

工具书类