Optimal allocation of subjects in a matched pair cluster-randomized trial with fixed number of heterogeneous clusters

Satya Prakash Singh; Pradeep Yadav

doi:10.1080/02664763.2020.1779195

J应用统计。2021; 48(9): 1527–1540.

2020年6月12日在线发布。数字对象标识：10.1080/02664763.2020.1779195

预防性维修识别码：PMC9097976

PMID：35706575

固定异质簇数配对随机试验中受试者的最优分配

萨蒂亚·普拉卡什·辛格^一和Pradeep Yadav公司^b条

作者信息版权和许可信息 PMC免责声明

关联数据

补充资料: 补充材料
CJAS_A_1779195_SM9114.pdf（182K）
GUID:B9148CFD-88D4-47D6-BB32-5A3E892F5917

摘要

在分组随机试验中，研究人员将家庭、医疗机构、学校或教室等人群随机分组，尽管感兴趣的单位是个人。它导致在未知参数的估计方面的效率损失，以及用于测试治疗效果的测试的功率损失。为了弥补这种效率损失，一些研究将相似的集群配对，并在配对中随机处理。然而，治疗臂内的簇在性质上可能是异质的。在本文中，我们提出了一种局部优化设计，该设计考虑了集群的异质性，并在每个集群中优化分配主题。为了解决设计对未知参数的依赖性，我们还讨论了贝叶斯优化设计。通过一些数据示例对所提设计的性能进行了数值研究。

关键词：贝叶斯设计，分组随机试验，效率，配对分组，优化设计，功率

1.简介

集群随机试验（CRT）广泛应用于社会和教育调查、健康研究社区、行为和生物医学科学等领域[三]. 与完全随机设计（CRD）相比，CRT在治疗组内随机化分组。集群中的主题具有相似性，这使得CRT的效率低于CRD。然而，从伦理、成本和污染的角度来看，阴极射线管仍被广泛使用。使用匹配对策略可以提高CRT的效率。在匹配对CRT（MPCRT）中，簇最初是基于可用背景特征（如人口或地理特征）的相似性进行匹配的。考虑到匹配的潜在优点，Martin等人。[11]表明MPCRT提高了与测试治疗效果相关的测试能力。当集群进行适当配对时，也可以改进对治疗效果的估计[21]. Imai等人的论文。[8]附和了这些发现，并强调要适当使用MPCRT。

一旦确定了潜在的匹配簇（基于初始特征），就会从每个匹配对簇中随机分配一个处理。可以合理地假设匹配对簇在本质上是均匀的。然而，在治疗范围内，集群可能是异质的。在设计此类实验时，通常忽略异质性，并基于平衡设计来规划实验。在平衡设计中，每个集群接收到相同数量的观察结果。基于平衡设计的最佳CRT讨论于[7,9,12]. 有一些研究表明，在各种设置下，大小不等的CRT比大小相等的集群更有效，例如[23,27]和[2]. 在最近的一些研究中，考虑了异质性集群（治疗臂内的异质性），并且不平衡设计显示出更有效，参见，例如[10]和[22].

配对设计中的样本量确定在[6]以及[13]对于均质集群。在本文中，我们提出了一种考虑簇间异质性和类内同质性的优化设计。在以下假设下获得了一个最优设计：（i）总样本量预先固定，（ii）配对聚类是均匀的，大小相等，（iii）每只手臂（治疗）中的聚类数是固定的，相等，（iv）两个配对聚类中一个聚类中受试者之间的变异性是相同的。在MPCRT中，通常假设每个治疗臂中的簇数相等，如[8]和[26]. 通过引入变异性测量参数，通过协方差结构将聚类内的变异性纳入模型中。根据这些参数的已知值进行设计。因此，得到的设计是局部最优设计。为了解决局部最优设计对参数的依赖性，我们简要描述了贝叶斯方法的使用，类似于[16]和[17].

文章结构如下。在节中2，我们定义了模型并讨论了模型参数的估计。论文的主要贡献在第节三在本节中，我们提出了设计标准，并获得了相关的优化设计。采用贝叶斯方法来处理先前提出的设计的局部性质。导出了检测处理效果的幂函数。讨论了一种迭代过程，以找到所需的样本大小，从而获得预先指定的功率。章节4包含建议的方法的数值示例，以查找局部和贝叶斯优化设计。还提供了一个实际数据示例。第节对本工作的进一步扩展进行了总结和讨论5.

2.模型和估算

考虑一个两级集群模型，其中两个治疗组具有米每组中的集群。让索引我表示我th治疗组和j个代表j个第个集群。此外，让 $年_{我 j个} = (年_{我 j个 1}, \dots, 年_{我 j个 {n个}_{我 j个}})^{T型}$ 表示向量 ${n个}_{我 j个}$ 来自j个嵌套在我第个治疗组。向量 $年_{我 j个}$ 作为具有平均向量的多元正态随机变量独立分布

E类 (年_{我 j个}) = μ 1_{{n个}_{j个}} + β {x个}_{我 j个} 1_{{n个}_{j个}},

(1)

和方差矩阵 $变量 (年_{我 j个}) = σ^{2} {V（V）}_{我 j个} (ρ_{我 j个})$ ，其中μ和β是与总体效果和治疗效果相对应的固定参数， ${x个}_{我 j个}$ 如果我 = 1和1，如果我 = 2，和 $1_{{n个}_{我 j个}}$ 是所有长度的向量 ${n个}_{我 j个}$ .参数 $ρ_{我 j个}$ 测量嵌套在j个内的第个簇我th处理。纳入第节中的假设1，我们有

Cov公司 (年_{我 j个}, 年_{k个 我}) = \{\begin{cases} σ^{2} {V（V）}_{j个} (ρ_{j个}) & 我 （f） 我 = k个, 一 n个 d日 j个 = 我, \\ 0 & o个 t吨 小时 e（电子） 第页 w个 我 秒 e（电子）, \end{cases}

(2)

和 ${n个}_{我 j个} = {n个}_{j个}$ 对于我 = 1, 2. 假设 $ρ_{我 j个} = ρ_{j个}$ 对于 $我 = 1, 2$ 参数 $ρ_{j个}$ 测量嵌套在j个第个集群，其中 $j个 = 1, \dots, 米$ .我们使用了方差矩阵的复合对称结构，其定义为

{V（V）}_{j个} (ρ_{j个}) = (1 - ρ_{j个}) 我 + ρ_{j个} J,

(3)

哪里 $我$ 是单位矩阵 $J$ 是所有有序矩阵 ${n个}_{j个} \times {n个}_{j个}$ 对于 $j个 = 1, \dots, 米$ .

回归参数 $(μ, β)$ 可以使用最大似然估计（MLE）方法进行估计。与随机向量相关的完整对数似然函数 $Y（Y） = (年_{11}, \dots, 年_{1 米}, 年_{21}, \dots, 年_{2 米})^{T型}$ 可以表示为

\begin{aligned} L（左） (Y（Y）, μ, β, ρ) & = - \{N个 日志 (2 π) + N个 日志 (σ^{2}) + \sum_{j个 = 1}^{米} 日志 | {V（V）}_{j个} |\} \\ - \frac{1}{2} \{\sum_{j个 = 1}^{米} (年_{1 j个} - μ 1_{{n个}_{j个}})^{T型} {V（V）}_{j个}^{- 1} (年_{1 j个} - μ 1_{{n个}_{j个}})\} \\ - \frac{1}{2} \{\sum_{j个 = 1}^{米} (年_{2 j个} - μ 1_{{n个}_{j个}} - β 1_{{n个}_{j个}})^{T型} {V（V）}_{j个}^{- 1} (年_{2 j个} - μ 1_{{n个}_{j个}} - β 1_{{n个}_{j个}})\} . \end{aligned}

(4)

假设σ和 $ρ_{j个}$ 已知的最大似然估计量 $(\hat{μ}, \hat{β})$ 属于 $(μ, β)$ 计算公式如下：

\begin{aligned} \hat{β} & = \frac{\sum_{j个 = 1}^{米} 1_{{n个}_{j个}}^{T型} {垂直}_{j个}^{- 1} (年_{2 j个} - 年_{1 j个})}{\sum_{j个 = 1}^{米} 1_{{n个}_{j个}}^{T型} {垂直}_{j个}^{- 1} 1_{{n个}_{j个}}} \end{aligned}

(5)

\begin{aligned} \hat{μ} & = \frac{\sum_{j个 = 1}^{米} 1_{{n个}_{j个}}^{T型} {垂直}_{j个}^{- 1} 年_{1 j个}}{\sum_{j个 = 1}^{米} 1_{{n个}_{j个}}^{T型} {垂直}_{j个}^{- 1} 1_{{n个}_{j个}}} . \end{aligned}

(6)

参数的最大似然估计 $σ^{2}$ 和ρ可以使用中描述的方法进行[4]经过适当修改后。

3.设计评估

3.1. 设计标准

假设有N个每个治疗组可用的实验单位。问题是如何分配这些N个服从米集群，以便我们将很快定义的设计选择标准得到优化。设计空间定义为 $N个 = {({n个}_{1}, \dots, {n个}_{米}) : {n个}_{j个} \geq 0, \sum_{j个 = 1}^{n个} {n个}_{j个} = N个}$ .每一个这样的排列N个主题被称为精确设计。找到一个精确的最优设计在数学上可能很难。相反，我们寻求近似设计 $ξ \in Ξ$ ，其中 $Ξ = {(ξ_{1}, \dots, ξ_{米}) : 0 \leq ξ_{j个} \leq 1, \sum_{j个 = 1}^{米} ξ_{j个} = 1}$ 是单位单纯形。换句话说， $ξ_{j个} = {n个}_{j个} / N个$ 是j个簇大小与总实验单元数之比。

应根据实验目标获得最佳设计。例如，如果主要目的是找到一种改进模型参数估计的设计，则应使用基于信息矩阵的标准。一些常用的按字母顺序命名的标准是 $A类 -$ , $D类 -$ 和 $E类 -$ 优化（参见[1]). 通常，人们的兴趣是找到一种有利于测试所需假设的优化设计，即基于幂函数的优化设计（参见[15]). 在这里，我们给出了鲁棒估计的最优设计。特别是，我们寻求最佳设计，以最小化与治疗效果相关的参数估计值的方差。这相当于找到 ${D类}_{秒}$ -最佳设计（参见[1]). 通过数值研究，我们表明，与常用的平衡设计相比，所提出的设计在测试处理效果方面具有更强的能力。

中给出的治疗效果估计值的方差(5)是

V（V） 一 第页 (\hat{β}) = 2 σ^{2} {[\sum_{j个 = 1}^{米} \frac{ξ_{j个}}{(1 / N个) (1 - ρ_{j个}) + ξ_{j个} ρ_{j个}}]}^{- 1} .

(7)

请注意，当 $ρ_{j个} = ρ$ 和 ${n个}_{j个} = n个$ 为所有人 $j个 = 1, \dots, 米$ , (7)减少到

V（V） 一 第页 (\hat{β}) = 2 σ^{2} {[\frac{米 n个}{1 + (n个 - 1) ρ}]}^{- 1}

等于估计值的方差β在中给出[17]. 以下[17]，标准化方差 $V（V）一第页 (\hat{β}) / σ^{2}$ 可用于找到最佳设计。可以观察到，最优设计是不变的 $σ^{2}$ .

可以看出，估计值的方差β在中给出(5)是设计的功能 $ξ$ ，未知参数 $ρ = (ρ_{1}, \dots, ρ_{米})$ 和样本量N个.优化设计，最大限度地减少 $V（V）一第页 (\hat{β})$ 可以通过最大化 $V（V）一第页 (\hat{β})^{- 1}$ 因此，我们倾向于写作

ψ (ξ; ρ, N个) = V（V） 一 第页 (\hat{β})^{- 1} .

(8)

在我们的背景下，最佳设计 $ξ_{o个第页 t吨}$ 满足

ξ_{o个 第页 t吨} = 参数 \underset{ξ \in Ξ}{最大值} ψ (ξ; ρ, N个) .

(9)

设计的性能 $ξ$ 与设计相比 $η$ 可以通过定义的效率函数进行测量

E类 （f） （f） (ξ, η) = \frac{ψ (ξ; ρ, N个)}{ψ (η; ρ, N个)} .

(10)

条件 $E类（f）（f） (ξ, η) > 1$ 意味着 $ξ$ 与相比效率更高 $η$ ，而 $E类（f）（f） (ξ, η) = 1$ 这意味着两种设计都是同样有效的。

3.2. 局部优化设计

如中所述(8)，使用获得的优化设计(9)取决于未知参数 $ρ$ 和总样本量N个为了进行可靠和稳健的推理，必须根据 $ρ$ 这接近于真实的总体参数。这些值要么由专家建议，要么可以通过类似历史研究的试点数据进行估计。假设我们对 $ρ$ 然后，根据猜测值进行优化设计 $ρ$ 可以使用。以下定理提供了基于给定值的优化设计ρ即局部最优设计。

定理3.1

最佳设计如下所示 $ξ_{o个第页 t吨} = (ξ_{1}^{*}, \dots, ξ_{米}^{*}),$ 哪里

ξ_{j个}^{*} = \frac{\sqrt{1 - ρ_{j个}} (1 - (1 / N个) (一 \sqrt{1 - ρ_{j个}} - b条))}{一 ρ_{j个}} 对于 j个 = 1, \dots, 米,

(11)

和 $一 = \sum_{k个 = 1}^{米} \sqrt{1 - ρ_{k个}} / ρ_{k个},$ $b条 = \sum_{k个 = 1}^{米} (1 - ρ_{k个}) / ρ_{k个}$ .

证明。

在不失一般性的情况下，我们假设 $σ^{2} = 1$ 这个问题的拉格朗日函数是

L（左） (ξ; ρ) = [ψ (ξ; ρ, N个)] + α (\sum_{j个 = 1}^{米} ξ_{j个} - 1)

解决方案满足系统要求

\begin{aligned} \frac{\partial L（左） (ξ; ρ)}{\partial ξ_{j个}} & = \frac{(1 / N个) (1 - ρ_{j个})}{{(1 / N个) (1 - ρ_{j个}) + ξ_{j个} ρ_{j个}}^{2}} + α = 0, 对于 j个 = 1, \dots, 米 \end{aligned}

(12)

\begin{aligned} \frac{\partial L（左） (ξ; ρ)}{\partial α} & = \sum_{j个 = 1}^{米} ξ_{j个} - 1 = 0 \end{aligned}

(13)

方程式(12)和(13)可以写为以下矩阵形式（详见补充材料）：

A类 ξ = b条,

(14)

哪里

\begin{aligned} A类 & = [\begin{matrix} T型 & u个 \\ {v（v）}^{T型} & 1 \end{matrix}], \\ T型 & = [\begin{matrix} ρ_{1} & - ρ_{2} \sqrt{\frac{1 - ρ_{1}}{1 - ρ_{2}}} & 0 & 0 & \dots & 0 \\ 0 & ρ_{2} & - ρ_{三} \sqrt{\frac{1 - ρ_{2}}{1 - ρ_{三}}} & 0 & \dots & 0 \\ ⋮ & ⋱ & ⋱ & ⋮ & \dots & ⋮ \\ 0 & \dots & ρ_{我} & - ρ_{我 + 1} \sqrt{\frac{1 - ρ_{我}}{1 - ρ_{我 + 1}}} & \dots & 0 \\ ⋮ & ⋮ & ⋮ & ⋮ & \dots & - ρ_{米 - 1} \sqrt{\frac{1 - ρ_{米 - 2}}{1 - ρ_{米 - 1}}} \\ 0 & \dots & \dots & \dots & 0 & ρ_{米 - 1} \end{matrix}], \end{aligned}

(15)

${v（v）}^{T型} = (1, \dots, 1)$ , $u个 = (0, \dots, 0, - ρ_{米} \sqrt{(1 - ρ_{米 - 1}) / (1 - ρ_{米})})^{T型}$ 和我第个条目 $b条$ 是 ${b条}_{我} = \frac{1}{N个} \sqrt{1 - ρ_{我}} (\sqrt{1 - ρ_{我 + 1}} - \sqrt{1 - ρ_{我}})$ 对于 $我 = 1, \dots, 米 - 1$ 、和 ${b条}_{米} = 1$ .矩阵的逆矩阵A类可以通过以下方式给出

{A类}^{- 1} = [\begin{matrix} {T型}^{- 1} + {T型}^{- 1} u个 秒^{- 1} {v（v）}^{T型} {T型}^{- 1} & - 秒^{- 1} {T型}^{- 1} u个 \\ - 秒^{- 1} {v（v）}^{T型} {T型}^{- 1} & 秒^{- 1} \end{matrix}],

哪里 $秒 = 1 - {v（v）}^{T型} {T型}^{- 1} u个$ .

矩阵T型是一个三对角矩阵，其逆矩阵可以通过以下公式计算[5]. 经过繁琐但不太困难的计算 $ξ_{o个第页 t吨} = {A类}^{- 1} b条$ 给出了所需的解决方案(11). 这就完成了证明。

很明显(11)如果 $ρ_{我} = ρ_{j个}$ ，然后 $ξ_{我}^{*} = ξ_{j个}^{*}$ 此外，以下推论表明，具有较大值 $ρ_{我}$ 与值较小的集群相比，需要较少的主题 $ρ_{j个}$ .

推论3.2

如果 $ρ_{我} \leq ρ_{j个}$ 然后 $ξ_{我}^{*} \geq ξ_{j个}^{*}$ .

证明。

让我们假设 $ρ_{我} \leq ρ_{j个}$ .来自(11)，我们有

\begin{aligned} ξ_{我}^{*} - ξ_{j个}^{*} & = \frac{\sqrt{1 - ρ_{我}}}{一 ρ_{我}} [1 - (1 / N个) (一 \sqrt{1 - ρ_{我}} - b条)] \\ - \frac{\sqrt{1 - ρ_{j个}}}{一 ρ_{j个}} [1 - (1 / N个) (一 \sqrt{1 - ρ_{j个}} - b条)] \\ = \frac{1}{一} [(b条 / N个 + 1) (\frac{\sqrt{1 - ρ_{我}}}{ρ_{我}} - \frac{\sqrt{1 - ρ_{j个}}}{ρ_{j个}}) + (1 / N个) \frac{(ρ_{我} - ρ_{j个})}{ρ_{我} ρ_{j个}}] \\ \geq \frac{1}{一} [(b条 / N个 + 1) (\frac{1 - ρ_{我}}{ρ_{我}} - \frac{1 - ρ_{j个}}{ρ_{j个}}) + (1 / N个) \frac{(ρ_{我} - ρ_{j个})}{ρ_{我} ρ_{j个}}] \end{aligned}

(16)

\begin{aligned} = \frac{1}{一} [(b条 / N个 + 1 - 1 / N个) \frac{(ρ_{j个} - ρ_{我})}{ρ_{我} ρ_{j个}}] \geq 0, \end{aligned}

(17)

其中不等式(16)根据以下事实 $(\sqrt{1 - x个} - 1) / x个 \geq (\sqrt{1 - 年} - 1) / 年$ 对于 $0 < x个 \leq 年 \leq 1$ ，以及中的最后一个不等式(17)根据不等式 $ρ_{我} \leq ρ_{j个}$ 。这就完成了证明。

通常样本大小N个在实验之前未知。对于大样本量，近似最优设计可以计算为 $N个 \to \infty$ .大样本近似优化设计 $ξ_{\infty}$ 获得方式为 $ξ_{\infty} = (\sqrt{1 - ρ_{1}} / 一 ρ_{1}, \dots, \sqrt{1 - ρ_{米}} / 一 ρ_{米})$ .

3.3. 贝叶斯优化设计

局部优化设计 $ξ_{o个第页 t吨}$ 在中给出(11)对 $ρ$ 。可以使用伪巴耶斯中提出的方法[16–18]. 在这种方法中 $ρ$ 假设，然后将其并入(8)通过对假定的先验进行积分和平均。形式上，贝叶斯优化设计 $ξ_{B类 o个第页 t吨}$ 定义为

ξ_{B类} = 参数 \underset{ξ \in Ξ}{最大值} \int_{P（P）} ψ (ξ; ρ, N个) d日 F类 (ρ) = 参数 \underset{ξ \in Ξ}{最大值} ψ_{B类} (ξ; N个),

(18)

哪里

ψ_{B类} (ξ; N个) = \int_{P（P）} ψ (ξ; ρ, N个) d日 F类 (ρ),

(19)

$P（P）$ 是的参数空间 $ρ$ 和F类是对应的累积分布函数 $ρ$ .

贝叶斯优化设计还取决于先验值的选择。因此，在确定先验分布函数时需要仔细注意F类。在以下情况下，对之前的错误规范进行详细的敏感性分析： $ρ_{j个} = ρ$ 为所有人j个，我们指的是[17].

3.3.1. 统一优先级

这里我们解释了当独立的均匀先验被分配给 $ρ_{j个}$ .考虑一下 $ρ_{j个}$ 的独立分布为 $U型 n个我（f） o个第页米 (一_{j个}, {b条}_{j个})$ 对于 $j个 = 1, \dots, 米$ ，其中 $0 < 一_{j个} < {b条}_{j个} < 1$ 。然后从(19)，我们得到（详见补充资料）

ψ_{B类} (ξ; N个) = \frac{1}{2 σ^{2}} \sum_{j个 = 1}^{米} [\{\frac{ξ_{j个}}{({b条}_{j个} - 一_{j个}) (ξ_{j个} - 1 / N个)}\} 日志 \{\frac{(1 / N个) (1 - {b条}_{j个}) + {b条}_{j个} ξ_{j个}}{(1 / N个) (1 - 一_{j个}) + 一_{j个} ξ_{j个}}\}] .

(20)

贝叶斯优化设计可以通过最大化(20)关于 $ξ \in Ξ .$ 贝叶斯优化设计的解析解通常很难求解。因此，需要使用数值优化技术来寻找贝叶斯设计。然而，值得注意的是，当 $一_{j个} = 一$ 和 ${b条}_{j个} = b条$ 为所有人j个，然后使用的备注1[14] (Purkiss原则, [24])贝叶斯设计满足 $ξ_{我} = ξ_{j个}$ 为所有人我和j个换句话说，贝叶斯优化设计是一种平衡设计 $ξ_{B类一我} = (1 / 米, \dots, 1 / 米) .$

3.3.2. 贝塔先验

另一个有用的优先选择 $ρ_{j个}$ 的意思是假设 $ρ_{j个}$ 的作为贝塔随机变量独立分布[20]. 假设 $ρ_{j个}$ 的独立分布为 $B类 e（电子） t吨一 (一_{j个}, {b条}_{j个})$ 对于 $j个 = 1, \dots, 米$ ，然后(19)可以写为

ψ_{B类} (ξ; N个) = \frac{1}{2 σ^{2}} \sum_{j个 = 1}^{米} [\frac{ξ_{j个}}{B类 e（电子） t吨 一 (一_{j个}, {b条}_{j个})} \int_{0}^{1} \frac{ρ_{j个}^{一_{j个} - 1} (1 - ρ_{j个})^{{b条}_{j个} - 1}}{(1 / N个) (1 - ρ_{j个}) + ξ_{j个} ρ_{j个}} d日 ρ_{j个}] .

(21)

集成(21)难以解析求解。因此，需要一些数值方法来计算(21). 与统一优先权的情况一样，如果 $一_{j个} = 一$ 和 ${b条}_{j个} = b条$ 对于 $j个 = 1, \dots, 米$ 贝叶斯优化设计是一种平衡设计。

3.4. 功率和样本量计算

假设兴趣在于测试治疗效果的重要性。然后，我们将对以下测试问题感兴趣

{H（H）}_{0} : β = β_{0} v（v） e（电子） 第页 秒 u个 秒 {H（H）}_{1} : β - β_{0} = δ \neq 0

(22)

最大似然估计 $\hat{β}$ 在中给出(5)可以用作测试统计信息(22). 统计数据 $\hat{β}$ 近似遵循平均值的正态分布β和方差 $ψ^{- 1} (ξ; ρ, N个)$ 因此，幂函数 $π (ξ; ρ, N个)$ 与测试统计信息关联 $\hat{β}$ 用于测试(22)由提供

\begin{aligned} π (ξ; ρ, δ, N个) = Φ (- {z（z）}_{(1 - α / 2)} + δ \sqrt{ψ (ξ; ρ, N个)}) + Φ (- {z（z）}_{(1 - α / 2)} - δ \sqrt{ψ (ξ; ρ, N个)}), \end{aligned}

(23)

哪里 $Φ (\cdot)$ 表示标准正态随机变量的累积分布函数 ${z（z）}_{(1 - α / 2)}$ 是 $(1 - α / 2)$ 标准正态分布的分位数。

实现预先指定的功率 $π_{0}$ ，可以使用顺序过程。从合理的样本量开始 ${N个}_{0}$ ，找到最佳设计 $ξ_{o个第页 t吨}$ 基于给定的值 $({N个}_{0}, ρ, δ)$ 并计算 $π (ξ_{o个第页 t吨}; ρ, δ, {N个}_{0})$ .如果 $π (ξ_{o个第页 t吨}; ρ, δ, {N个}_{0}) < π_{0}$ 然后增加 ${N个}_{0}$ 到 ${N个}_{0} + 1$ 并重复该过程，直到达到预定功率。类似地，如果 $π (ξ_{o个第页 t吨}; ρ, δ, {N个}_{0}) > π_{0}$ 然后减少 ${N个}_{0}$ 到 ${N个}_{0} - 1$ 并重复该过程。

4.数值研究

4.1. 示例1

在此，我们提供假设数据示例，以说明方法并评估建议的优化设计的性能。假设 $σ^{2} = 1$ ，考虑以下场景：

米 = 4和 $ρ = (0.1, 0.02, 0.3, 0.05) .$
米 = 5和 $ρ = (0.1, 0.2, 0.3, 0.4, 0.5) .$

可以从以下位置观察到(11)局部最优设计取决于样本大小N个在场景1中 $N个 \in {80, 82, \dots, 98}$ 在表中计算和报告1大样本近似优化设计计算如下 $ξ_{\infty} = (0.1167, 0.6091, 0.0343, 0.2399)$ .从表1，可以观察到 $ξ_{\infty}$ 和基于不同值的局部优化设计N个大致相同。就功率而言（在(23))，这些设计具有类似的性能（未报告）。

表1。

场景1下的局部最优设计。

N个	$ξ_{o个第页 t吨}$
80	(0.1176, 0.6069, 0.0355, 0.2400)
82	(0.1175, 0.6070, 0.0355, 0.2400)
84	(0.1175, 0.6070, 0.0355, 0.2400)
86	(0.1175, 0.6071, 0.0354, 0.2400)
88	(0.1175, 0.6071, 0.0354, 0.2400)
90	(0.1175, 0.6072, 0.0354, 0.2400)
92	(0.1174, 0.6072, 0.0354, 0.2400)
94	(0.1174, 0.6073, 0.0354, 0.2400)
96	(0.1174, 0.6073, 0.0353, 0.2399)
98	(0.1174, 0.6073, 0.0353, 0.2399)

在单独的窗口中打开

在场景2下，将平衡设计的性能与局部最优设计和贝叶斯最优设计进行比较。基于真实值的局部优化设计 $ρ$ 和 $N个 \in {50, \dots, 150}$ 计算。为了找到基于均匀先验的贝叶斯优化设计，考虑了以下方法。假设集群大小相等n个 = 50，每个的经验置信区间 $ρ_{我}$ 使用最大似然估计基于1000个模拟进行计算。重要性级别固定为 $5 %$ .与 $ρ_{我}$ 的是 $[0, 0.2524]$ , $[0, 0.3186]$ , $[0.1157, 0.3865]$ , $[0.1204, 0.4864]$ 和 $[0.1543, 0.5971]$ 。这些间隔用作 $ρ_{我}$ 的。基于这些统一先验，贝叶斯设计使用(20)的 $N个 \in {50, \dots, 150}$ 已计算。beta测试版ρ的选择应涵盖ρ和不应出现在概率密度函数的极端尾部位置。如中所建议[17]，选择了以下一组beta prior： $ρ_{1} \sim B类 e（电子） t吨一 (4, 90)$ , $ρ_{2} \sim B类 e（电子） t吨一 (10, 35)$ , $ρ_{三} \sim B类 e（电子） t吨一 (10, 20)$ , $ρ_{4} \sim B类 e（电子） t吨一 (6, 10)$ 、和 $ρ_{5} \sim B类 e（电子） t吨一 (5, 5)$ .最佳设计 $N个 \in {50, 100, 150}$ 在表中报告2.局部效率图( $ξ_{o个第页 t吨}$ )，贝叶斯统一( $ξ_{U型 n个我（f） o个第页米}$ )和贝叶斯测试版( $ξ_{B类 e（电子） t吨一}$ )最优设计与平衡设计的比较( $ξ_{B类一我}$ )如图所示1（a） ●●●●。从效率图中可以清楚地看出，局部最优设计表现最好，其次是贝叶斯均匀设计。贝叶斯贝塔优化设计报告效率最低。所有优化设计都优于平衡设计，因为对于以下所有值，效率始终大于1N个通过观察这些设计的功率图可以得出类似的结论（见图1（b））。与所有优化设计相关的功率计算用于双边测试，使用(23)假设 $(α, δ / σ) = (5 %, 0.75)$ .

保存图片、插图等的外部文件。对象名称为CJAS_A_17791995_F0001_OB.jpg

在单独的窗口中打开

图1。

（a）局部效率图( $ξ_{o个第页 t吨}$ )，贝叶斯统一( $ξ_{U型 n个我（f） o个第页米}$ )和贝叶斯测试版( $ξ_{B类 e（电子） t吨一}$ )最优设计与平衡设计的比较( $ξ_{B类一我}$ ). （b）平衡设计的功率图( $ξ_{B类一我}$ )，本地( $ξ_{o个第页 t吨}$ )，贝叶斯统一( $ξ_{U型 n个我（f） o个第页米}$ )和贝叶斯测试版( $ξ_{B类 e（电子） t吨一}$ )最佳设计。功率计算为 $5 %$ 双边检验假设的显著性水平 $δ / σ = 0.75$ .

表2。

示例1：本地( $ξ_{o个第页 t吨}$ )，贝叶斯统一( $ξ_{U型 n个我（f） o个第页米}$ )和贝叶斯测试版( $ξ_{B类 e（电子） t吨一}$ )基于的优化设计 $N个 = 50, 100, 150$

N个	设计	最佳比例
50	$ξ_{o个第页 t吨}$	$(0.4604, 0.2219, 0.1416 0.1007, 0.0755)$
	$ξ_{U型 n个我（f） o个第页米}$	$(0.3904, 0.3072, 0.1212, 0.1017, 0.0795)$
	$ξ_{B类 e（电子） t吨一}$	$(0.7011, 0.1135, 0.0728, 0.0660, 0.0466)$
100	$ξ_{o个第页 t吨}$	$(0.4662, 0.2222, 0.1402, 0.0985, 0.0729)$
	$ξ_{U型 n个我（f） o个第页米}$	$(0.4187, 0.3297, 0.1008, 0.0850, 0.0659)$
	$ξ_{B类 e（电子） t吨一}$	$(0.7194, 0.1076, 0.0676, 0.0621, 0.0434)$
150	$ξ_{o个第页 t吨}$	$(0.4681, 0.2223, 0.1397, 0.0978, 0.0721)$
	$ξ_{U型 n个我（f） o个第页米}$	$(0.4350, 0.3428, 0.0889, 0.0752, 0.0581)$
	$ξ_{B类 e（电子） t吨一}$	$(0.7272, 0.1048, 0.0654, 0.0605, 0.0422)$

在单独的窗口中打开

接下来评估建议设计的稳健性 $ρ$ ，进行敏感性分析。基于真值的局部优化设计 $ρ$ 场景2中给出的N个 = 50是 $ξ_{o个第页 t吨} = (0.4604, 0.2219, 0.1416, 0.1007$ , $0.0755)$ 基于均匀和贝塔先验的贝叶斯优化设计是 $ξ_{U型 n个我（f） o个第页米} = (0.3904, 0.3072, 0.1212,$ $0.1017, 0.0795)$ 和 $ξ_{B类 e（电子） t吨一} = (0.7011, 0.1135, 0.0728, 0.0660, 0.0466)$ 分别是。接下来，500个随机样本 $ρ$ 由 $ρ_{我}$ 的。对于每个样本，计算与贝叶斯设计和局部最优设计相关的功率。图中绘制了这500个功率值的方框图2（a） ●●●●。从箱位观察到 $ξ_{o个第页 t吨}$ 和 $ξ_{U型 n个我（f） o个第页米}$ 性能相似，而 $ξ_{B类 e（电子） t吨一}$ 表现最差。然而，在某些情况下，局部优化设计表现最差。例如，考虑局部优化设计 $ξ_{o个第页 t吨} = (0.1626, 0.7761, 0.0217, 0.0207, 0.0190)$ 在获得 $ρ = [0.1 0.1 0.12 0.13 0.15]$ 。请注意 $ρ$ 非常接近参数空间的边界。与此局部优化设计相关联的功率箱位以及 $ξ_{U型 n个我（f） o个第页米}$ 和 $ξ_{B类 e（电子） t吨一}$ 如图所示2（b） ●●●●。在这种情况下，局部最优设计 $ξ_{o个第页 t吨}$ 表现最差。

保存图片、插图等的外部文件。对象名称为CJAS_A_1779195_F0002_OC.jpg

在单独的窗口中打开

图2。

（a）与本地设计相关的功率方框图 $ξ_{o个第页 t吨} = (0.4604, 0.2219, 0.1416, 0.1007, 0.0755)$ 、贝叶斯均匀优化设计 $ξ_{U型 n个我（f） o个第页米} = (0.3904, 0.3072, 0.1212, 0.1017, 0.0795)$ 和贝叶斯贝塔优化设计 $ξ_{B类 e（电子） t吨一} = (0.7011, 0.1135, 0.0728, 0.0660, 0.0466)$ 基于500个样本 $ρ$ 从参数空间绘制。（b）与局部设计相关的功率方框图 $ξ_{o个第页 t吨} = (0.1626, 0.7761, 0.0217, 0.0207, 0.0190)$ 、贝叶斯均匀优化设计 $ξ_{U型 n个我（f） o个第页米} = (0.3904, 0.3072, 0.1212, 0.1017, 0.0795)$ 和贝叶斯贝塔优化设计 $ξ_{B类 e（电子） t吨一} = (0.7011, 0.1135, 0.0728, 0.0660, 0.0466)$ 基于500个样本 $ρ$ 从参数空间绘制。

4.2. 示例2：实际数据示例

密歇根大学与教育政策研究联合会合作开展的一个研究项目（教学改进研究）[17]. 该研究的目的是确定各种综合学校改革（CSR）计划对高贫困小学教学和学生成绩的影响。被测量的反应是幼儿园学生在春季出现时获得的数学成绩，即国家认可的评估工具Terra Nova Level 10。学生(n个)被嵌套在学校和两个改革项目，即“美洲选择”和“人人成功”，被视为治疗。当时有米 = 每个治疗组4组n个 = 每所学校21名学生。因此，他们采用了平衡设计。我们根据地理相似性将集群配对。最大似然估计 $ρ$ 是 $\hat{ρ} = (0.0634, 0.02, 0.0765, 0.1877)$ .对于制服，我们考虑 $ρ_{j个} \sim U型 n个我（f） o个第页米 (0, {\hat{ρ}}_{j个} + 0.4)$ 对于 $j个 = 1, \dots, 4$ 优先权的选择有些模糊，但包括 $ρ (> 0)$ 和点估计 $\hat{ρ}$ 。对beta版之前的版本进行了以下选择： $ρ_{1} \sim B类 e（电子） t吨一 (4, 90)$ , $ρ_{2} \sim B类 e（电子） t吨一 (4, 90)$ , $ρ_{三} \sim B类 e（电子） t吨一 (10, 70)$ 、和 $ρ_{4} \sim B类 e（电子） t吨一 (6, 20)$ 在这两种情况下， $ρ_{j个}$ 的是独立分布的。优化设计 $N个 \in {80, 120, 160}$ 在表中报告三.

表3。

示例2：本地( $ξ_{o个第页 t吨}$ )，贝叶斯统一( $ξ_{U型 n个我（f） o个第页米}$ )和贝叶斯测试版( $ξ_{B类 e（电子） t吨一}$ )基于的优化设计 $N个 = 84, 120, 160$

N个	设计	最佳比例
84	$ξ_{o个第页 t吨}$	$(0.1874, 0.5946, 0.1552, 0.0628)$
	$ξ_{U型 n个我（f） o个第页米}$	$(0.2592, 0.2873, 0.2518, 0.2017)$
	$ξ_{B类 e（电子） t吨一}$	$(0.4066, 0.4066, 0.1204, 0.0663)$
120	$ξ_{o个第页 t吨}$	$(0.1869, 0.5970, 0.1546, 0.0615)$
	$ξ_{U型 n个我（f） o个第页米}$	$(0.2592, 0.2870, 0.2517, 0.2021)$
	$ξ_{B类 e（电子） t吨一}$	$(0.4091, 0.4091, 0.1173, 0.0645)$
160	$ξ_{o个第页 t吨}$	$(0.1867, 0.5985, 0.1542, 0.0607)$
	$ξ_{U型 n个我（f） o个第页米}$	$(0.2591, 0.2868, 0.2517, 0.2023)$
	$ξ_{B类 e（电子） t吨一}$	$(0.4109, 0.4109, 0.1150, 0.0633)$

在单独的窗口中打开

与示例1类似，我们在图中绘制了与优化设计相关的双边测试的功率三（a）假设 $(α, δ / σ) = (5 %, 0.6)$ 适用于各种样本大小。从图中可以看出，在所有竞争设计中，局部优化设计的功率最高。在这个例子中，贝叶斯贝塔优化设计与贝叶斯均匀优化设计相比具有最大的威力。平衡的设计具有最低的功率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1779195_F0003_OC.jpg

在单独的窗口中打开

图3。

（a）平衡设计的功率图( $ξ_{B类一我}$ )，本地( $ξ_{o个第页 t吨}$ )，贝叶斯统一( $ξ_{U型 n个我（f） o个第页米}$ )和贝叶斯测试版( $ξ_{B类 e（电子） t吨一}$ )最佳设计。功率计算为 $5 %$ 双边检验假设的显著性水平 $δ / σ = 0.6$ .（b）与本地设计相关的功率箱线图 $ξ_{o个第页 t吨} = (0.1874, 0.5946, 0.1552, 0.0628)$ 、贝叶斯均匀优化设计 $ξ_{U型 n个我（f） o个第页米} = (0.2592, 0.2873, 0.2518, 0.2017)$ 和贝叶斯贝塔优化设计 $ξ_{B类 e（电子） t吨一} = (0.4066, 0.4066, 0.1204, 0.0663)$ 基于500个样本 $ρ$ 从参数空间绘制。

接下来，我们进行了敏感性分析。基于 $\hat{ρ}$ 计算了均匀和beta先验的最优设计。这些设计是 $ξ_{o个第页 t吨} = (0.1874, 0.5946, 0.1552, 0.0628)$ , $ξ_{U型 n个我（f） o个第页米} = (0.2592, 0.2873, 0.2518, 0.2017)$ , $ξ_{B类 e（电子） t吨一} = (0.4066, 0.4066, 0.1204, 0.0663)$ 分别是。然后500个样本 $ρ$ 从参数空间（均匀先验的范围）绘制。对于每个样品 $ρ$ 和 $(α, δ / σ, N个) = (5 %, 0.6, 84)$ ，计算与这些设计相关的功率。图中绘制了这500次幂的方框图三（b） ●●●●。从箱位可以得出以下结论： $ξ_{o个第页 t吨}$ 和 $ξ_{B类 e（电子） t吨一}$ 是相似的，然而 $ξ_{U型 n个我（f） o个第页米}$ 比剩下的两个稍微好一点。

5.总结与讨论

众所周知，适当的聚类匹配可以改进统计推断。在本文中，我们提出了一种匹配对聚类随机试验的优化设计。将所提设计的性能与常用的平衡设计进行了比较。通过一些数值研究表明，与平衡设计相比，该设计在估算方面具有更高的效率，并且报告了更高的处理效果测试功率。设计取决于我们称之为相似性度量的未知参数。该参数的值可以根据基于类似研究的数据或专家建议的值进行估算。因此，所提出的优化设计是局部优化设计。如果参数中存在更多不确定性，则可以使用贝叶斯方法获得更稳健的设计。然而，贝叶斯设计对先验的选择也很敏感。我们简要讨论了设计问题的这一方面。

在当前设置中，假设每个手臂中的簇数是固定的。出于实际兴趣，需要为每个臂中不同数量的簇找到最佳设计。最近，在[25]. 嵌套模型的高阶扩展[19]也会有实际意义。所提出的寻找最优设计的方法可以推广到广义线性模型（GLM）。在GLM设置中，贝叶斯方法更具吸引力，因为优化设计取决于模型参数。

请注意，在MPCRT中对集群进行配对需要强有力的证据。中讨论了匹配簇的一些适当技术[8]. 在本文中，我们没有探讨MPCRT的这一方面。然而，我们强调，所提出的设计的性能取决于集群配对的优点。

补充材料

补充材料：

单击此处查看其他数据文件。^{（182K，pdf）}

披露声明

提交人没有报告任何潜在的利益冲突。

工具书类

1Atkinson A.C.、Donev A.N.和Tobias R.D。，用SAS优化实验设计，牛津大学出版社，牛津，2007年。[谷歌学者]

2Candel M.J.J.M.和Van Breukelen G.J.P。，具有固定簇大小和异质组内相关性和方差的随机试验中治疗效果的样本量计算,统计方法医学研究。 24（2015），第557–573页。doi:10.1177/0962280214563100[公共医学] [交叉参考][谷歌学者]

三。Donner A.和Klar N。，健康研究中分组随机试验的设计与分析阿诺德，伦敦，2000年。[谷歌学者]

4Donner A.和Koval J.J。，家庭数据分析中类内相关性的估计,生物计量学 36（1980），第19-25页。doi:10.2307/2530491[公共医学] [交叉参考][谷歌学者]

5El-Mikkawy M.和Karawia A。，一般三对角矩阵的求逆,申请。数学。莱特。 19（2006），第712-720页。doi:10.1016/j.aml.2005.11.012[交叉参考][谷歌学者]

6Feng Z.和Thompson B。，社区干预试验中的一些设计问题,控制。临床。试验。 23（2002），第431-449页。doi:10.1016/S0197-2456（02）00206-4[公共医学] [交叉参考][谷歌学者]

7Heo H.和Leon A。，三水平分层整群随机试验的统计能力和样本量要求,生物计量学 64（2008），第1256–1262页。doi:10.1111/j.1541-0420.2008.00993.x[公共医学] [交叉参考][谷歌学者]

8Imai K.、King G.和Nall C。，成对匹配在分组随机实验中的重要作用及其在墨西哥全民健康保险评估中的应用,统计科学。 24（2009），第29-53页。doi:10.1214/08-STS274[交叉参考][谷歌学者]

9康斯坦托普洛斯S。，三级集群随机设计功率分析中的综合成本,评估。版次。 33（2009），第335-357页。doi:10.1177/0193841X09337991[公共医学] [交叉参考][谷歌学者]

10Lemme F.、Van Breukelen G.J.P.和Berger M.P.F。，有效的治疗分配

2 \times 2

当成本和方差不均匀时，分组随机试验,统计医学。 35（2016），第4320–4334页。doi:10.1002/sim.7003[公共医学] [交叉参考][谷歌学者]

11.Martin D.C.、Diehr P.、Perrin E.B.和Koepsell T.D。，配对对随机社区干预研究效果的影响,统计医学。 12（1993），第329-338页。doi:10.1002/sim.4780120315[公共医学] [交叉参考][谷歌学者]

12Raudenbush S.W.公司。，整群随机试验的统计分析与优化设计,精神病。方法。 2（1997），第173-185页。doi:10.1037/1082-989X.2.2.173[交叉参考][谷歌学者]

13Rutterford C.、Copas A.和Eldridge S。，集群随机试验中样本量的确定方法,国际流行病学杂志。 44（2015），第1051–1067页。doi:10.1093/ije/dyv113[PMC免费文章][公共医学] [交叉参考][谷歌学者]

14Singh S.P.和Davidov O.，《关于假设检验问题的Bayes和Nash实验设计》，提交2019a年。

15Singh S.P.和Davidov O。，有序处理实验的设计,J.Royal Stat.Soc.:爵士。B类 81（2019b），第881-900页。doi:10.1111/rssb.12335[交叉参考][谷歌学者]

16Singh S.P.和Mukhopadhyay S。，广义线性模型的贝叶斯交叉设计,计算。统计数据分析。 104（2016a），第35-50页。doi:10.1016/j.csda.2016.06.002[交叉参考][谷歌学者]

17.Singh S.P.和Mukhopadhyay S。，贝叶斯最优聚类设计,统计方法。 32（2016b），第36-52页。doi:10.1016/j.stamet.2016.02.002[交叉参考][谷歌学者]

18Singh R.和Mukhopadhyay S。，计数时间序列的精确贝叶斯设计,计算。统计数据分析。 134（2019年），第157-170页。doi:10.1016/j.csda.2018.12.008[交叉参考][谷歌学者]

19Singh S.P.、Mukhopadhyay S.和Roy A。，基于分位数分散图的三水平聚类随机试验比较,J.应用。斯达。 42（2015），第1792-1812页。doi:10.1080/0226677633.2015.1010491[交叉参考][谷歌学者]

20Spiegelhalter D.J.公司。，连续响应的分组随机试验的贝叶斯方法,统计医学。 20（2001），第435-452页。doi:10.1002/1097-0258（20010215）20:3<435:：AID-SIM804>3.0.CO；2-E型[公共医学] [交叉参考][谷歌学者]

21Thompson S.G.、Pyke S.D.M.和Hardy R.J。，配对分组随机试验的设计与分析：荟萃分析技术的应用,统计医学。 16（1997），第2063-2079页。doi:10.1002/（SICI）1097-0258（19970930）16:18＜2063：：AID-SIM642＞3.0.CO；2-8 [公共医学] [交叉参考][谷歌学者]

22Van Breukelen G.J.P.和Candel M.J.J.M。，具有治疗依赖性费用和治疗依赖性未知方差的分组随机试验的有效设计,统计医学。 37（2018），第3027-3046页。数字对象标识代码：10.1002/sim.7824[PMC免费文章][公共医学] [交叉参考][谷歌学者]

23Van Breukelen G.J.P.、Candel M.J.J.M.和Berger M.P.F。，分组随机试验和多中心试验中不等与等分组大小的相对效率,统计医学。 26（2007），第2589–2603页。doi:10.1002/sim.2740[公共医学] [交叉参考][谷歌学者]

24Waterhouse W.C.公司。，对称问题有对称解吗？,美国数学。周一。 90（1983年），第378-387页。doi:10.1080/00029890.1983.1971235[交叉参考][谷歌学者]

25Wu S.、Wong W.K.和Crespi C.M。，分组随机试验的Maximin最优设计,生物计量学 73（2017），第916–926页。doi:10.1111/biom.12659[PMC免费文章][公共医学] [交叉参考][谷歌学者]

26Wu Z.、Frangakis C.E.、Louis T.A.和Scharfstein D.O。，通过校正组间协变量不平衡来评估配对分组随机试验的治疗效果,生物计量学 70（2014），第1014–1022页。doi:10.1111/biom.12114[PMC免费文章][公共医学] [交叉参考][谷歌学者]

27You Z.、Williams O.D.、Iban I.、Kabaganbe E.K.、Tiwari H.和Cutter G。，可变簇大小的簇随机试验的相对效率和样本量,临床试验 8（2011），第27-36页。doi:10.1177/1740774510391492[公共医学] [交叉参考][谷歌学者]

来自的文章应用统计学杂志由以下人员提供Taylor&Francis律师事务所