跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
J应用统计。2021; 48(9): 1527–1540.
2020年6月12日在线发布。 数字对象标识:10.1080/02664763.2020.1779195
预防性维修识别码:PMC9097976
PMID:35706575

固定异质簇数配对随机试验中受试者的最优分配

关联数据

补充资料

摘要

在分组随机试验中,研究人员将家庭、医疗机构、学校或教室等人群随机分组,尽管感兴趣的单位是个人。它导致在未知参数的估计方面的效率损失,以及用于测试治疗效果的测试的功率损失。为了弥补这种效率损失,一些研究将相似的集群配对,并在配对中随机处理。然而,治疗臂内的簇在性质上可能是异质的。在本文中,我们提出了一种局部优化设计,该设计考虑了集群的异质性,并在每个集群中优化分配主题。为了解决设计对未知参数的依赖性,我们还讨论了贝叶斯优化设计。通过一些数据示例对所提设计的性能进行了数值研究。

关键词:贝叶斯设计,分组随机试验,效率,配对分组,优化设计,功率

1.简介

集群随机试验(CRT)广泛应用于社会和教育调查、健康研究社区、行为和生物医学科学等领域[]. 与完全随机设计(CRD)相比,CRT在治疗组内随机化分组。集群中的主题具有相似性,这使得CRT的效率低于CRD。然而,从伦理、成本和污染的角度来看,阴极射线管仍被广泛使用。使用匹配对策略可以提高CRT的效率。在匹配对CRT(MPCRT)中,簇最初是基于可用背景特征(如人口或地理特征)的相似性进行匹配的。考虑到匹配的潜在优点,Martin等人。[11]表明MPCRT提高了与测试治疗效果相关的测试能力。当集群进行适当配对时,也可以改进对治疗效果的估计[21]. Imai等人的论文。[8]附和了这些发现,并强调要适当使用MPCRT。

一旦确定了潜在的匹配簇(基于初始特征),就会从每个匹配对簇中随机分配一个处理。可以合理地假设匹配对簇在本质上是均匀的。然而,在治疗范围内,集群可能是异质的。在设计此类实验时,通常忽略异质性,并基于平衡设计来规划实验。在平衡设计中,每个集群接收到相同数量的观察结果。基于平衡设计的最佳CRT讨论于[7,9,12]. 有一些研究表明,在各种设置下,大小不等的CRT比大小相等的集群更有效,例如[23,27]和[2]. 在最近的一些研究中,考虑了异质性集群(治疗臂内的异质性),并且不平衡设计显示出更有效,参见,例如[10]和[22].

配对设计中的样本量确定在[6]以及[13]对于均质集群。在本文中,我们提出了一种考虑簇间异质性和类内同质性的优化设计。在以下假设下获得了一个最优设计:(i)总样本量预先固定,(ii)配对聚类是均匀的,大小相等,(iii)每只手臂(治疗)中的聚类数是固定的,相等,(iv)两个配对聚类中一个聚类中受试者之间的变异性是相同的。在MPCRT中,通常假设每个治疗臂中的簇数相等,如[8]和[26]. 通过引入变异性测量参数,通过协方差结构将聚类内的变异性纳入模型中。根据这些参数的已知值进行设计。因此,得到的设计是局部最优设计。为了解决局部最优设计对参数的依赖性,我们简要描述了贝叶斯方法的使用,类似于[16]和[17].

文章结构如下。在节中2,我们定义了模型并讨论了模型参数的估计。论文的主要贡献在第节在本节中,我们提出了设计标准,并获得了相关的优化设计。采用贝叶斯方法来处理先前提出的设计的局部性质。导出了检测处理效果的幂函数。讨论了一种迭代过程,以找到所需的样本大小,从而获得预先指定的功率。章节4包含建议的方法的数值示例,以查找局部和贝叶斯优化设计。还提供了一个实际数据示例。第节对本工作的进一步扩展进行了总结和讨论5.

2.模型和估算

考虑一个两级集群模型,其中两个治疗组具有每组中的集群。让索引表示th治疗组和j个代表j个第个集群。此外,让j个=(j个1,,j个n个j个)T型表示向量n个j个来自j个嵌套在第个治疗组。向量j个作为具有平均向量的多元正态随机变量独立分布

E类(j个)=μ1n个j个+βx个j个1n个j个,
(1)

和方差矩阵变量(j个)=σ2V(V)j个(ρj个),其中μβ是与总体效果和治疗效果相对应的固定参数,x个j个如果 = 1和1,如果 = 2,和1n个j个是所有长度的向量n个j个.参数ρj个测量嵌套在j个内的第个簇th处理。纳入第节中的假设1,我们有

Cov公司(j个,k个)=σ2V(V)j个(ρj个)(f) =k个,n个d日j个=,0o个t吨小时e(电子)第页w个e(电子),
(2)

n个j个=n个j个对于 = 1, 2. 假设ρj个=ρj个对于=1,2参数ρj个测量嵌套在j个第个集群,其中j个=1,,.我们使用了方差矩阵的复合对称结构,其定义为

V(V)j个(ρj个)=(1ρj个)+ρj个J,
(3)

哪里是单位矩阵J是所有有序矩阵n个j个×n个j个对于j个=1,,.

回归参数(μ,β)可以使用最大似然估计(MLE)方法进行估计。与随机向量相关的完整对数似然函数Y(Y)=(11,,1,21,,2)T型可以表示为

L(左)(Y(Y),μ,β,ρ)=N个日志(2π)+N个日志(σ2)+j个=1日志|V(V)j个|12j个=1(1j个μ1n个j个)T型V(V)j个1(1j个μ1n个j个)12j个=1(2j个μ1n个j个β1n个j个)T型V(V)j个1(2j个μ1n个j个β1n个j个).
(4)

假设σρj个已知的最大似然估计量(μˆ,βˆ)属于(μ,β)计算公式如下:

βˆ=j个=11n个j个T型{垂直}j个1(2j个1j个)j个=11n个j个T型{垂直}j个11n个j个
(5)

μˆ=j个=11n个j个T型{垂直}j个11j个j个=11n个j个T型{垂直}j个11n个j个.
(6)

参数的最大似然估计σ2ρ可以使用中描述的方法进行[4]经过适当修改后。

3.设计评估

3.1. 设计标准

假设有N个每个治疗组可用的实验单位。问题是如何分配这些N个服从集群,以便我们将很快定义的设计选择标准得到优化。设计空间定义为N个={(n个1,,n个):n个j个0,j个=1n个n个j个=N个}.每一个这样的排列N个主题被称为精确设计。找到一个精确的最优设计在数学上可能很难。相反,我们寻求近似设计ξΞ,其中Ξ={(ξ1,,ξ):0ξj个1,j个=1ξj个=1}是单位单纯形。换句话说,ξj个=n个j个/N个j个簇大小与总实验单元数之比。

应根据实验目标获得最佳设计。例如,如果主要目的是找到一种改进模型参数估计的设计,则应使用基于信息矩阵的标准。一些常用的按字母顺序命名的标准是A类,D类E类优化(参见[1]). 通常,人们的兴趣是找到一种有利于测试所需假设的优化设计,即基于幂函数的优化设计(参见[15]). 在这里,我们给出了鲁棒估计的最优设计。特别是,我们寻求最佳设计,以最小化与治疗效果相关的参数估计值的方差。这相当于找到D类-最佳设计(参见[1]). 通过数值研究,我们表明,与常用的平衡设计相比,所提出的设计在测试处理效果方面具有更强的能力。

中给出的治疗效果估计值的方差(5)是

V(V)第页(βˆ)=2σ2j个=1ξj个(1/N个)(1ρj个)+ξj个ρj个1.
(7)

请注意,当ρj个=ρn个j个=n个为所有人j个=1,,, (7)减少到

V(V)第页(βˆ)=2σ2n个1+(n个1)ρ1

等于估计值的方差β在中给出[17]. 以下[17],标准化方差V(V)第页(βˆ)/σ2可用于找到最佳设计。可以观察到,最优设计是不变的σ2.

可以看出,估计值的方差β在中给出(5)是设计的功能ξ,未知参数ρ=(ρ1,,ρ)和样本量N个.优化设计,最大限度地减少V(V)第页(βˆ)可以通过最大化V(V)第页(βˆ)1因此,我们倾向于写作

ψ(ξ;ρ,N个)=V(V)第页(βˆ)1.
(8)

在我们的背景下,最佳设计ξo个第页t吨满足

ξo个第页t吨=参数最大值ξΞψ(ξ;ρ,N个).
(9)

设计的性能ξ与设计相比η可以通过定义的效率函数进行测量

E类(f)(f)(ξ,η)=ψ(ξ;ρ,N个)ψ(η;ρ,N个).
(10)

条件E类(f)(f)(ξ,η)>1意味着ξ与相比效率更高η,而E类(f)(f)(ξ,η)=1这意味着两种设计都是同样有效的。

3.2. 局部优化设计

如中所述(8),使用获得的优化设计(9)取决于未知参数ρ和总样本量N个为了进行可靠和稳健的推理,必须根据ρ这接近于真实的总体参数。这些值要么由专家建议,要么可以通过类似历史研究的试点数据进行估计。假设我们对ρ然后,根据猜测值进行优化设计ρ可以使用。以下定理提供了基于给定值的优化设计ρ即局部最优设计。

定理3.1

最佳设计如下所示ξo个第页t吨=(ξ1,,ξ),哪里

ξj个=1ρj个1(1/N个)1ρj个b条ρj个对于 j个=1,,,
(11)

=k个=11ρk个/ρk个, b条=k个=1(1ρk个)/ρk个.

证明。

在不失一般性的情况下,我们假设σ2=1这个问题的拉格朗日函数是

L(左)(ξ;ρ)=[ψ(ξ;ρ,N个)]+αj个=1ξj个1

解决方案满足系统要求

L(左)(ξ;ρ)ξj个=(1/N个)(1ρj个){(1/N个)(1ρj个)+ξj个ρj个}2+α=0,对于 j个=1,,
(12)

L(左)(ξ;ρ)α=j个=1ξj个1=0
(13)

方程式(12)和(13)可以写为以下矩阵形式(详见补充材料):

A类ξ=b条,
(14)

哪里

A类=T型u个v(v)T型1,T型=ρ1ρ21ρ11ρ20000ρ2ρ1ρ21ρ000ρρ+11ρ1ρ+10ρ11ρ21ρ100ρ1,
(15)

v(v)T型=(1,,1),u个=(0,,0,ρ(1ρ1)/(1ρ))T型第个条目b条b条=1N个1ρ1ρ+11ρ对于=1,,1、和b条=1.矩阵的逆矩阵A类可以通过以下方式给出

A类1=T型1+T型1u个1v(v)T型T型11T型1u个1v(v)T型T型11,

哪里=1v(v)T型T型1u个.

矩阵T型是一个三对角矩阵,其逆矩阵可以通过以下公式计算[5]. 经过繁琐但不太困难的计算ξo个第页t吨=A类1b条给出了所需的解决方案(11). 这就完成了证明。

很明显(11)如果ρ=ρj个,然后ξ=ξj个此外,以下推论表明,具有较大值ρ与值较小的集群相比,需要较少的主题ρj个.

推论3.2

如果ρρj个然后ξξj个.

证明。

让我们假设ρρj个.来自(11),我们有

ξξj个=1ρρ1(1/N个)1ρb条1ρj个ρj个1(1/N个)1ρj个b条=1(b条/N个+1)1ρρ1ρj个ρj个+(1/N个)(ρρj个)ρρj个1(b条/N个+1)1ρρ1ρj个ρj个+(1/N个)(ρρj个)ρρj个
(16)

=1(b条/N个+11/N个)(ρj个ρ)ρρj个0,
(17)

其中不等式(16)根据以下事实1x个1/x个11/对于0<x个1,以及中的最后一个不等式(17)根据不等式ρρj个。这就完成了证明。

通常样本大小N个在实验之前未知。对于大样本量,近似最优设计可以计算为N个.大样本近似优化设计ξ获得方式为ξ=1ρ1/ρ1,,1ρ/ρ.

3.3. 贝叶斯优化设计

局部优化设计ξo个第页t吨在中给出(11)对ρ。可以使用伪巴耶斯中提出的方法[16–18]. 在这种方法中ρ假设,然后将其并入(8)通过对假定的先验进行积分和平均。形式上,贝叶斯优化设计ξB类o个第页t吨定义为

ξB类=参数最大值ξΞP(P)ψ(ξ;ρ,N个)d日F类(ρ)=参数最大值ξΞψB类(ξ;N个),
(18)

哪里

ψB类(ξ;N个)=P(P)ψ(ξ;ρ,N个)d日F类(ρ),
(19)

P(P)是的参数空间ρF类是对应的累积分布函数ρ.

贝叶斯优化设计还取决于先验值的选择。因此,在确定先验分布函数时需要仔细注意F类。在以下情况下,对之前的错误规范进行详细的敏感性分析:ρj个=ρ为所有人j个,我们指的是[17].

3.3.1. 统一优先级

这里我们解释了当独立的均匀先验被分配给ρj个.考虑一下ρj个的独立分布为U型n个(f)o个第页(j个,b条j个)对于j个=1,,,其中0<j个<b条j个<1。然后从(19),我们得到(详见补充资料)

ψB类(ξ;N个)=12σ2j个=1ξj个(b条j个j个)(ξj个1/N个)日志(1/N个)(1b条j个)+b条j个ξj个(1/N个)(1j个)+j个ξj个.
(20)

贝叶斯优化设计可以通过最大化(20)关于ξΞ.贝叶斯优化设计的解析解通常很难求解。因此,需要使用数值优化技术来寻找贝叶斯设计。然而,值得注意的是,当j个=b条j个=b条为所有人j个,然后使用的备注1[14] (Purkiss原则, [24])贝叶斯设计满足ξ=ξj个为所有人j个换句话说,贝叶斯优化设计是一种平衡设计ξB类=(1/,,1/).

3.3.2. 贝塔先验

另一个有用的优先选择ρj个的意思是假设ρj个的作为贝塔随机变量独立分布[20]. 假设ρj个的独立分布为B类e(电子)t吨(j个,b条j个)对于j个=1,,,然后(19)可以写为

ψB类(ξ;N个)=12σ2j个=1ξj个B类e(电子)t吨(j个,b条j个)01ρj个j个1(1ρj个)b条j个1(1/N个)(1ρj个)+ξj个ρj个d日ρj个.
(21)

集成(21)难以解析求解。因此,需要一些数值方法来计算(21). 与统一优先权的情况一样,如果j个=b条j个=b条对于j个=1,,贝叶斯优化设计是一种平衡设计。

3.4. 功率和样本量计算

假设兴趣在于测试治疗效果的重要性。然后,我们将对以下测试问题感兴趣

H(H)0:β=β0v(v)e(电子)第页u个 H(H)1:ββ0=δ0
(22)

最大似然估计βˆ在中给出(5)可以用作测试统计信息(22). 统计数据βˆ近似遵循平均值的正态分布β和方差ψ1(ξ;ρ,N个)因此,幂函数π(ξ;ρ,N个)与测试统计信息关联βˆ用于测试(22)由提供

π(ξ;ρ,δ,N个)=Φz(z)(1α/2)+δψ(ξ;ρ,N个)+Φz(z)(1α/2)δψ(ξ;ρ,N个),
(23)

哪里Φ()表示标准正态随机变量的累积分布函数z(z)(1α/2)(1α/2)标准正态分布的分位数。

实现预先指定的功率π0,可以使用顺序过程。从合理的样本量开始N个0,找到最佳设计ξo个第页t吨基于给定的值(N个0,ρ,δ)并计算π(ξo个第页t吨;ρ,δ,N个0).如果π(ξo个第页t吨;ρ,δ,N个0)<π0然后增加N个0N个0+1并重复该过程,直到达到预定功率。类似地,如果π(ξo个第页t吨;ρ,δ,N个0)>π0然后减少N个0N个01并重复该过程。

4.数值研究

4.1. 示例1

在此,我们提供假设数据示例,以说明方法并评估建议的优化设计的性能。假设σ2=1,考虑以下场景:

  1.  = 4和ρ=(0.1,0.02,0.3,0.05).
  2.  = 5和ρ=(0.1,0.2,0.3,0.4,0.5).

可以从以下位置观察到(11)局部最优设计取决于样本大小N个在场景1中N个{80,82,,98}在表中计算和报告1大样本近似优化设计计算如下ξ=(0.1167,0.6091,0.0343,0.2399).从表1,可以观察到ξ和基于不同值的局部优化设计N个大致相同。就功率而言(在(23)),这些设计具有类似的性能(未报告)。

表1。

场景1下的局部最优设计。
N个 ξo个第页t吨
80(0.1176, 0.6069, 0.0355, 0.2400)
82(0.1175, 0.6070, 0.0355, 0.2400)
84(0.1175, 0.6070, 0.0355, 0.2400)
86(0.1175, 0.6071, 0.0354, 0.2400)
88(0.1175, 0.6071, 0.0354, 0.2400)
90(0.1175, 0.6072, 0.0354, 0.2400)
92(0.1174, 0.6072, 0.0354, 0.2400)
94(0.1174, 0.6073, 0.0354, 0.2400)
96(0.1174, 0.6073, 0.0353, 0.2399)
98(0.1174, 0.6073, 0.0353, 0.2399)

在场景2下,将平衡设计的性能与局部最优设计和贝叶斯最优设计进行比较。基于真实值的局部优化设计ρN个{50,,150}计算。为了找到基于均匀先验的贝叶斯优化设计,考虑了以下方法。假设集群大小相等n个 = 50,每个的经验置信区间ρ使用最大似然估计基于1000个模拟进行计算。重要性级别固定为5%.与ρ的是[0,0.2524],[0,0.3186],[0.1157,0.3865],[0.1204,0.4864][0.1543,0.5971]。这些间隔用作ρ的。基于这些统一先验,贝叶斯设计使用(20)的N个{50,,150}已计算。beta测试版ρ的选择应涵盖ρ和不应出现在概率密度函数的极端尾部位置。如中所建议[17],选择了以下一组beta prior:ρ1B类e(电子)t吨(4,90),ρ2B类e(电子)t吨(10,35),ρB类e(电子)t吨(10,20),ρ4B类e(电子)t吨(6,10)、和ρ5B类e(电子)t吨(5,5).最佳设计N个{50,100,150}在表中报告2.局部效率图(ξo个第页t吨),贝叶斯统一(ξU型n个(f)o个第页)和贝叶斯测试版(ξB类e(电子)t吨)最优设计与平衡设计的比较(ξB类)如图所示1(a) ●●●●。从效率图中可以清楚地看出,局部最优设计表现最好,其次是贝叶斯均匀设计。贝叶斯贝塔优化设计报告效率最低。所有优化设计都优于平衡设计,因为对于以下所有值,效率始终大于1N个通过观察这些设计的功率图可以得出类似的结论(见图1(b) )。与所有优化设计相关的功率计算用于双边测试,使用(23)假设(α,δ/σ)=(5%,0.75).

保存图片、插图等的外部文件。对象名称为CJAS_A_17791995_F0001_OB.jpg

(a) 局部效率图(ξo个第页t吨),贝叶斯统一(ξU型n个(f)o个第页)和贝叶斯测试版(ξB类e(电子)t吨)最优设计与平衡设计的比较(ξB类). (b) 平衡设计的功率图(ξB类),本地(ξo个第页t吨),贝叶斯统一(ξU型n个(f)o个第页)和贝叶斯测试版(ξB类e(电子)t吨)最佳设计。功率计算为5%双边检验假设的显著性水平δ/σ=0.75.

表2。

示例1:本地(ξo个第页t吨),贝叶斯统一(ξU型n个(f)o个第页)和贝叶斯测试版(ξB类e(电子)t吨)基于的优化设计N个=50,100,150
N个设计最佳比例
50 ξo个第页t吨 (0.4604,0.2219,0.14160.1007,0.0755)
  ξU型n个(f)o个第页 (0.3904,0.3072,0.1212,0.1017,0.0795)
  ξB类e(电子)t吨 (0.7011,0.1135,0.0728,0.0660,0.0466)
100 ξo个第页t吨 (0.4662,0.2222,0.1402,0.0985,0.0729)
  ξU型n个(f)o个第页 (0.4187,0.3297,0.1008,0.0850,0.0659)
  ξB类e(电子)t吨 (0.7194,0.1076,0.0676,0.0621,0.0434)
150 ξo个第页t吨 (0.4681,0.2223,0.1397,0.0978,0.0721)
  ξU型n个(f)o个第页 (0.4350,0.3428,0.0889,0.0752,0.0581)
  ξB类e(电子)t吨 (0.7272,0.1048,0.0654,0.0605,0.0422)

接下来评估建议设计的稳健性ρ,进行敏感性分析。基于真值的局部优化设计ρ场景2中给出的N个 = 50是ξo个第页t吨=(0.4604,0.2219,0.1416,0.1007,0.0755)基于均匀和贝塔先验的贝叶斯优化设计是ξU型n个(f)o个第页=(0.3904,0.3072,0.1212, 0.1017,0.0795)ξB类e(电子)t吨=(0.7011,0.1135,0.0728,0.0660,0.0466)分别是。接下来,500个随机样本ρρ的。对于每个样本,计算与贝叶斯设计和局部最优设计相关的功率。图中绘制了这500个功率值的方框图2(a) ●●●●。从箱位观察到ξo个第页t吨ξU型n个(f)o个第页性能相似,而ξB类e(电子)t吨表现最差。然而,在某些情况下,局部优化设计表现最差。例如,考虑局部优化设计ξo个第页t吨=(0.1626,0.7761,0.0217,0.0207,0.0190)在获得ρ=[0.10.10.120.130.15]。请注意ρ非常接近参数空间的边界。与此局部优化设计相关联的功率箱位以及ξU型n个(f)o个第页ξB类e(电子)t吨如图所示2(b) ●●●●。在这种情况下,局部最优设计ξo个第页t吨表现最差。

保存图片、插图等的外部文件。对象名称为CJAS_A_1779195_F0002_OC.jpg

(a) 与本地设计相关的功率方框图ξo个第页t吨=(0.4604,0.2219,0.1416,0.1007,0.0755)、贝叶斯均匀优化设计ξU型n个(f)o个第页=(0.3904,0.3072,0.1212,0.1017,0.0795)和贝叶斯贝塔优化设计ξB类e(电子)t吨=(0.7011,0.1135,0.0728,0.0660,0.0466)基于500个样本ρ从参数空间绘制。(b) 与局部设计相关的功率方框图ξo个第页t吨=(0.1626,0.7761,0.0217,0.0207,0.0190)、贝叶斯均匀优化设计ξU型n个(f)o个第页=(0.3904,0.3072,0.1212,0.1017,0.0795)和贝叶斯贝塔优化设计ξB类e(电子)t吨=(0.7011,0.1135,0.0728,0.0660,0.0466)基于500个样本ρ从参数空间绘制。

4.2. 示例2:实际数据示例

密歇根大学与教育政策研究联合会合作开展的一个研究项目(教学改进研究)[17]. 该研究的目的是确定各种综合学校改革(CSR)计划对高贫困小学教学和学生成绩的影响。被测量的反应是幼儿园学生在春季出现时获得的数学成绩,即国家认可的评估工具Terra Nova Level 10。学生(n个)被嵌套在学校和两个改革项目,即“美洲选择”和“人人成功”,被视为治疗。当时有 = 每个治疗组4组n个 = 每所学校21名学生。因此,他们采用了平衡设计。我们根据地理相似性将集群配对。最大似然估计ρρˆ=(0.0634,0.02,0.0765,0.1877).对于制服,我们考虑ρj个U型n个(f)o个第页(0,ρˆj个+0.4)对于j个=1,,4优先权的选择有些模糊,但包括ρ(>0)和点估计ρˆ。对beta版之前的版本进行了以下选择:ρ1B类e(电子)t吨(4,90),ρ2B类e(电子)t吨(4,90),ρB类e(电子)t吨(10,70)、和ρ4B类e(电子)t吨(6,20)在这两种情况下,ρj个的是独立分布的。优化设计N个{80,120,160}在表中报告.

表3。

示例2:本地(ξo个第页t吨),贝叶斯统一(ξU型n个(f)o个第页)和贝叶斯测试版(ξB类e(电子)t吨)基于的优化设计N个=84,120,160
N个设计最佳比例
84 ξo个第页t吨 (0.1874,0.5946,0.1552,0.0628)
  ξU型n个(f)o个第页 (0.2592,0.2873,0.2518,0.2017)
  ξB类e(电子)t吨 (0.4066,0.4066,0.1204,0.0663)
120 ξo个第页t吨 (0.1869,0.5970,0.1546,0.0615)
  ξU型n个(f)o个第页 (0.2592,0.2870,0.2517,0.2021)
  ξB类e(电子)t吨 (0.4091,0.4091,0.1173,0.0645)
160 ξo个第页t吨 (0.1867,0.5985,0.1542,0.0607)
  ξU型n个(f)o个第页 (0.2591,0.2868,0.2517,0.2023)
  ξB类e(电子)t吨 (0.4109,0.4109,0.1150,0.0633)

与示例1类似,我们在图中绘制了与优化设计相关的双边测试的功率(a) 假设(α,δ/σ)=(5%,0.6)适用于各种样本大小。从图中可以看出,在所有竞争设计中,局部优化设计的功率最高。在这个例子中,贝叶斯贝塔优化设计与贝叶斯均匀优化设计相比具有最大的威力。平衡的设计具有最低的功率。

保存图片、插图等的外部文件。对象名称为CJAS_A_1779195_F0003_OC.jpg

(a) 平衡设计的功率图(ξB类),本地(ξo个第页t吨),贝叶斯统一(ξU型n个(f)o个第页)和贝叶斯测试版(ξB类e(电子)t吨)最佳设计。功率计算为5%双边检验假设的显著性水平δ/σ=0.6.(b)与本地设计相关的功率箱线图ξo个第页t吨=(0.1874,0.5946,0.1552,0.0628)、贝叶斯均匀优化设计ξU型n个(f)o个第页=(0.2592,0.2873,0.2518,0.2017)和贝叶斯贝塔优化设计ξB类e(电子)t吨=(0.4066,0.4066,0.1204,0.0663)基于500个样本ρ从参数空间绘制。

接下来,我们进行了敏感性分析。基于ρˆ计算了均匀和beta先验的最优设计。这些设计是ξo个第页t吨=(0.1874,0.5946,0.1552,0.0628),ξU型n个(f)o个第页=(0.2592,0.2873,0.2518,0.2017),ξB类e(电子)t吨=(0.4066,0.4066,0.1204,0.0663)分别是。然后500个样本ρ从参数空间(均匀先验的范围)绘制。对于每个样品ρ(α,δ/σ,N个)=(5%,0.6,84),计算与这些设计相关的功率。图中绘制了这500次幂的方框图(b) ●●●●。从箱位可以得出以下结论:ξo个第页t吨ξB类e(电子)t吨是相似的,然而ξU型n个(f)o个第页比剩下的两个稍微好一点。

5.总结与讨论

众所周知,适当的聚类匹配可以改进统计推断。在本文中,我们提出了一种匹配对聚类随机试验的优化设计。将所提设计的性能与常用的平衡设计进行了比较。通过一些数值研究表明,与平衡设计相比,该设计在估算方面具有更高的效率,并且报告了更高的处理效果测试功率。设计取决于我们称之为相似性度量的未知参数。该参数的值可以根据基于类似研究的数据或专家建议的值进行估算。因此,所提出的优化设计是局部优化设计。如果参数中存在更多不确定性,则可以使用贝叶斯方法获得更稳健的设计。然而,贝叶斯设计对先验的选择也很敏感。我们简要讨论了设计问题的这一方面。

在当前设置中,假设每个手臂中的簇数是固定的。出于实际兴趣,需要为每个臂中不同数量的簇找到最佳设计。最近,在[25]. 嵌套模型的高阶扩展[19]也会有实际意义。所提出的寻找最优设计的方法可以推广到广义线性模型(GLM)。在GLM设置中,贝叶斯方法更具吸引力,因为优化设计取决于模型参数。

请注意,在MPCRT中对集群进行配对需要强有力的证据。中讨论了匹配簇的一些适当技术[8]. 在本文中,我们没有探讨MPCRT的这一方面。然而,我们强调,所提出的设计的性能取决于集群配对的优点。

补充材料

补充材料:

披露声明

提交人没有报告任何潜在的利益冲突。

工具书类

1Atkinson A.C.、Donev A.N.和Tobias R.D。,用SAS优化实验设计,牛津大学出版社,牛津,2007年。[谷歌学者]
2Candel M.J.J.M.和Van Breukelen G.J.P。,具有固定簇大小和异质组内相关性和方差的随机试验中治疗效果的样本量计算,统计方法医学研究。 24(2015),第557–573页。doi:10.1177/0962280214563100[公共医学] [交叉参考][谷歌学者]
三。Donner A.和Klar N。,健康研究中分组随机试验的设计与分析阿诺德,伦敦,2000年。[谷歌学者]
4Donner A.和Koval J.J。,家庭数据分析中类内相关性的估计,生物计量学 36(1980),第19-25页。doi:10.2307/2530491[公共医学] [交叉参考][谷歌学者]
5El-Mikkawy M.和Karawia A。,一般三对角矩阵的求逆,申请。数学。莱特。 19(2006),第712-720页。doi:10.1016/j.aml.2005.11.012[交叉参考][谷歌学者]
6Feng Z.和Thompson B。,社区干预试验中的一些设计问题,控制。临床。试验。 23(2002),第431-449页。doi:10.1016/S0197-2456(02)00206-4[公共医学] [交叉参考][谷歌学者]
7Heo H.和Leon A。,三水平分层整群随机试验的统计能力和样本量要求,生物计量学 64(2008),第1256–1262页。doi:10.1111/j.1541-0420.2008.00993.x[公共医学] [交叉参考][谷歌学者]
8Imai K.、King G.和Nall C。,成对匹配在分组随机实验中的重要作用及其在墨西哥全民健康保险评估中的应用,统计科学。 24(2009),第29-53页。doi:10.1214/08-STS274[交叉参考][谷歌学者]
9康斯坦托普洛斯S。,三级集群随机设计功率分析中的综合成本,评估。版次。 33(2009),第335-357页。doi:10.1177/0193841X09337991[公共医学] [交叉参考][谷歌学者]
10Lemme F.、Van Breukelen G.J.P.和Berger M.P.F。,有效的治疗分配2×2当成本和方差不均匀时,分组随机试验,统计医学。 35(2016),第4320–4334页。doi:10.1002/sim.7003[公共医学] [交叉参考][谷歌学者]
11.Martin D.C.、Diehr P.、Perrin E.B.和Koepsell T.D。,配对对随机社区干预研究效果的影响,统计医学。 12(1993),第329-338页。doi:10.1002/sim.4780120315[公共医学] [交叉参考][谷歌学者]
12Raudenbush S.W.公司。,整群随机试验的统计分析与优化设计,精神病。方法。 2(1997),第173-185页。doi:10.1037/1082-989X.2.2.173[交叉参考][谷歌学者]
13Rutterford C.、Copas A.和Eldridge S。,集群随机试验中样本量的确定方法,国际流行病学杂志。 44(2015),第1051–1067页。doi:10.1093/ije/dyv113[PMC免费文章][公共医学] [交叉参考][谷歌学者]
14Singh S.P.和Davidov O.,《关于假设检验问题的Bayes和Nash实验设计》,提交2019a年。
15Singh S.P.和Davidov O。,有序处理实验的设计,J.Royal Stat.Soc.:爵士。B类 81(2019b),第881-900页。doi:10.1111/rssb.12335[交叉参考][谷歌学者]
16Singh S.P.和Mukhopadhyay S。,广义线性模型的贝叶斯交叉设计,计算。统计数据分析。 104(2016a),第35-50页。doi:10.1016/j.csda.2016.06.002[交叉参考][谷歌学者]
17.Singh S.P.和Mukhopadhyay S。,贝叶斯最优聚类设计,统计方法。 32(2016b),第36-52页。doi:10.1016/j.stamet.2016.02.002[交叉参考][谷歌学者]
18Singh R.和Mukhopadhyay S。,计数时间序列的精确贝叶斯设计,计算。统计数据分析。 134(2019年),第157-170页。doi:10.1016/j.csda.2018.12.008[交叉参考][谷歌学者]
19Singh S.P.、Mukhopadhyay S.和Roy A。,基于分位数分散图的三水平聚类随机试验比较,J.应用。斯达。 42(2015),第1792-1812页。doi:10.1080/0226677633.2015.1010491[交叉参考][谷歌学者]
20Spiegelhalter D.J.公司。,连续响应的分组随机试验的贝叶斯方法,统计医学。 20(2001),第435-452页。doi:10.1002/1097-0258(20010215)20:3<435::AID-SIM804>3.0.CO;2-E型[公共医学] [交叉参考][谷歌学者]
21Thompson S.G.、Pyke S.D.M.和Hardy R.J。,配对分组随机试验的设计与分析:荟萃分析技术的应用,统计医学。 16(1997),第2063-2079页。doi:10.1002/(SICI)1097-0258(19970930)16:18<2063::AID-SIM642>3.0.CO;2-8 [公共医学] [交叉参考][谷歌学者]
22Van Breukelen G.J.P.和Candel M.J.J.M。,具有治疗依赖性费用和治疗依赖性未知方差的分组随机试验的有效设计,统计医学。 37(2018),第3027-3046页。数字对象标识代码:10.1002/sim.7824[PMC免费文章][公共医学] [交叉参考][谷歌学者]
23Van Breukelen G.J.P.、Candel M.J.J.M.和Berger M.P.F。,分组随机试验和多中心试验中不等与等分组大小的相对效率,统计医学。 26(2007),第2589–2603页。doi:10.1002/sim.2740[公共医学] [交叉参考][谷歌学者]
24Waterhouse W.C.公司。,对称问题有对称解吗?,美国数学。周一。 90(1983年),第378-387页。doi:10.1080/00029890.1983.1971235[交叉参考][谷歌学者]
25Wu S.、Wong W.K.和Crespi C.M。,分组随机试验的Maximin最优设计,生物计量学 73(2017),第916–926页。doi:10.1111/biom.12659[PMC免费文章][公共医学] [交叉参考][谷歌学者]
26Wu Z.、Frangakis C.E.、Louis T.A.和Scharfstein D.O。,通过校正组间协变量不平衡来评估配对分组随机试验的治疗效果,生物计量学 70(2014),第1014–1022页。doi:10.1111/biom.12114[PMC免费文章][公共医学] [交叉参考][谷歌学者]
27You Z.、Williams O.D.、Iban I.、Kabaganbe E.K.、Tiwari H.和Cutter G。,可变簇大小的簇随机试验的相对效率和样本量,临床试验 8(2011),第27-36页。doi:10.1177/1740774510391492[公共医学] [交叉参考][谷歌学者]

来自的文章应用统计学杂志由以下人员提供Taylor&Francis律师事务所