4.1. 示例1
在此,我们提供假设数据示例,以说明方法并评估建议的优化设计的性能。假设,考虑以下场景:
米 = 4和
米 = 5和
可以从以下位置观察到(11)局部最优设计取决于样本大小N个在场景1中在表中计算和报告大样本近似优化设计计算如下.从表,可以观察到和基于不同值的局部优化设计N个大致相同。就功率而言(在(23)),这些设计具有类似的性能(未报告)。
表1。
场景1下的局部最优设计。
N个 |
|
---|
80 | (0.1176, 0.6069, 0.0355, 0.2400) |
82 | (0.1175, 0.6070, 0.0355, 0.2400) |
84 | (0.1175, 0.6070, 0.0355, 0.2400) |
86 | (0.1175, 0.6071, 0.0354, 0.2400) |
88 | (0.1175, 0.6071, 0.0354, 0.2400) |
90 | (0.1175, 0.6072, 0.0354, 0.2400) |
92 | (0.1174, 0.6072, 0.0354, 0.2400) |
94 | (0.1174, 0.6073, 0.0354, 0.2400) |
96 | (0.1174, 0.6073, 0.0353, 0.2399) |
98 | (0.1174, 0.6073, 0.0353, 0.2399) |
在场景2下,将平衡设计的性能与局部最优设计和贝叶斯最优设计进行比较。基于真实值的局部优化设计和计算。为了找到基于均匀先验的贝叶斯优化设计,考虑了以下方法。假设集群大小相等n个 = 50,每个的经验置信区间使用最大似然估计基于1000个模拟进行计算。重要性级别固定为.与的是,,,和。这些间隔用作的。基于这些统一先验,贝叶斯设计使用(20)的已计算。beta测试版ρ的选择应涵盖ρ和不应出现在概率密度函数的极端尾部位置。如中所建议[17],选择了以下一组beta prior:,,,、和.最佳设计在表中报告.局部效率图(),贝叶斯统一()和贝叶斯测试版()最优设计与平衡设计的比较()如图所示(a) ●●●●。从效率图中可以清楚地看出,局部最优设计表现最好,其次是贝叶斯均匀设计。贝叶斯贝塔优化设计报告效率最低。所有优化设计都优于平衡设计,因为对于以下所有值,效率始终大于1N个通过观察这些设计的功率图可以得出类似的结论(见图(b) )。与所有优化设计相关的功率计算用于双边测试,使用(23)假设.
(a) 局部效率图(),贝叶斯统一()和贝叶斯测试版()最优设计与平衡设计的比较(). (b) 平衡设计的功率图(),本地(),贝叶斯统一()和贝叶斯测试版()最佳设计。功率计算为双边检验假设的显著性水平.
表2。
示例1:本地(),贝叶斯统一()和贝叶斯测试版()基于的优化设计
N个 | 设计 | 最佳比例 |
---|
50 |
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
150 |
|
|
|
|
|
|
|
|
接下来评估建议设计的稳健性,进行敏感性分析。基于真值的局部优化设计场景2中给出的N个 = 50是,基于均匀和贝塔先验的贝叶斯优化设计是
和分别是。接下来,500个随机样本由的。对于每个样本,计算与贝叶斯设计和局部最优设计相关的功率。图中绘制了这500个功率值的方框图(a) ●●●●。从箱位观察到和性能相似,而表现最差。然而,在某些情况下,局部优化设计表现最差。例如,考虑局部优化设计在获得。请注意非常接近参数空间的边界。与此局部优化设计相关联的功率箱位以及和如图所示(b) ●●●●。在这种情况下,局部最优设计表现最差。
(a) 与本地设计相关的功率方框图、贝叶斯均匀优化设计和贝叶斯贝塔优化设计基于500个样本从参数空间绘制。(b) 与局部设计相关的功率方框图、贝叶斯均匀优化设计和贝叶斯贝塔优化设计基于500个样本从参数空间绘制。
4.2. 示例2:实际数据示例
密歇根大学与教育政策研究联合会合作开展的一个研究项目(教学改进研究)[17]. 该研究的目的是确定各种综合学校改革(CSR)计划对高贫困小学教学和学生成绩的影响。被测量的反应是幼儿园学生在春季出现时获得的数学成绩,即国家认可的评估工具Terra Nova Level 10。学生(n个)被嵌套在学校和两个改革项目,即“美洲选择”和“人人成功”,被视为治疗。当时有米 = 每个治疗组4组n个 = 每所学校21名学生。因此,他们采用了平衡设计。我们根据地理相似性将集群配对。最大似然估计是.对于制服,我们考虑对于优先权的选择有些模糊,但包括和点估计。对beta版之前的版本进行了以下选择:,,、和在这两种情况下,的是独立分布的。优化设计在表中报告.
表3。
示例2:本地(),贝叶斯统一()和贝叶斯测试版()基于的优化设计
N个 | 设计 | 最佳比例 |
---|
84 |
|
|
|
|
|
|
|
|
120 |
|
|
|
|
|
|
|
|
160 |
|
|
|
|
|
|
|
|
与示例1类似,我们在图中绘制了与优化设计相关的双边测试的功率(a) 假设适用于各种样本大小。从图中可以看出,在所有竞争设计中,局部优化设计的功率最高。在这个例子中,贝叶斯贝塔优化设计与贝叶斯均匀优化设计相比具有最大的威力。平衡的设计具有最低的功率。
(a) 平衡设计的功率图(),本地(),贝叶斯统一()和贝叶斯测试版()最佳设计。功率计算为双边检验假设的显著性水平.(b)与本地设计相关的功率箱线图、贝叶斯均匀优化设计和贝叶斯贝塔优化设计基于500个样本从参数空间绘制。
接下来,我们进行了敏感性分析。基于计算了均匀和beta先验的最优设计。这些设计是,,分别是。然后500个样本从参数空间(均匀先验的范围)绘制。对于每个样品和,计算与这些设计相关的功率。图中绘制了这500次幂的方框图(b) ●●●●。从箱位可以得出以下结论:和是相似的,然而比剩下的两个稍微好一点。