总结

我们提出了预期综合均方误差(EIMSE)实验设计准则,并展示了我们如何使用它来设计实验,以满足压铸工程研究人员的需求。该准则直接表达了研究人员最小化预期元模型预测误差的目标,考虑到随机实验误差和我们对真实模型形式的不确定性产生的误差的影响。因为我们需要对模型系数的先验分布进行假设,以估计EIMSE,我们进行了敏感性分析,以验证生成的设计的相对预测性能在很大程度上对我们的假设不敏感。此外,我们还简要讨论了EIMSE优化设计的一般优势,包括与流行的响应面设计相比预期偏差误差更低,以及与某些Box-Draper全偏差设计相比方差误差更低。

1.简介

如所述威廉姆斯和约翰(1996)现代计算机的可用性和强大功能使得高效实验设计的构建具有相当大的灵活性,并将注意力集中在设计标准的选择上,我们提出了一种自然通用的实验设计准则,即在实验随机误差均被认为非零且拟合模型形式与真实模型形式不同的常见情况下,预测的期望平方误差。考虑到由于真实模型形式和拟合模型形式之间的差异而产生的预测误差在实验规划中至关重要,因为相关的“规格错误”误差通常大于来自其他来源的误差;例如,请参见Box and Draper(19591987),库里和康奈尔(1995)迈尔斯和蒙哥马利(1995)此外,解决模型指定错误会导致实验设计与忽略指定错误时产生的实验设计非常不同;例如,请参见Box and Draper(19591987).

高压铝压铸的一个主要问题是预测零件的变形。这一点很重要,因为制造商通常必须权衡变形和压铸机成本,这与压铸机的尺寸和重量密切相关。全球竞争对公司施加了巨大压力,要求它们同时减少变形和机器成本。欧洲和亚洲的制造商通常可以通过使用更小、更便宜的机器来实现更低程度的零件变形,同时节省数百万美元。俄亥俄州立大学压铸研究中心的研究人员进行了一系列物理和计算机实验,旨在研究机器尺寸和零件变形之间的关系(参见乔杜里(1997)). 在本文中,我们报告了其中一项涉及计算机实验的研究,其中使用了创新的实验设计方法。

我们的主要研究目标是开发一个准确的经验模型,以预测零件变形或“标称偏差”,作为以下三个因素的函数图1这些因素决定了“拉杆”的尺寸和位置,以及将高压铝注入模具型腔时将模具两半固定在一起的“压板”的宽度。有了准确的预测模型,我们可以更好地理解机器尺寸(例如压板厚度)和零件质量之间的权衡。请注意,只有一半机器显示在图1(b)另一半是镜面反射。

来自(a)压铸机的平面图和(b)侧视图的参数(a,系杆的直径;b,压板的厚度;C,系杆的位置)
图1

来自(a)压铸机平面图和(b)侧视图的参数(A类,系杆直径;B类,压板厚度;C类,拉杆的位置)

研究实验采用三维有限元法计算机实验进行。虽然输出结果是输入的确定函数,相同的输入文件会产生相同的值,但我们在使用有限元方法的经验中观察到,在准备输入文件和分析输出文件时,通常会出现随机错误,使回答不完全可重复。这些准备和分析任务可能非常复杂,包括计算机辅助设计建模和将几何体划分为单个元素或“网格”。观察到并报告了这些过程的变化科克等。(2000).

在下一节中,我们回顾了与为我们的问题开发经验模型相关的其他文献,并解释了基于预期综合均方误差设计(EIMSE)标准的我们建议设计的必要性。然后,我们提供了计算EIMSE的公式以及案例研究中使用的实验设计。接下来,我们描述了我们进行的一些敏感性分析,以表明EIMSE优化设计的性能对计算EIMSE所需的假设相关的不确定性不敏感。然后,我们展示了案例研究的结果。最后,我们简要讨论了EIMSE与其他设计标准的关系以及未来研究的机会。

2.文献综述

近年来,计算机实验这一主题在实验设计文献中受到了相当大的关注。除了专注于线性模型实验设计的经典参考文献外Box and Draper(1987年),迈尔斯和蒙哥马利(1995)库里和康奈尔(1995),人们对所谓的kriging模型方法的实验设计产生了浓厚的兴趣。关于克里格模型应用于完全确定性计算机实验输出建模的参考文献包括麻袋等。(1989)韦尔奇等。(1992)。鉴于我们已使用克里金方法拟合其他压铸相关实验的元模型,例如,中描述的当前共识,麻袋等。(1989)克里金模型方法只适用于完全确定性的计算机实验。此外艾伦等。(2003)建议使用本文提出的设计进行回归建模可以获得优于kriging建模的竞争或预测性能,即使实验完全可重复,在运行次数与二次多项式中的项数相当的情况下。此外,工程师们更喜欢线性模型的简单性和可解释性。因此,我们选择线性模型有几个原因。

线性模型的实验设计可分为三种类型:标准或“完整”响应面、小响应面和计算机生成。标准响应面设计,包括全中央复合材料和Box和Behnken(1960)除了生成具有低预测误差的模型外,设计还具有理想的特性,例如可旋转性和顺序构造。一般来说,这些设计可能是实验者可用时的第一选择。然而,除了不能完全重复之外,我们模拟研究中的计算机实验非常昂贵。每次跑步至少需要3天的研究人员和计算机时间才能完成。三个因素的最小标准设计是Box–Behnken设计,共13次跑步,假设有一个中心点。工程师只提供了11次运行。因此,我们需要使用其他类型的设计。

小响应面设计方法已在迈尔斯和蒙哥马利(1995)。这些包括哈特利(1959)小型复合设计和混合设计,由开发罗克摩尔(1976)这些设计在于(2000)Allen和Yu(2000)建议这些设计在假设偏差占主导地位的情况下提供非竞争性预测误差。因此,我们决定为我们的应用研究计算机生成的设计。

计算机生成的设计都来源于目标或“标准”和假设的具体选择。使用流行的实验设计标准,如D类-为了产生最佳的实验设计,我们需要指定真实模型的精确形式,它必须与实验后拟合的模型相同,希望这种形式能够作为一种适当的近似。因此,人们批评流行标准过于依赖不切实际的假设,因为运行次数和其他考虑因素限制了拟合模型形式(参见斯坦伯格和亨特(1984),迈尔斯等。(1989)杜穆切尔和琼斯(1994)). 在我们这样的情况下,这是一个特别严重的缺陷,在这种情况下,与拟合模型形式和真实模型之间的差异导致的不可避免的错误相比,非零随机误差在某种意义上预计会“小”,这称为模型误指定错误或“偏差”错误。

Box和Draper(1959)他们首先详细讨论了偏差对生成的实验设计的影响。他们认为,评估实验设计最合适的标准是感兴趣区域内的综合均方误差(IMSE),这允许他们假设与拟合形式不同的真实模型形式。为了进行评估,该标准要求用户在实验之前指定准确的真实模型,包括形式和系数。然后,他们改变了真实的模型,并调查了他们考虑的设计的含义。为了产生通用的可用设计,Box和Draper认为,在他们考虑的情况下,最小化IMSE的设计与仅最小化偏差分量的设计大致相似,但与最小化方差分量的设计截然不同。

然而,最小偏差设计始终能够实现竞争性预测误差的能力并不是普遍现象。例如,如果我们将德雷珀和劳伦斯(1965)“全偏”设计(在其符号中,第页= 1.0,=0.70和b条=0.93),得出的非偏差相关平均预测误差比使用本文推荐的方法获得的预测误差大15倍以上。这表明应用最小偏差准则会导致预测模型不可靠。同样,盒子和帆布带(1959)观察到,从基于方差的标准得出的设计通常在偏差误差方面没有竞争力。在本文中,我们提出了IMSE准则的一个简单但非平凡的扩展。由于提出的标准在实验之前并不依赖于已知的真实模型,因此我们认为,它可以在真实模型未知的压铸研究等情况下实际使用。关于将偏差和方差成分同时纳入一个标准的研究已经做了很多,例如。安德烈·伦登等。(1997),阿特伍德(1971),卢卡斯(1974),汤普森(1973),Sacks和Ylvisaker(1984),斯蒂格勒(1971)韦尔奇(1983)我们提出标准的主要动机是,目前,没有任何现有标准能够直接表征元模型的预期预测误差,该预测误差来自实验和标准分析,其中包括方差和偏差误差。

3.研究中使用的预期综合均方误差准则和实验设计

在本节中,我们描述了用于创建压铸研究中使用的实验设计的标准、假设和优化求解器。提出的标准是EIMSE,其中期望值写为

EIMSE公司(ξ)=E类η,x个,ε([Y(Y)^{ε,x个,η(x个),ξ}η(x个)]2),
1

哪里Y(Y)^{x个,ξ,η(x个)}η(x个)是预测点的预测值和“真实模型”值x个分别是。实验设计为ξɛ是实验随机误差的向量。符号“E类'表示对实验者不确定的变量的统计期望,这些变量是未来的随机误差ɛ,实验后要求预测的点x个和真正的模型η(x个). 让标量n个为试验运行次数,以及σ是随机误差的标准偏差。

根据这个定义,EIMSE可以简单地解释为预期平方预测误差是实验设计的函数。由于我们在案例研究中的目标是通过11次实验运行获得尽可能准确的预测模型,因此将其最小化似乎是合理的方程式(1)生成案例研究中使用的实验设计。

接下来,我们通过计算中的期望值来报告EIMSE的精确公式方程式(1)对于线性拟合和真实模型。首先,需要额外的定义和假设。我们编写了我们在案例研究中使用的关于实验响应向量的线性真模型假设Y(Y)作为

Y(Y)=X(X)j个βj个+X(X)*β*+ε,
2

其中ɛ独立且分布一致N个(0,σ2 )和X(X)j个X(X)*n个×k个j个n个×k个*涉及的设计矩阵因素。向量βj个k个j个×1和β*k个*×1.给定索引指定的真实模型的函数形式,向量β= {βj个,β*}描述了真实模型η(x个). 在估算中βj个,我们不估算β*通常是因为我们没有足够的运行时间来制作完整的设计矩阵X(X)= (X(X)j个|X(X)*)全军衔。因此,对点的预测x个由提供

Y(Y)^(x个)=(f)j个(x个)b条j个,

其中k个j个×1矢量b条j个是系数的最小二乘估计值βj个.向量函数(f)j个(x个)会给出一行设计矩阵X(X)j个与实验运行相对应。因此,(f)j个(x个)取决于拟合模型的函数形式和点x个= (x个1,…,x个). 例如,如果拟合模型是一个完全二次型,那么(f)j个(x个)=(1,x个1,x个2,...,x个,x个12,...,x个2,x个1,x个2,...,x个1x个).

我们使用ρ(x个)表示一个分布函数,该函数描述了我们在该点感兴趣的预测相对概率x个经过实验和模型拟合。“力矩矩阵”是

μk个,=R(右)(f)k个(x个)(f)(x个)ρ(x个)d日x个        k个, =j个, *.
4

我们在案例研究中使用的假设是ρ(x个) = 1/V(V)具有V(V)是感兴趣区域的体积。也,D类*=E类(β*β*)根据这些定义,EIMSE是

EIMSE公司(ξ, D类*)=信托收据{μj个,j个(X(X)j个X(X)j个)1}+信托收据(D类*Δj个,*),
5

具有

Δj个,*=A类μj个,j个A类μj个,*A类A类μj个,*+μ*,*,A类=(X(X)j个X(X)j个)1X(X)j个X(X)*.
6

中的第一个学期方程式(5)通常称为综合方差IV(例如。迈尔斯和蒙哥马利(1995)),第二个术语我们称之为“预期偏差”EB。EIMSE的平方根可视为“预测的平均平方根误差”或σrms(有效值)还要注意,EIMSE取决于拟合模型中未包含的项系数的分布D类*=E类(β*β*)。这与盒子和帆布带(1959)IMSE,其公式与C类*=β*β*替换为D类*因此,EIMSE的公式比IMSE更灵活,因为D类*包含一组可能的C类*.

为了生成压铸案例研究的实验设计,我们做出了以下假设,这些假设将在下一节中通过灵敏度分析进一步证明。我们假设拟合模型是一个完整的二次多项式,而真实模型是与最小偏差设计相关的文献中假设的完整的三次多项式,例如。Box and Draper(1987年)韦尔奇等。(1990)此外,我们假设E类(β*β*)=γ2σ2具有γ= 0.4. 尽管是具体的,但我们将在下一节提供证据,证明导出的实验设计对于以下一系列可能的选择是“接近最优的”E类(β*β*).

这些假设使我们能够在表1通过最小化EIMSE方程式(5)(6)注意,在实验之后,我们可以使用γ=0.4,EIMSE值较低。该设计的不可忽略的初始力矩反映了这样一个事实,即该设计并非EIMSE最优。表2显示了使用假设生成的EIMSE最优设计γ=2.0,这可能更适用于典型的计算机实验,在这些实验中,随机误差被认为可以忽略不计。表2表明,假设较高水平的偏差会导致最佳(或接近最佳)设计将点从边界移入,正如我们在盒子和帆布带(1959)此外,请注意,在使用假设的情况下,没有使用真实的模型β*可以使IMSE等同于EIMSE,因为C类*=β*β*不能是对角线。

表1

研究中使用的EIMSE优化设计

运行A类B类C类
1−1.011
21−1.01
11−1.0
4111
5100
6010
7001
8000
90.5−1.0−1.0
10−1.00.5−1.0
11−1.0−1.00.5
运行A类B类C类
1−1.011
21−1.01
11−1.0
4111
5100
6010
7001
8000
90.5−1.0−1.0
10−1.00.5−1.0
11−1.0−1.00.5
表1

研究中使用的EIMSE优化设计

运行A类B类C类
1−1.011
21−1.01
11−1.0
4111
5100
6010
7001
8000
90.5−1.0−1.0
10−1.00.5−1.0
11−1.0−1.00.5
运行A类B类C类
1−1.011
21−1.01
11−1.0
4111
5100
6010
7001
8000
90.5−1.0−1.0
10−1.00.5−1.0
11−1.0−1.00.5
表2

按理来说γ=2 EIMSE优化设计

运行A类B类C类
1−0.5−1.0−0.5
2−0.50.5−1.0
0.51−0.5
4−1.000
50.5−1.00.5
6000
7100
8−0.5−0.51
9−0.510.5
100.50.51
110.5−0.5−1.0
运行A类B类C类
1−0.5−1.0−0.5
2−0.50.5−1.0
0.51−0.5
4−1.000
50.5−1.00.5
6000
7100
8−0.5−0.51
9−0.510.5
100.50.51
110.5−0.5−1.0
表2

按理来说γ=2 EIMSE优化设计

运行A类B类C类
1−0.5−1.0−0.5
2−0.50.5−1.0
0.51−0.5
4−1.000
50.5−1.00.5
6000
7100
8−0.5−0.51
9−0.510.5
100.50.51
110.5−0.5−1.0
运行A类B类C类
1−0.5−1.0−0.5
2−0.50.5−1.0
0.51−0.5
4−1.000
50.5−1.00.5
6000
7100
8−0.5−0.51
9−0.510.5
100.50.51
110.5−0.5−1.0

在中生成两个设计时表12,候选点是从五个等距的水平面中选择的,这主要是因为从事该项目的工程师喜欢使用几个水平面的相关简单性。计算结果表明,这一限制导致两种设计的EIMSE损失小于5%。有关使用遗传算法的优化启发式方法及其验证的详细信息,请参阅Hadj-Alouane和Bean(1997)和中余(2000)遗传算法可以生成偏差目标值在全局最优期望最小偏差设计的0.5%以内的设计。使用此方法生成EIMSE设计的商业软件可通过以下途径获得网址:www.sagata.com.

4.敏感性分析

在本节中,我们调查了各种绩效指标对案例研究中使用的上述假设的具体情况的敏感性,例如。D类*=E类(β*β*)=γ2σ2γ= 0.4. 由于实验运行次数的限制,我们选择了二阶拟合模型。在最小偏差设计文献中,三阶真实模型的选择是标准的;例如,请参见韦尔奇等。(1990).

在详细调查D类*γ2σ2,请注意盒子和帆布带(1959)表明许多最小偏差设计满足“力矩条件”,并将偏差最小化,而不考虑β*此外,很容易证明,满足Box和Draper矩条件的设计在全局上最小化了任何选择的预期偏差EBD类*,这使我们能够评估我们的优化启发式。同样,也很容易证明箱子和帆布带(1963)所有偏置设计均为EIMSE最优γ= ∞. 这些观察结果具有实际意义,因为对于模型形式和感兴趣区域的某些组合,可能不存在满足力矩条件的实验设计盒子和帆布带(1959)然而,最小偏差设计仍然可以通过最小化EIMSE来生成。

最小偏差或最小预期偏差设计的性能对D类*表明最小EIMSE设计对假设的细节不敏感D类*可能是一般性的。这是因为EIMSE是预期偏差加上综合方差IV,它独立于D类*.

在不损失通用性的情况下,我们定义S公司*≡(γ σ)−2 D类*所以tr(S公司*) =k个*。请注意γ2是真实模型中不在拟合模型中的系数的平均预期平方值,单位为σ= 1. 接下来,我们研究“真实”偏差的影响γγ用于生成实验设计的值,以及缩放矩阵的值S公司*.我们区分γγ澄清一个人可以使用一个值来生成实验设计γ和一个不同的值来估计σrms(有效值)=艾姆斯0.5并将衍生设计与备选方案进行比较。

表3显示了使用γ=0.4,对于替代值γ.表3也表明,只要γ<1或EB<3 IV,则σrms(有效值)在最佳值的15%以内,假设生成设计的人知道γ,即。γ=γ.选择的另一个理由γ=0.4是指,对于超立方体上的四因素、20次运行的中心复合设计,预期偏差等于综合方差,假设D类*= 0.42σ2然后,由于我们假设拟合二次多项式而导致的预测误差等于由随机误差引起的预测误差。Box and Draper(1987年)认为这种等效性通常对应于响应面方法大多数用户的隐含假设。他们推断,实验者通常期望从选择拟合形式中得到的误差大致等于随机误差引起的误差。

表3

通过使用不同的方法生成的最优设计的预期偏差EB和综合方差IVγ-值和trueγ

γ实验的案例研究设计实验γ的优化设计= γ实验γ的优化设计= 2D-优化设计
电子束四、电子束四、电子束四、电子束四、
000.5800.5800.8300.78
0.500.320.580.210.590.140.830.600.78
0.750.730.580.450.620.310.831.350.78
11.290.580.700.670.540.832.400.78
1.502.900.581.230.831.230.835.400.78
25.160.582.180.832.180.839.600.78
311.610.584.900.834.900.8321.590.78
532.240.5813.600.8313.600.8359.970.78
10128.950.5854.420.8354.420.83239.890.78
γ实验的案例研究设计实验γ的优化设计= γ实验γ的优化设计= 2D-最优设计
电子束四、电子束四、电子束四、电子束四、
000.5800.5800.8300.78
0.500.320.580.210.590.140.830.600.78
0.750.730.580.450.620.310.831.350.78
11.290.580.700.670.540.832.400.78
1.502.900.581.230.831.230.835.400.78
25.160.582.180.832.180.839.600.78
311.610.584.900.834.900.8321.590.78
532.240.5813.600.8313.600.8359.970.78
10128.950.5854.420.8354.420.83239.890.78
表3

使用不同的γ-值和trueγ

γ实验的案例研究设计实验γ的优化设计= γ实验γ的优化设计= 2D-优化设计
电子束四、电子束四、电子束四、电子束四、
000.5800.5800.8300.78
0.500.320.580.210.590.140.830.600.78
0.750.730.580.450.620.310.831.350.78
11.290.580.700.670.540.832.400.78
1.502.900.581.230.831.230.835.400.78
25.160.582.180.832.180.839.600.78
311.610.584.900.834.900.8321.590.78
532.240.5813.600.8313.600.8359.970.78
10128.950.5854.420.8354.420.83239.890.78
γ实验的案例研究设计实验γ的优化设计= γ实验γ的优化设计= 2D-优化设计
电子束四、电子束四、电子束四、电子束四、
000.5800.5800.8300.78
0.500.320.580.210.590.140.830.600.78
0.750.730.580.450.620.310.831.350.78
11.290.580.700.670.540.832.400.78
1.502.900.581.230.831.230.835.400.78
25.160.582.180.832.180.839.600.78
311.610.584.900.834.900.8321.590.78
532.240.5813.600.8313.600.8359.970.78
10128.950.5854.420.8354.420.83239.890.78

表3还显示了如何使用γ=2对于所有较大的γ>2个由我们的遗传算法生成的值,对于最小偏差标准可能至少是近似最优的。这表明,这种假设可能有利于噪声较小的计算机实验,在这些实验中,实验者仍然希望对随机错误的敏感性进行一些控制。最后,表3也显示了D类-预测的最佳设计。使用γ=0.5σrms(有效值)比研究设计大20%。很容易表明,差异随着γ随着对错误规范的担忧增加,这些设计的可取性降低。使用EIMSE设计进行回归建模的比较γ=2,采用基于艾伦克里金模型的替代方法等。(2002)得出结论,EIMSE和基于回归的方法为文献中选定的测试函数提供了可比或更高的预测精度。

在案例研究中,假设S公司*=从以下几个方面准确地反映了工程师先前的信念。首先,所有因素都被同等对待,因为在选定的范围内,我们没有任何迹象表明哪个术语比其他术语更重要。其次,我们没有理由期望系数之间存在正相关或负相关。

这个S公司*=先前可能与以下假设不同杜穆切尔和琼斯(1994)他们建议转换真实模型,以便考虑到感兴趣区域的几何形状和拟合模型中的项,每个缺失项对预期偏差的影响在量级上具有可比性。

潜在的吸引力杜穆切尔和琼斯(1994)假设方案为检验偏离假设的影响提供了额外的理由S公司*=,我们接下来要做的。我们只关注预期偏差EB,因为对于给定的设计,积分方差IV是一个独立于S公司γ。所研究的偏差包括构成给定实验设计最坏情况的矩阵,以及几个选定的矩阵,这些矩阵对于所比较的所有设计都保持不变。

首先,根据定义,我们有约束tr(S公司*) =k个*此外,定义S公司*是半正定矩阵Ω的集合,因为它可能被解释为一个分布的协方差矩阵,该分布可以通过移动位置从实际分布中获得,从而E类(β*) =0使用这些约束,我们可以获得最坏情况下的预期偏差EB*对于任何给定的设计γ:

电子束*(ξ,γ)=最大化S公司* γ2信托收据(S公司*Δj个,*)根据tr(S公司*)=k个*,      S公司*Ω.
7

这个界限可用作极小极大公式中的准则。集Ω上的优化可以通过实矩阵上的最大化来实现M(M)和采取S公司*=M(M)M(M)从奇异值分解中,我们可以看到所有先验协方差矩阵D类*,它必须是对称的和半正定的,对于某些矩阵可以得到M(M).

对大量实验设计进行了评估,以调查具有最低预期偏差的设计是否假设S公司*=也有最低的最坏情况预期偏差EB*我们使用了20个基于均匀[-1,1]随机数的设计,20个拉丁超立方体设计如麦凯等。(1979),的γ=0.4和γ=2个EIMSE设计和D类-优化设计。我们使用随机设计,以便在研究中有不同性能水平的设计。图2显示了最坏情况下的预期偏差EB*根据表达式(7)绘制的预期偏差,假设S公司*=用于43种设计。该图显示,假设S公司*=值得注意的是,使用这两个标准的设计顺序大致相同,即使S公司-用于评估每个设计的矩阵是不同的。然而,毫不奇怪D类-忽略偏差误差的优化设计在两种假设下都表现不佳。还有,五级γ=2 EIMSE设计,这大约是一种最小偏差设计,定义如下盒子和帆布带(1959),对这两个条件都执行得最好。

几种实验设计的最坏情况预期偏差EB*与基于假设S=I的预期偏差:♦, 拉丁超立方体,均匀样品,EIMSE,γs=0.4,EIMSE,γs=2.0,D最佳
图2

最坏情况预期偏差EB* 基于假设的预期偏差S公司=对于几种实验设计:♦, 拉丁超立方;图解的,均匀样品;图解的、EIMSE、,γ= 0.4;图解的、EIMSE、,γ= 2.0;图解的,D类最优的

最后,我们选择了以下两个矩阵来研究关于S公司*关于设计的相对顺序。S公司1-矩阵,前两个对角元素,S公司1(1,1)S公司1(2,2),等于5和相关的非对角元素,S公司1(1,2)S公司1(2,1),等于-4。所有其他元素S公司1等于0。S公司2-矩阵,所有元素都等于1。假设S公司*=S公司1在存在已知的真函数渐近线到固定值的情况下可能是合理的x个1x个2增加或减少。矩阵S公司2被选为代表所有三阶系数之间强相关性的相反极端(假设它们的平均值都为零)。通常,如果感兴趣区域包含高维圆锥或其他复杂形状,则可能会出现高相关性。

图3显示了预期偏差假设S公司*=S公司 1根据预期偏差假设绘制S公司*=用于相同的43个设计图2图中显示,不幸的是,设计的顺序对以下假设很敏感:S公司*然而,五级γ=2 EIMSE设计在假设和γ=0.4 EIMSE设计在假设下也几乎具有最佳偏差S公司*=S公司 1.

43个实验设计在假设S=S1和S=I下的预期偏差:♦, 拉丁超立方体,均匀样品,EIMSE,γs=0.4,EIMSE,γs=2.0,D最佳
图3

假设下的预期偏差S公司=S公司1S公司=对于43个实验设计:♦, 拉丁超立方;图解的,均匀样品;图解的、EIMSE、,γ= 0.4;图解的、EIMSE、,γ= 2.0;图解的,D类最优的

同样,图4显示了预期偏差假设S公司*=S公司 2根据预期偏差假设绘制S公司*=对于相同的43种设计。该图再次表明,设计的顺序对以下假设很敏感S公司*还有,五级γ=2 EIMSE设计在两种假设下都表现最佳。然而γ=0.4 EIMSE设计的性能远不如许多随机设计。这表明,如果从业者担心系数之间的强相关性,例如响应面中的高维锥体,则谨慎使用更大的γ而不是我们基于通常的偏见考虑所假设的。尽管如此,在我们的案例研究中,0.25σ2积分方差的微分表3γ=2.0 EIMSE设计被主观判断为比高度相关的三阶项的可能性更重要。

43个实验设计在假设S=S2和S=I下的预期偏差:♦, 拉丁超立方体,均匀样品,EIMSE,γs=0.4,EIMSE,γs=2.0,D最佳
图4

假设下的预期偏差S公司=S公司2S公司=对于43个实验设计:♦, 拉丁超立方体;图解的,均匀样品;图解的、EIMSE、,γ= 0.4;图解的、EIMSE、,γ= 2.0;图解的,D类最优的

我们得出结论,关于预期产品的假设E类(β*β*)未估计的系数可能会影响替代实验设计的相对顺序,从而影响选择哪种设计的决策。然而,如果从业者想使用相对简单的形式假设D类*=(γ σ)2S公司*=,无论以下假设如何,都可以生成一个近似最小化预期偏差的设计。使用γ-足够大的值,使得导出的设计的评估EB大大大于综合方差,例如我们在示例中对γ=2 EIMSE设计。那么,这种设计的综合方差可能会高于必要值。然而,与最小偏差设计相比,这种方法的优点是可以确保方差误差得到解决。例如,在案例研究中,0.25的损失σ2对于许多应用程序来说,在综合方差中可能不太大。

另一种合理的方法,即我们在研究中使用的方法,是实施简单、合理的假设,例如。D类*= 0.42σ2然后,尽管通过使用更现实、更详细的假设可能实现更低的预期预测误差,但与基于流行方差标准的替代设计相比,偏差误差可能会减少,例如D类-优化。此外,所选设计的EIMSE值提供了用户期望通过实验和拟合回归模型过程得出的实际预测误差的近似但直接估计。

5.案例研究结果

在本节中,我们描述了压铸研究的结果。表12显示了通过使用前面描述的遗传算法生成的以编码单元为单位的EIMSE最优设计。系数范围如所示表4并用于在工程单元中创建实验设计,如所示表5。通过复杂的有限元模拟计算出的零件变形也显示在表5我们有兴趣预测作为过程输入函数的最大变形,因为当零件与标称尺寸的最大偏差被视为不可接受时,零件通常会被拒收。

表4

压铸机壳研究的因素和范围

参数因素描述
A类系杆直径5.58
B类压盘厚度914.5
C类模具位置012.5
参数因素描述
A类拉杆直径5.58
B类压盘厚度914.5
C类模具位置012.5
表4

压铸机壳研究的因素和范围

参数因素描述
A类系杆直径5.58
B类压盘厚度914.5
C类模具位置012.5
参数因素描述
A类系杆直径5.58
B类压盘厚度914.5
C类模具位置012.5
表5

工程单位(英寸)的实验设计和响应

零件以下参数的值(in)盖板上以下位置的挠度(in):最大挠度位置
A类B类C类1245678
15.5014.512.500.01670.01850.01970.01430.01130.01770.01950.01530.0197
28912.500.00600.00690.00690.00400.00080.00780.00880.00570.00887
814.500.00530.00380.00200.00630.00690.00620.00470.00720.00728
4814.512.500.00560.00670.00740.00380.00160.00640.00750.00460.00757
5811.86.250.00670.00660.00370.00630.00510.00790.00780.00760.00796
66.7514.56.250.01090.01090.01040.01040.00930.01180.01180.01130.01186
76.7511.812.500.00950.01100.01170.00720.00380.01090.01230.00860.01237
86.7511.86.250.01060.01050.00980.01000.00870.01180.01180.01130.01186
97.38900.00700.00480.00130.00800.00800.00920.00690.01030.01038
105.5013.100.01630.01440.01200.01770.01850.01750.01550.01880.01888
115.5099.380.01750.01830.01800.01550.01220.01990.02050.01780.02057
零件以下参数的值(in)盖板上以下位置的挠度(in):最大挠度位置
A类B类C类1245678
15.5014.512.500.01670.01850.01970.01430.01130.01770.01950.01530.0197
28912.500.00600.00690.00690.00400.00080.00780.00880.00570.00887
814.500.00530.00380.00200.00630.00690.00620.00470.00720.00728
4814.512.500.00560.00670.00740.00380.00160.00640.00750.00460.00757
5811.86.250.00670.00660.00370.00630.00510.00790.00780.00760.00796
66.7514.56.250.01090.01090.01040.01040.00930.01180.01180.01130.01186
76.7511.812.500.00950.01100.01170.00720.00380.01090.01230.00860.01237
86.7511.86.250.01060.01050.00980.01000.00870.01180.01180.01130.01186
97.38900.00700.00480.00130.00800.00800.00920.00690.01030.01038
105.5013.100.01630.01440.01200.01770.01850.01750.01550.01880.01888
115.5099.380.01750.01830.01800.01550.01220.01990.02050.01780.02057
表5

工程单位(英寸)的实验设计和响应

零件以下参数的值(in)盖板上以下位置的挠度(in):最大挠度位置
A类B类C类1245678
15.5014.512.500.01670.01850.01970.01430.01130.01770.01950.01530.0197
28912.500.00600.00690.00690.00400.00080.00780.00880.00570.00887
814.500.00530.00380.00200.00630.00690.00620.00470.00720.00728
4814.512.500.00560.00670.00740.00380.00160.00640.00750.00460.00757
5811.86.250.00670.00660.00370.00630.00510.00790.00780.00760.00796
66.7514.56.250.01090.01090.01040.01040.00930.01180.01180.01130.01186
76.7511.812.500.00950.01100.01170.00720.00380.01090.01230.00860.01237
86.7511.86.250.01060.01050.00980.01000.00870.01180.01180.01130.01186
97.38900.00700.00480.00130.00800.00800.00920.00690.01030.01038
105.5013.100.01630.01440.01200.01770.01850.01750.01550.01880.01888
115.5099.380.01750.01830.01800.01550.01220.01990.02050.01780.02057
零件以下参数的值(in)盖板上以下位置的挠度(in):最大挠度位置
A类B类C类1245678
15.5014.512.500.01670.01850.01970.01430.01130.01770.01950.01530.0197
28912.500.00600.00690.00690.00400.00080.00780.00880.00570.00887
814.500.00530.00380.00200.00630.00690.00620.00470.00720.00728
4814.512.500.00560.00670.00740.00380.00160.00640.00750.00460.00757
5811.86.250.00670.00660.00370.00630.00510.00790.00780.00760.00796
66.7514.56.250.01090.01090.01040.01040.00930.01180.01180.01130.01186
76.7511.812.500.00950.01100.01170.00720.00380.01090.01230.00860.01237
86.7511.86.250.01060.01050.00980.01000.00870.01180.01180.01130.01186
97.38900.00700.00480.00130.00800.00800.00920.00690.01030.01038
105.5013.100.01630.01440.01200.01770.01850.01750.01550.01880.01888
115.5099.380.01750.01830.01800.01550.01220.01990.02050.01780.02057

我们使用普通最小二乘回归来推导八个位置中每个位置的预测模型。回归模型如所示表6这相当于应用看似无关的回归估计来预测畸变响应,因为所有模型的函数形式都是相同的(例如,参见库里和康奈尔(1995)). 例如,位置1处的预测畸变由下式给出

Y(Y)^1(A类,B类,C类)=008396000.0169500A类0.0004868B类+0.0004617C类+ 00009621A类2+0.0000323B类20.0000342C类2 0.0000373A类B类 + 0.0000054A类C类0.0000037B类C类.

然后,我们将八种预测失真中的最大值用于决策。

表6

预测八个位置畸变的回归系数

参数以下位置的系数:
位置1位置2位置3位置4位置5位置6位置7位置8
常量0.08396000.07939000.06613000.08370000.08421000.09417000.08717000.0918800
A类−0.0169500−0.0172800−0.0111900−0.0171800−0.0181000−0.0173200−0.0172800−0.0173000
B类−0.0004868−0.0000179−0.0018500−0.00009350.0003355−0.0014730−0.0008721−0.0008880
C类0.00046170.00107800.0014900−0.0000852−0.00073150.00044510.0011000−0.0000978
A类20.00096210.00098890.00045590.00099750.00108500.00095640.00097920.0009821
B类20.00003230.00001440.00008910.00002550.00002140.00005500.00003880.0000400
C类2−0.0000342−0.0000376−0.0000221−0.0000338−0.0000345−0.0000321−0.0000372−0.0000329
AB公司−0.0000373−0.00002930.0000366−0.0000673−0.0000981−0.0000070−0.0000205−0.0000403
自动控制0.0000054−0.0000294−0.00003290.00003920.0000789−0.0000010−0.00003530.0000275
不列颠哥伦比亚省−0.0000037−0.0000097−0.0000357−0.00000040.0000074−0.0000014−0.00000890.0000056
参数以下位置的系数:
位置1位置2位置3位置4位置5位置6位置7位置8
常量0.08396000.07939000.06613000.08370000.08421000.09417000.08717000.0918800
A类−0.0169500−0.0172800−0.0111900−0.0171800−0.0181000−0.0173200−0.0172800−0.0173000
B类−0.0004868−0.0000179−0.0018500−0.00009350.0003355−0.0014730−0.0008721−0.0008880
C类0.00046170.00107800.0014900−0.0000852−0.00073150.00044510.0011000−0.0000978
A类20.00096210.00098890.00045590.00099750.00108500.00095640.00097920.0009821
B类20.00003230.00001440.00008910.00002550.00002140.00005500.00003880.0000400
C类2−0.0000342−0.0000376−0.0000221−0.0000338−0.0000345−0.0000321−0.0000372−0.0000329
AB公司−0.0000373−0.00002930.0000366−0.0000673−0.0000981−0.0000070−0.0000205−0.0000403
自动控制0.0000054−0.0000294−0.00003290.00003920.0000789−0.0000010−0.00003530.0000275
不列颠哥伦比亚省−0.0000037−0.0000097−0.0000357−0.00000040.0000074−0.0000014−0.00000890.0000056
表6

预测八个位置畸变的回归系数

参数以下位置的系数:
位置1位置2位置3位置4位置5位置6位置7位置8
常量0.08396000.07939000.06613000.08370000.08421000.09417000.08717000.0918800
A类−0.0169500−0.0172800−0.0111900−0.0171800−0.0181000−0.0173200−0.0172800−0.0173000
B类−0.0004868−0.0000179−0.0018500−0.00009350.0003355−0.0014730−0.0008721−0.0008880
C类0.00046170.00107800.0014900−0.0000852−0.00073150.00044510.0011000−0.0000978
A类20.00096210.00098890.00045590.00099750.00108500.00095640.00097920.0009821
B类20.00003230.00001440.00008910.00002550.00002140.00005500.00003880.0000400
C类2−0.0000342−0.0000376−0.0000221−0.0000338−0.0000345−0.0000321−0.0000372−0.0000329
AB公司−0.0000373−0.00002930.0000366−0.0000673−0.0000981−0.0000070−0.0000205−0.0000403
自动控制0.0000054−0.0000294−0.00003290.00003920.0000789−0.0000010−0.00003530.0000275
不列颠哥伦比亚省−0.0000037−0.0000097−0.0000357−0.00000040.0000074−0.0000014−0.00000890.0000056
参数以下位置的系数:
位置1位置2位置3位置4位置5位置6位置7位置8
常量0.08396000.07939000.06613000.08370000.08421000.09417000.08717000.0918800
A类−0.0169500−0.0172800−0.0111900−0.0171800−0.0181000−0.0173200−0.0172800−0.0173000
B类−0.0004868−0.0000179−0.0018500−0.00009350.0003355−0.0014730−0.0008721−0.0008880
C类0.00046170.00107800.0014900−0.0000852−0.00073150.00044510.0011000−0.0000978
A类20.00096210.00098890.00045590.00099750.00108500.00095640.00097920.0009821
B类20.00003230.00001440.00008910.00002550.00002140.00005500.00003880.0000400
C类2−0.0000342−0.0000376−0.0000221−0.0000338−0.0000345−0.0000321−0.0000372−0.0000329
AB公司−0.0000373−0.00002930.0000366−0.0000673−0.0000981−0.0000070−0.0000205−0.0000403
自动控制0.0000054−0.0000294−0.00003290.00003920.0000789−0.0000010−0.00003530.0000275
不列颠哥伦比亚省−0.0000037−0.0000097−0.0000357−0.00000040.0000074−0.0000014−0.00000890.0000056

对每个位置的畸变分别建模的动机与我们的怀疑有关,即总体畸变将是一个相对非线性的函数,尽管每个位置的失真模型将相对平滑。各个位置的响应平稳性得到了以下事实的证实:这些位置的一阶畸变模型均已调整R(右)2-大于95%的值。调整的二阶模型R(右)2-这些值均大于98.5%,相关性值得怀疑,因为残差只有一个自由度。然而,这一信息为三阶模型可以对误差可忽略不计的响应建模的假设提供了额外的理由。

然后使用该最大变形模型可视化机器费用和零件质量之间的权衡。图5显示了用于选择压板厚度的该预测模型的绘图,这对赞助该研究的公司特别重要。该模型用于设备设计和采购决策。一个重要的发现是,可以减少零件的变形,以达到所需的质量水平,而无需使用更大的压板。较小的压板可节省成本。

零件的预测变形是系数C和a的函数,B固定在11.75英寸
图5

预测零件变形作为因素的函数C类A类具有B类固定在11.75英寸

作为如何使用模型的示例,考虑增加系杆厚度的成本(系数A类)成本是增加台板厚度的两倍(因数B类). 然后,设计可能希望最小化机器的成本,这与2.0成正比A类+1.0B类,前提是预测的最大畸变小于0.075英寸的期望公差限值。在这种情况下,最佳机器设置为A类=6.3英寸,B类=9.0英寸和C类=12.5英寸,预测最大变形等于0.0075英寸。有关更多详细信息,请参阅乔杜里(1997).

6.结论

对于以预测准确性为主要目标的问题,我们提出了EIMSE准则。该准则是IMSE准则的简单但非平凡的扩展,由盒子和帆布带(1959)我们描述了如何从EIMSE中导出最小偏差设计以及如何最小化综合方差的设计。我们注意到,对于不存在满足盒子和帆布带(1959)力矩条件。此外,我们还表明,其他研究人员提出的一些最小偏差设计可能与大的综合方差有关,这进一步证明了使用包括方差和偏差误差的标准(如EIMSE)的必要性。然而,在已经提出的包括方差和偏差的标准中,EIMSE是唯一一个简单解释为导出预测模型预测的预期平方误差的标准。

EIMSE的主要限制是需要指定真实模型分布的协方差矩阵。我们已经通过敏感性分析解决了这一问题。该分析表明,尽管EIMSE的值对协方差矩阵的假设敏感,但设计决策(通常)的敏感性较低。在案例研究的背景下,为一组假设选择的设计与其他替代假设的设计具有竞争力。因此,我们建议将EIMSE视为基于方差和基于偏差的实验设计标准之间的合理折衷。

此外,我们的计算结果表明,使用该假设生成的EIMSE设计的相对性能γ=2对真实模型的假设非常不敏感。因此,至少在一些感兴趣的情况下,这种方法提供了一种生成近似最小偏差设计的方法,并对随机误差对预测的影响提供了一些保护。最后,我们举例说明了该标准在一个实验极其昂贵的问题上的成功应用。拟合的预测模型提出了在不增加成本的情况下最小化零件变形的方法。

还有许多需要进一步研究的方向。首先,在高曲率的情况下,例如。γ>2,我们预计回归缺乏fit检验可能会发现假设模型形式的不足,从业者会尝试找到更合适的形式。因此,将EIMSE扩展到涉及缺乏fit测试的序贯实验是一个重要的主题。此扩展已在中进行了部分探索Allen和Yu(2000),艾伦. (2000)科克等。(2000)第二,EIMSE可用于评估和比较现有设计。最后,我们集中讨论了EIMSE在半贝叶斯方法中的应用,即我们假设先验协方差矩阵,但我们假设在模型拟合中使用普通最小二乘法。我们之所以这样做,是因为普通最小二乘法在响应面方法实践中继续占据主导地位,大概是因为它与贝叶斯建模方法相比相对简单。然而,软件的进步使我们怀疑贝叶斯方法(例如。漂流等。(1997))可能会越来越受欢迎。因此,我们建议扩展EIMSE标准,以解决未来工作的贝叶斯建模程序。

致谢

作者感谢Mikhail Bernshteyn、Angela Dean、Dennis Harwig、Gary Herrin、Max Morris和William Notz的有益讨论。我们感谢Mikhail Bernshteyn、Chetan Chivate和Sachin Padwal对软件开发的帮助。此外,我们感谢审稿人的建议。最后,我们感谢Aswin Choudhury和Allen Miller提供的多种形式的支持,包括数据和想法。

工具书类

艾伦
,
T。
,
伯恩斯坦
,
M。
卡比里
,
英国。
(
2003
)
计算机实验元模型构建方法的比较
.
J.资格。Technol公司。
,待发布。

艾伦
,
T。
,
L。
(
2000
)
模拟优化的低成本响应面方法
.
资格。Reliab公司。工程国际。
,
18
,
5
17
.

艾伦
,
T。
,
,
L。
伯恩施特恩
,
M。
(
2000
)
低成本响应面法在塑料卡扣配合设计中的应用
.
资格。工程
,
12
,
583
591
.

安德烈·伦登
,
J。
,
蒙哥马利
,
直流电。
罗利耶
,
D.A.博士。
(
1997
)
基于贝叶斯D最优的混合实验设计
.
J.资格。Technol公司。
,
29
,
451
463
.

阿特伍德
,
C.L.公司。
(
1971
)
多项式回归估计的稳健方法
.
《美国统计杂志》。助理。
,
66
,
855
860
.

盒子
,
通用电气设备。
贝恩肯
,
D.W.公司。
(
1960
)
定量变量研究的一些新的三级设计
.
技术指标
,
2
,
455
475
.

盒子
,
通用电气设备。
带式输送机
,
N.R.(不适用)。
(
1959
)
选择响应面设计的依据
.
《美国统计杂志》。助理。
,
54
,
622
654
.

盒子
,
通用电气设备。
带式输送机
,
N.R.(不适用)。
(
1963
)
二阶可旋转设计的选择
.
生物特征
,
50
,
335
352
.

盒子
,
通用电气设备。
带式输送机
,
N.R.(不适用)。
(
1987
)
经验模型构建和响应面
.
纽约
:
威利
.

乔杜里
,
答:K。
(
1997
)
压铸机对模具变形影响的研究
.
硕士论文
.
俄亥俄州立大学工业、焊接和系统工程系
,
哥伦布
.

带式输送机
,
N.R.(不适用)。
劳伦斯
,
西弗吉尼亚州。
(
1965
)
最小化模型不足的设计:感兴趣的立方区域
.
生物特征
,
52
,
111
118
.

杜穆切尔
,
西。
琼斯
,
B。
(
1994
)
D最优设计的一种简单贝叶斯修改,以减少对假设模型的依赖
.
技术指标
,
36
,
37
47
.

哈吉·阿卢安
,
答:B。
豆子
,
J.C.公司。
(
1997
)
多选整数规划的遗传算法
.
运营资源。
,
45
,
92
101
.

哈特利
,
总部。
(
1959
)
二次响应面的小型中心组合设计
.
生物计量学
,
15
,
611
624
.

库里
,
A.一。
康奈尔大学
,
J.A.公司。
(
1995
)
响应面:设计和分析
,第2版。
纽约
:
德克尔
.

科克
,
M。
,
艾伦
,
T。
,
吉拉瑟拉纳特
,
秒。
阿尔坦
,
T。
(
2000
)
利用有限元和实验设计研究简单几何形状的管材液压成形
.
国际J·马赫。工具人工。
,
40
,
2249
2266
.

卢卡斯
,
J·M·。
(
1974
)
最佳复合材料设计
.
技术指标
,
16
,
561
567
.

麦凯
,
医学博士。
,
科诺弗
,
W·J。
贝克曼
,
R·J。
(
1979
)
计算机代码输出分析中三种输入变量取值方法的比较
.
技术指标
,
21
,
239
245
.

迈尔斯
,
右侧。
,
库里
,
A.一。
卡特
,
小W.H。
(
1989
)
响应面方法:1966-1988
.
技术指标
,
31
,
131
157
.

迈尔斯
,
右侧。
蒙哥马利
,
D.A.博士。
(
1995
)
响应面方法
.
纽约
:
威利
.

漂流
,
答:E。
,
马迪根
,
D。
休庭
,
J.A.公司。
(
1997
)
线性回归模型的贝叶斯模型平均
.
《美国统计杂志》。助理。
,
92
,
179
191
.

罗克摩尔
,
K.G.公司。
(
1976
)
二次响应面的混合设计
.
技术指标
,
18
,
419
423
.

麻袋
,
J。
,
韦尔奇
,
西。
,
米切尔
,
T。
韦恩
,
小时。
(
1989
)
计算机实验的设计与分析
.
统计师。科学。
,
4
,
409
435
.

麻袋
,
J。
伊尔维萨克
,
D。
(
1984
)
回归中的一些模型稳健设计
.
安。统计师。
,
12
,
1324
1348
.

斯坦伯格
,
D.M.博士。
亨特
,
W.G.公司。
(
1984
)
实验设计:评审和评论
.
技术指标
,
26
,
71
97
.

斯蒂格勒
,
S.M.公司。
(
1971
)
多项式回归的优化实验设计
.
《美国统计杂志》。助理。
,
66
,
311
318
.

汤普森
,
世界银行。
(
1973
)
选择两个变量最小偏差设计的次要标准
.
技术指标
,
15
,
319
328
.

韦尔奇
,
W·J。
(
1983
)
实验设计的均方误差准则
.
生物特征
,
70
,
205
213
.

韦尔奇
,
W·J。
,
巴克
,
R·J。
,
麻袋
,
J。
,
韦恩
,
高压。
,
米切尔
,
T·J。
莫里斯
,
医学博士。
(
1992
)
筛选、预测和计算机实验
.
技术指标
,
34
,
15
25
.

韦尔奇
,
W·J。
,
,
T.-K.公司。
,
,
S.M.公司。
麻袋
,
J。
(
1990
)
参数设计质量控制的计算机实验
.
J.资格。Technol公司。
,
22
,
15
22
.

威廉姆斯
,
埃及共和国。
约翰
,
J.A.公司。
(
1996
)
农业田间试验中使用的行-列析因设计
.
申请。统计师。
,
45
,
39
46
.

,
L。
(
2000
)
预期建模误差和低成本响应面方法
.
博士论文
.
俄亥俄州立大学
,
哥伦布
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)